Pendant mes deux dernières années d'études, j'ai travaillé comme alternant dans un centre logistique d'Amazon. Je faisais partie de l'équipe informatique. Les tâches quotidiennes étaient nombreuses et j'avais un mémoire à rédiger pour valider mon diplôme. Ce mémoire portait sur un projet qui m'avait été confié par Amazon.
Comme je travaillais dans un centre logistique, il y avait beaucoup de collaborateurs qui travaillaient de la réception des colis des fournisseurs, au tri, à l'expédition et à l'envoi des commandes des clients. Il y avait le cycle complet. Tout cela nécessite beaucoup de matériel informatique, qui était utilisé presque 24h/24 et 7j/7 par les collaborateurs.
Les opérations ne devaient en aucun cas s'arrêter, et nous étions donc là pour les aider en cas de défaillance ou de besoin de changement, quel qu'il soit. Il y avait une interface web de tickets où les managers pouvaient créer des demandes lorsque quelque chose était nécessaire de notre part. Notre équipe marchait beaucoup car nous aidions souvent les utilisateurs, et le centre était très grand (plus de 40 000 mètres carrés de surface).
De nombreux utilisateurs et managers signifient beaucoup d'équipements informatiques. Ordinateurs, gun scanners, lecteurs de codes-barres, moniteurs et autres, tout était identifié par des étiquettes. Nous avions une interface pour gérer l'inventaire de tous nos équipements. C'était crucial pour nous, car nous savions où se trouvait chaque équipement informatique. Nous pouvions l'attribuer à une personne ou à une zone, fixer une date de retour et d'autres paramètres.
Nous devions également nous assurer que tout fonctionne du côté logiciel. Plusieurs audits nous permettaient de vérifier si notre stock d'ordinateurs était à jour, et les collaborateurs mettaient les gun scanners défectueux dans une boîte que nous vérifions chaque matin. En conséquence, nous devions parfois réinstaller Windows sur les ordinateurs, et Android sur les scanners. Nous avions des interfaces de provisionnement pour faire cela par lots de machines.
Les clients légers faisaient également partie de l'équipement informatique. Il s'agissait de petits PC fonctionnant sous Tiny Core Linux, et il y avait un serveur PXE fournissant cet OS aux machines. Comme c'est un OS très léger (10MB), il pouvait fonctionner directement depuis le réseau, pas besoin de l'installer et les collaborateurs pouvaient l'utiliser tout de suite. Il suffisait de les installer sur les stations de travail et d'activer le démarrage en réseau.
La maintenance des imprimantes était également cruciale, en particulier les imprimantes d'étiquettes. Elles étaient utilisées des heures et des heures par jour et nous avions l'habitude d'en assurer la maintenance. Il en va de même pour les scanners de codes-barres.
Un grand nombre d'appareils signifie un grand nombre de données. Nous devions gérer des centaines de points d'accès Wi-Fi. Tous étaient de Cisco et la configuration se faisait via un contrôleur dédié, qui est une machine physique qui exécute un système d'exploitation conçu pour gérer et configurer ces points d'accès.
Nous avions plusieurs armoires de commutateurs Cisco, et c'est l'équipe qui les approvisionnait et les configurait. Tout passait par la salle principale des serveurs. C'était une salle avec deux connexions en fibre optique provenant de deux FAI différents, plusieurs serveurs comme les serveurs d'impression, les serveurs de fichiers, la surveillance, le serveur de talkie-walkie, le serveur de caméras et autres.
Il y avait également plusieurs commutateurs de distribution ainsi que des commutateurs de niveau 3. Des routeurs étaient également présents derrière les liens des fournisseurs d'accès. Tout était redondant pour la tolérance aux pannes. Il n'y avait pas de point de défaillance unique, ce qui est très important lors de l'exécution d'opérations critiques.
La plupart des serveurs fonctionnaient sous Windows Server et d'autres sous Redhat Linux. Nous faisions les tâches de maintenance et les mises à jour nécessaires sur ces machines. Nous devions aussi parfois modifier la configuration des commutateurs comme les VLAN et autres lors du déplacement d'équipements ou de serveurs.
Chaque serveur et équipement de réseau était soutenu par un UPS, c'est-à-dire un dispositif contenant une batterie qui maintient l'alimentation des équipements en cas de panne de courant. Les UPS n'étaient jamais à plein load, ni même à moitié pour que les équipements puissent fonctionner plus longtemps en cas de panne de courant. J'ai géré ces UPS via le réseau avec l'aide de l'ingénieur de l'équipe.
J'ai mentionné que nous avions l'habitude de modifier la configuration des équipements et des machines. Certaines de ces tâches pouvaient être effectuées immédiatement, mais chaque tâche qui modifiait la configuration du système ou du réseau nous obligeait à rédiger ce que l'on appelait un change management.
Le change management est un document que nous devions rédiger avant de faire quelque chose qui pouvait causer des problèmes si ce n'était pas fait correctement. Nous devions écrire chaque action que nous ferions, chaque clic et chaque commande tapée devaient être décrits. Nous devions également écrire une procédure de retour en arrière au cas où quelque chose se passerait mal.
Une fois cette tâche terminée, nous soumettions notre document à des ingénieurs et des responsables qui l'examinaient et nous disaient si nous pouvions ou non effectuer l'action en question. La rédaction de ces papiers était parfois fastidieuse, mais elle m'a aidé à mieux savoir comment penser à toutes les conséquences qu'une action sur le réseau peut avoir, et comment empêcher les comportements indésirables d'une commande ou d'une action.
Les collaborateurs, dans chaque équipe, disposaient d'un tableau blanc sur lequel ils pouvaient écrire ce qu'ils voulaient. Généralement, ils écrivaient sur les problèmes qu'ils rencontrent, ou partageaient leurs réflexions sur la façon d'améliorer certaines choses ou processus.
Chaque matin, les managers et parfois moi-même nous rendions à ces tableaux pour discuter avec les collaborateurs de ce qu'ils avaient écrit. Mon manager et moi ne prenions que les demandes ou les commentaires liés à l'informatique. Cela nous a permis de mieux comprendre comment les collaborateurs voient les choses et travaillent, et comment nous pouvions les aider.
Pour l'école et afin de valider mes deux ans, j'ai dû rédiger un mémoire sur un projet qui m'a été donné par mon tuteur Amazon. Malheureusement, le temps que j'y étais, il n'y avait pas de gros projets que je pouvais mener. Pour le mémoire, notre école voulait que nous gérions un projet du début à la fin. Comme ce n'était pas possible dans mon cas, mon tuteur m'a donné un cas d'école. Il savait que j'aimais le monitoring, mais que mon expérience en la matière se limitait à de petits appareils et équipements.
Le projet consistait à apprendre à gérer des serveurs d'entreprise, et comment je pouvais en utiliser un pour surveiller d'autres équipements très spécifiques, comme les UPS par exemple, des choses qui diffèrent des commutateurs et routeurs ordinaires. J'ai dû gérer un budget et acheter le matériel nécessaire, faire une étude d'avant projet avec une analyse fonctionnelle, une planification, et tout ce qui est nécessaire pour gérer un projet de la meilleure façon possible.
Une fois que tous les travaux de gestion du projet ont été effectués et mis par écrit, j'étais prêt à passer aux aspects techniques du projet. J'ai choisi comment gérer l'alimentation, les doubles interfaces réseau, les disques durs et le type de RAID. Ce projet m'a permis d'apprendre beaucoup de choses sur ces trois aspects, et au final, il m'a même aidé dans mes projets personnels. Une fois le système d'exploitation installé sur un serveur bien préparé, j'ai dû choisir, installer et configurer une solution de surveillance. Une fois de plus, j'ai opté pour Nagios car je voulais en apprendre encore plus sur le sujet.
Une fois que le serveur fonctionnait correctement, j'ai effectué des tests que j'ai également notés, et au final, j'ai obtenu un mémoire bien écrit, pour lequel j'ai obtenu la note A. La présentation orale s'est également bien passée, j'ai obtenu un B, ce qui avec toutes mes autres notes a validé mon diplôme.