Supervision

"Nous avons mis en place un outil de supervision sur base Nagios qui est l'oeil de l'équipe d'exploitation. Il permet en quelques instants, de connaître l'état de nos services critiques. Les remontées dédupliquées permettent une lecture facilitée des alertes."  Pour analyser la performance applicative, la connaissance du réseau est indispensable.
 
Superviser, certes, mais quoi ?  dans une infrastructure complexe, il est illusoire de tout vouloir superviser. Les DSI de très grands groupe pourront se doter d'une CMDB couplée à un outil de superision mais cela reste rare. D'ailleurs, quoi superviser? Tous les serveurs ? Toutes les applications ? Tous les services ? Tout le réseau ? Le primaire et le back up ?  la bascule de l'un à l'autre ? Faute de tout superviser, les DSi se résolvent souvent à superviser une couche, ou une plate-forme, ou un site, plutôt en fonction des outils de supervision disponibles qu'en fonction d'une analyse du besoin. Est-ce suffisant ?
 
Méthodologie :  L'approche proposée par les consultants AKAL-Consulting consiste à identifier les chaines de liaison critiques et à en superviser l'exécution. Ainsi, plutôt que de chercher à superviser tous les serveurs du DC, on supervisera les quelques serveurs critiques, la partie du LAN qui les connecte, les éléments de WAN nécessaires, la distribution des applications aux utilisateurs. La mise sous supervision peut être ainsi échelonnée, sans qu'un effet tunnel ne vienne décourager les plus motivés. 
 
En pratique : la mise en supervision d'une infrastructure commence par une analyse, avec les architectes applicatifs et d'infrastructure, des chaines de liaison qui sont décrites avec une granularité suffisante pour identifier les métriques et leur point d'application.
 
Choix d'un outil de supervision : clairement dans ce domaine, il y a pléthore de solutions. L'équipe AKAL-Consulting mène régulièrement sur ce sujet des états de l'art et des pilotes pour tenir à jour une base de connaissances des différents outils du marché. Quelques jours pour la rafraichir en fonction des besoins identifiés, et une liste des quelques outils pertinents est définie. Selon la taille et la complexité du périmètre à superviser, il peut être utile de recourir à une consultation pour choisir un couple editeur-intégrateur.   
 
Déploiement : si les consultants AKAL-Consulting ont été amenés à plusieurs reprises à déployer différents outils de supervision (notamment sur base Nagios), les intégrateurs des différentes solutions connaissent leurs plates-forme mieux que nous. Inutile de chercher à les remplacer. En AMOA, l'équipe AKAL-Consulting s'assure que les chaines de liaison identifiées comme critiques sont bien mises en supervision, avec les métriques recherchées, dans le délai imparti. 
 
Méta-gestion : l'une des difficultés de l'outil de supervision est sa maintenance. L'équipe AKAL-Consulting propose de gérer les mises à jour : sous un formalisme convenu, les changements sont transmis au SOC AKAL-Consulting qui réalise les modifications dans l'outil de supervision et rend compte. 

Exemple de mission menée : supervision d'un ensemble réseau MPLS, plates-formes critiques du data center principal et PRI, environnements hors production.