L'agent de supervision de serveur Windows ou Linux


L'agent de collecte ServicePilot pour la supervision des serveurs Microsoft Windows ou Linux

 AccueilBlogL agent de collecte ServicePilot pour la supervision des serveurs Microsoft Windows ou Linux

L'agent serveur vs Polling SNMP, sujet à discussion

La disponibilité et la performance des serveurs de votre entreprise est très importante car ils impactent directement la productivité. Il n’est pas imaginable qu’un service de l’entreprise ne puisse plus avoir accès aux applications une partie de la journée ou se plaigne régulièrement d’un mauvais fonctionnement des applications. C'est une des raisons pour lesquelles une supervision temps réel de vos serveurs est indispensable pour détecter des incidents le plus rapidement possible.

Vos serveurs sont peut être gérés ou hébergés chez un Service Provider, dans le cloud. C'est lui qui a alors la charge de les superviser pour respecter les SLA sur lesquels il s'est engagé.

Dans tous les cas, que les serveurs soient supervisés en interne ou externalisés, la même question se pose : est-il préférable d’utiliser une solution de supervision qui requiert un l’installation d’agent ou une solution sans agent ? La littérature est abondante à ce sujet et les avis sont partagés.

L’objectif de ce document est de montrer que l’utilisation d’un agent n’est pas synonyme de contrainte et de complexité. Que vous soyez une petite entreprise, une multinationale ou un Service Provider, certains agents peuvent vous apporter une facilité d'exploitation, des gains de productivité et de la flexibilité.

Alors, une supervision de serveurs avec ou sans agent ?

Comme nous l’avons évoqué dans l’introduction, la littérature est riche sur ce sujet. Ce qui en ressort principalement est que tout dépend de la supervision souhaitée. Si votre production informatique est complexe composée de nombreux serveurs, et qu’il est nécessaire de collecter des indicateurs non standards à des fréquences élevées, l’utilisation d’une solution de supervision avec agent est fortement conseillée. Si vous n’avez que quelques serveurs à superviser avec des indicateurs standards, une solution de supervision sans agent est suffisante.

Collecte SNMP v1, v2 ou v3

Pour les exploitants, la tâche paraît plus simple car rien à installer sur les serveurs mais il y a quand même des contraintes comme :

  • Moins d’indicateurs, granularité moins fine
  • Configuration SNMP (déclarer le service SNMP sur chaque serveur, Création de VPN, tunnel crypté ou implémentation SNMP v3, ouverture des flux)
  • Plus d’échanges réseaux (interrogation réponse)
  • Faiblesses du protocole SNMP v1 et v2 d'un point de vue sécurité
  • Microsoft déconseille le SNMP pour la supervision de serveurs Windows (NT, W2k, Volume Mount Points, uptime metrics reboot time, "Unfortunately Microsoft deprecated SNMP in server 2012 (and does not support 64 bits counters). So we are unlikely to see any major changes to it in the future" https://technet.microsoft.com/en-us/library/hh831568.aspx ... )

Avec Agent .NET pour Windows ou en C++ pour Linux

Que ce soit avec un agent .NET pour Windows ou en C++ pour Linux, le pendant de collecte SNMP sous forme d’agent permet de résoudre de nombreux problèmatiques de monitoring :

  • Positionné sur les serveurs Windows et Linux , uniformité de collecte
  • Découverte automatique et collecte des indicateurs de performance en local
  • Déclenchement de scripts automatiques
  • Historisation des Top Process par mémoire ou par I/O automatisée
  • Envoie des données au manager dans un tunnel crypté
  • Le manager peut initialiser toutes les fonctions de l’agent en local
  • Fonctionnalités de Log Management et gestion des évènements Syslog ou Windows Events
  • Fonctionnalités APM et suivi des performances applicatives (traces .NET, JAVA ou IIS)
  • Remote poller multi-collection, Ping, WMI, SHell, SNMP...

ServicePilot permet de superviser les différents types de serveurs en WMI / Shell et/ou SNMP (Windows, Linux, Sun, Solaris,...), les environnements virtualisés (VMware, HyperV) et les applications qu’ils hébergent (Exchange, Active Directory, DNS, Skype for Business,…). ServicePilot intègre un agent multifonctions pour les serveurs Windows et Linux.

ServicePilot intègre un agent multifonctions full-stack pour les serveurs Windows et Linux


Supervision des serveurs Windows et Linux avec l’agent ServicePilot

ServicePilot propose un agent pour la supervision des serveurs Windows et Linux particulièrement performant et permettant de s’intégrer nativement avec le manager. Cet agent s’installe rapidement avec n’importe quelle solution de télédistribution et consomme très peu de ressources. La reconnaissance de l'agent par le manager est dynamique et l'envoie des données vers le manager se fait à l'initiative de l'agent. Les nouveaux serveurs sur lequel l’agent a été préalablement installé vont automatiquement être intégrés à la supervision sans manipulation de la part des exploitants.

La connexion entre l’agent et le manager ne nécessite pas de VPN. L'agent va directement se connecter au manager, il va créer sa connexion et un tunnel crypté pour l'échange des données. Cette architecture est beaucoup plus simple en ce qui concerne l'ouverture des flux et bien accepté par la sécurité. En ce qui concerne les mises à jour de l'agent, c'est très simple, elles sont automatiques et il n’est pas utile de revenir sur chaque serveur pour installer une nouvelle version.

L’agent découvre automatiquement les ressources du serveur et alimente des tableaux de bord synthétiques et détaillés avec de nombreux indicateurs (découverte de la Supervision Système, Découverte automatique des processus, Top processus par consommation CPU, mémoire, interfaces...).

découverte automatiqueme des ressources du serveur avec de nombreux indicateurs

Le screenshot ci-dessous illustre la granularité et la flexibilité des tableaux de bords de supervision des serveurs, dans lesquels je peux zoomer à l’aide du calendrier pour comprendre les impacts des processus sur le pic CPU de mon serveur il y a 26 jours sur une échelle de temps de 7 minutes.

comprendre les impacts des processus sur le pic CPU de mon serveur

L’agent proposé par ServicePilot ne se contente pas de superviser le serveur mais il possède également plusieurs fonctionnalités étendues telles que l'analyse des logs et le temps de réponse des applications qui pourront être activées via le manager en fonctions de vos besoins de supervision.

Zoom sur la fonctionnalité de mise à jour automatique en masse

La fonctionnalité de mise à jour de masse, introduite avec ServicePilot 8.2.0 [ndlr aujourd'hui la 9.1 est en béta test], garantit une simplification substantielle pour le provisionning des agents, en combinant leur configuration avec celle de l'ensemble associé.

Plus précisément, cela signifie que le fichier de configuration de l'agent est créé lorsque le package est ajouté à la mise en place, et sont stockées sur le serveur de ServicePilot.

L'agent peut alors récupérer sa configuration à intervalles réguliers (par exemple toutes les 30 secondes) via une synchronisation par HTTP ou HTTPS.

Toute modification de la configuration de l'agent, que le déploiement soit local ou à distance, peuvent être faites à partir du serveur de ServicePilot, avec seulement quelques clics sur le package associé.

Zoom sur la fonctionnalité de mise à jour automatique en masse

Découvrir les métriques APM ou les évènements de sécurité en quelques clics

Transactions, Temps de réponse, Erreurs, RUM automatique pour les applications fonctionnant avec des technologies JAVA, .NET, IIS, ou en supervision les transactions http du serveur applicatif.

Découvrir les métriques APM de vos systèmes en quelques clics

Parsing de logs non formatées, Syslogs, Windows Events pour maîtriser les événements de votre SI afin de conserver des rapports des connexions aux serveurs, des authentifications sur les applications, etc. Les fonctionnalités de type machine learning ainsi que l'architecture Big Data de ServicePilot permettent de faire rapidement des analyses de type anomalies de surface ou top ranking de manière très simple avec des requêtes pré-construites, en fonction des différentes technologies.

Découvrir les évènements de sécurité de vos systèmes en quelques clics

Les fonctionnalités de l’agent ServicePilot vont au-delà de la partie Système, avec :

  • Collecte Ping distante ou locale
  • Collecte SNMP distante ou locale
  • Tests applicatifs Web, TCP, SQL, DNS/DHCP, …
  • Collecte SMI
  • Collecte des Logs, des Syslogs, Traps et Events Windows
  • API VMWare vSphere
  • VoIP: flux RTCP, RTCP-XR et des CDR
  • Collecte Netflow, sFlow
  • IPRoute
  • Traces applicatives HTTP
  • API de collecte de scripts NRPE, PERL, shell,…

Conclusions sur l'agent de monitoring dans le système d'information

J'ai des mécanismes automatisés pour la surveillance des serveurs Microsft Windows ou Linux que le SNMP ne me donne pas, je peux toujours ajouter la surveillance SNMP pour des processus spécifiques pour le représenter automatiquement dans mes cartographies et appliquer des SLA au niveau de processus systèmes.

Avec un seul agent, je peux non seulement superviser mon serveur, mais aussi corréler les informations de sécurité et applicatives sans aucune règle de corrélation compliquée avec un tableaux de bord dédié.

Corrélation des informations de supervision avec un tableaux de bord personnalisé

Un tableau de bord APM Full-Stack comme celui juste au-dessus permet notamment d'éviter les transferts de responsabilités incessants lors des incidents de performance et faciliter la communication au sein des collaborateurs de la DSI.

Une solution de supervision doit être simple à mettre en œuvre et le provisionning doit être fiable, rapide avec un maximum d’automatisation pour éviter les tâches répétitives. L’agent de supervision de serveurs ServicePilot permet de rapidement répondre à vos objectifs :

  • Réduction des incidents
  • Réduction du temps de résolution des incidents
  • Diminution des risques
  • Réduction des coûts
  • Amélioration de la qualité de service
  • Satisfaction des utilisateurs
  • Analyse de capacité
  • Reporting des SLA pour la direction