Comment surveiller les performances du serveur
Les administrateurs système expérimentés vous le diront les problèmes de performances du serveur sont étroitement liés à l'administration des applications . Même si cela est vrai, certains problèmes fondamentaux liés spécifiquement aux performances du serveur s'appliquent à tous les niveaux, quelles que soient les applications que vous exécutez.
Dans ce rapport, vous apprendrez comment simplifier vos tâches de surveillance de serveur et comment décomposer les tâches importantes pour les rendre gérables. Nous allons examiner les catégories de surveillance suivantes :
- Disponibilité du serveur
- Utilisation du serveur
- Propriétés physiques
Une fois que vous avez établi une routine, les tâches de surveillance deviennent très simples. Il vous suffit de savoir par où commencer.
Disponibilité du serveur
Peu importe si votre serveur dispose de beaucoup de capacité disponible ou si vous repoussez ses limites, la seule chose qui intéresse la communauté des utilisateurs est qu'il soit disponible. Le pire problème de performances que le serveur rencontrera est que vous le mettiez hors ligne.
Pour maintenir le serveur à ses performances optimales , vous devrez le mettre hors ligne de temps en temps. Vous devrez effectuer des tâches de nettoyage du système, telles que la défragmentation du disque, la suppression des fichiers temporaires et la réaffectation des ressources, telles que l'espace de stockage ou les configurations de VM.
Définissez votre stratégie de surveillance afin d'obtenir avertissement avancé des limites de capacité étant atteintes. Ceux-ci vous donneront la possibilité d'effectuer des actions correctives, telles que créer plus d'espace disque à l'avance plutôt qu'à la dernière minute lorsque les utilisateurs ont besoin d'accéder au serveur.
Le système d'exploitation devra être corrigé de temps en temps et de nombreux progiciels devront être mis à jour. Planifiez donc toutes les tâches de maintenance en dehors des heures d'ouverture. Cela ne signifie pas que vous devez rester assis toute la nuit, car la plupart des tâches de maintenance standard peuvent être programmées pour s'exécuter aux petites heures du matin. Assurez-vous de vérifier qu'aucune tâche par lots commerciale essentielle n'est prévue pour les heures auxquelles vous espérez faire rebondir le serveur.
Une mesure qu'un utilitaire de surveillance peut vous fournir sur la disponibilité du serveur est appelée Temps de disponibilité . Cela vous montrera depuis combien de temps le serveur est disponible et devrait correspondre à vos propres calculs du temps écoulé depuis que vous l'avez redémarré. Si ce n’est pas le cas, le serveur est tombé en panne à un moment donné. Le problème avec cette métrique est que vous ne savez que le serveur est tombé en panne lorsqu'il est trop tard. En vérité, vous auriez probablement été au courant d'une panne inattendue si elle s'était produite pendant les heures de bureau, car votre téléphone aurait commencé à sonner sans décrocher. Toutefois, les enquêtes visant à déterminer pourquoi le serveur est tombé en panne de façon inattendue vous permettre de prendre des mesures préventives pour éviter que cela ne se reproduise.
Utilisation du serveur
Vos principales tâches quotidiennes en matière de surveillance des performances du serveur consistent à surveiller une liste restreinte de problèmes de performances. Ceux-ci sont:
- Capacité de traitement et utilisation
- Capacité et utilisation de la mémoire
- Capacité du disque et espace occupé
- Défauts de page
- Échange de pages
- Activité d’interface réseau (E/S)
Au départ, vous ne pouvez pas faire grand-chose face à ces problèmes, à part vous asseoir et regarder. Si vous n'êtes pas responsable de l'achat du serveur et que vous n'êtes pas impliqué dans la définition de ses exigences, alors la meilleure façon de déterminer si l'équipement est adapté à son usage est d'enregistrer ses activités et de noter si ses limites sont réellement atteintes. .
À cet égard, vos activités de surveillance alimenteront toujours les problématiques de gestion des systèmes. Si vous détectez des problèmes de performances, vous devrez faire quelque chose pour y remédier.
Performances du processeur, de la mémoire et du disque
Le processeur a une capacité limitée et si cela ne suffit pas pour tous les services et logiciels dont il a besoin pour fonctionner simultanément, les performances en prendront un coup. Il en va de même pour la RAM et l'espace disque.
Il est préférable d'éviter la pleine capacité en définition des niveaux d'avertissement de seuil où le processeur, la mémoire et/ou l’espace disque sont sur le point d’être épuisés. Cela vous laisse le temps de prendre des mesures pour éviter toute dégradation des performances. La discussion de ces actions sort du cadre de ce guide, mais brièvement, vous devrez arrêter un processus qui semble bloqué – en attente de ressources ou en bloquant l'exécution d'autres processus. Vous pouvez également envisager de déplacer certains services vers d’autres serveurs si vous en disposez.
Défauts de page
Les défauts de page sont particulièrement importants si vous utilisez des serveurs basés sur le cloud, tels qu'AWS, Google Cloud Platform ou Azure. Ces serveurs virtuels utilisent un « page ', qui est un bloc de mémoire. Fondamentalement, la page est la partie de la mémoire physique qui a été allouée au compte de votre entreprise, ou « serveur virtuel .»
Un défaut de page se produit lorsque adressage mémoire des problèmes surviennent. Cela ne devrait jamais arriver, mais c’est le cas. Généralement, comme il s’agit d’un problème de service, ce n’est pas de votre faute et ce n’est pas à vous de le résoudre. Cependant, vous devez connaître les défauts de page, car ils ralentir les temps de réponse . Le serveur aura ses propres routines pour récupérer des défauts de page et les techniciens du service cloud seront présents.
Même si la pagination de la mémoire est un système automatisé qui ne devrait jamais se tromper, des défauts de page se produiront de temps en temps . Si le nombre de défauts de page commence à augmenter, il existe un problème sérieux qui pourrait surcharger le gestionnaire de défauts du serveur. Si cela se produit, les performances de votre serveur virtuel seront sensiblement altérées et les utilisateurs commenceront à se plaindre.
Échange de pages
Les serveurs acquièrent de l'espace disque si la mémoire s'épuise. Ce processus est appelé « échange de pages .» Le gestionnaire de mémoire stockera temporairement certaines données sur le disque, les rappelant en cas de besoin.
Si vous remarquez que l'espace disque a été réduit et que la mémoire est entièrement occupée, ce phénomène pourrait être dû à l'échange de pages . Vérifiez cette métrique pour voir si c’est ce qui se passe.
L'échange de pages en soi n'est pas mauvais. Cependant, le serveur met plus de temps à traiter les données stockées dans des fichiers temporaires sur le disque qu'à extraire les données directement de la mémoire. Cela signifie que l'apparition d'un échange de pages ralentira les temps de réponse du serveur .
C'est une bonne idée d'activer l'échange de pages en tant que mesure d'urgence. Cependant, si l'échange commence à être un événement fréquent, vous devez augmenter la RAM disponible sur votre matériel.
Interfaces réseau
Une grande partie des problèmes liés à Surveillance des E/S abordons le sujet de la surveillance du réseau, qui est une question distincte. Cependant, l'examen de l'activité sur votre carte réseau peut constituer un problème de serveur si l'interface réseau est surchargée, ce qui signifie que toutes les requêtes ne parviennent pas. Une surcharge peut également être le signe d'une attaque malveillante ou cela peut signifier que la carte est altérée d'une manière ou d'une autre ou qu'elle n'est pas adaptée à son usage et que vous devrez peut-être la remplacer. Si l'activité de l'interface réseau tombe à zéro, votre carte est probablement cassée.
Propriétés physiques
Quelques autres facteurs que vous devez surveiller sur votre serveur incluent les attributs physiques :
- Température
- Vitesse du ventilateur
- Source de courant
- Accès physique
En tant qu'administrateur système, vous êtes responsable du serveur, ce qui inclut la surveillance de son état physique.
Accès physique
La question de l’accès physique peut ne pas sembler être un problème de surveillance des performances. Cependant, si un intrus malveillant pénètre dans votre salle de serveurs, alors la disponibilité du serveur pourrait être menacée . Comme expliqué ci-dessus, la mise hors ligne d'un serveur est le plus gros problème de performances que vous devez éviter. Alors, surveillez et contrôlez l’accès à la salle des serveurs.
Température et vitesse du ventilateur
La température et la vitesse du ventilateur sont questions interdépendantes . Il est probable que vous ne pourrez pas tourner une molette et accélérer le ventilateur lorsque vous constaterez que la température du serveur augmente. Cependant, surveiller la température de votre serveur vous donnera le temps de vérifiez tout problème physique avec le ventilateur . Vous devrez peut-être vérifier la température de la salle des serveurs. Si le ventilateur aspire de l’air chaud, cela ne contribuera pas à refroidir le serveur.
Certaines applications, comme bases de données et serveurs web créer beaucoup de charge sur un processeur et générer ainsi plus de chaleur. Pensez à distribuer ces applications sur différents serveurs pour baisser la charge et la température. Examinez également l'utilisation d'un rack ; l’utilisation de chaque fente pourrait bloquer la circulation de l’air frais.
Source de courant
La surveillance de l’alimentation électrique est une évidence – vous ne voulez pas que la tension augmente ou baisse . Votre UPS devrait résoudre ce problème, mais vous devez surveiller le courant et la tension qui en sortent et qui entrent dans votre serveur pour vous assurer que l'UPS fonctionne correctement.
Outils de surveillance
Vous pouvez vérifier toutes les mesures importantes décrites ci-dessus avec les utilitaires de ligne de commande et les interfaces GUI du système d'exploitation. Cependant, l’exécution répétée de commandes et la vérification des utilitaires de surveillance des processus prennent beaucoup de temps.
C'est mieux vaut acheter un logiciel qui surveillera le serveur pour toi. En règle générale, un logiciel de surveillance des serveurs surveille en permanence ces indicateurs vitaux et alerte l'administrateur système si l'un des seuils prédéfinis est dépassé. Cela vous permet de vous consacrer à d'autres tâches. Vous pouvez supposer que tout va bien, sauf indication contraire.
Il existe aujourd’hui de nombreux et très bons outils de surveillance disponibles sur le marché. Il est très courant que les systèmes de surveillance des serveurs soient combinés avec d’autres fonctions. La combinaison de surveillance numéro un que vous rencontrerez est la moniteur de serveur et d'applications . En effet, les performances du serveur sont très étroitement liées aux performances et aux exigences des applications.
Serveur SolarWinds et moniteur d'applications (ESSAI GRATUIT)
Probablement le meilleur moniteur de serveur que vous devriez regarder, c'est leMoniteur de serveur et d'applications SolarWinds. Cet outil ne fonctionnera que sur Serveur Windows . Cependant, il peut également surveiller Linux serveurs et basés sur le Cloud AWS et Azur les serveurs.
Si vous avez plusieurs serveurs sur votre site, ce moniteur les traquera tous sur le réseau et les inscrira dans son programme de surveillance. Tous ces serveurs peuvent être vérifiés via un seul tableau de bord. Le moniteur garde une trace de l'activité sur le processeur, le disque, en mémoire et sur les interfaces réseau . Il surveillera également des facteurs tels que l’échange de pages et les défauts de page.
Le moniteur dispose d'un enregistreur de disponibilité et d'un graphique en direct constant de la charge du serveur. Il mesure les temps de réponse et prévoit également où iront les niveaux d’utilisation. Le moniteur de serveur inclut des seuils d'alerte. Ces alertes apparaissent dans le tableau de bord, mais vous pouvez également vous les faire envoyer par e-mail ou SMS , vous n’avez donc pas besoin de vous asseoir et de regarder constamment le tableau de bord.
Le moniteur de serveurs et d'applications supervise supports et UPS systèmes ainsi que le serveur lui-même. Il surveillera la température du serveur et les performances des ventilateurs.
Comme son nom l'explique, SolarWinds Server & Application Monitor assure également le suivi des performances des applications. L'outil comprend un utilitaire appelé PerfStack , qui montre chaque couche de pile prenant en charge chaque application, indiquant d'où vient la dégradation des performances.
Avantages:
- Adopte une approche holistique de la surveillance des performances et de l’état des serveurs
- Prend en charge la découverte automatique qui crée des cartes de topologie de réseau et des listes d'inventaire en temps réel en fonction des appareils qui entrent dans le réseau.
- Prend en charge à la fois la surveillance SNMP et l'analyse des paquets, vous donnant plus de contrôle sur la surveillance que des outils similaires
- Utilise des widgets glisser-déposer pour personnaliser l'apparence du tableau de bord
- Système de reporting robuste avec modèles de conformité préconfigurés
Les inconvénients:
- Conçu pour les professionnels de l'informatique, mais pas la meilleure option pour les utilisateurs non techniques
Le moniteur de serveur et d'applications est très complet et vous pouvez le consulter et voir ce qu'un moniteur de serveur peut faire pour vous en essayant un30 jours d'essai gratuitde l'outil.
SolarWinds Server et Application Monitor Téléchargez un essai GRATUIT de 30 jours
La surveillance de la sécurité peut également être combinée avec des fonctions de gestion de serveur.
Implémentation de la surveillance des serveurs
Le moyen le plus simple de surveiller vos serveurs avec succès est de vous procurer un outil automatisé qui fera le travail à votre place. Cette stratégie s’avère moins coûteuse que l’embauche de personnel supplémentaire pour effectuer la tâche manuellement.
L'automatisation de la surveillance des serveurs, basée sur des seuils de revenus, peut être ajustée en fonction de vos propres pratiques de travail et des délais de mise en œuvre des solutions. Ces outils peuvent également être utilisés pour prédire les besoins futurs. Cela vous permettra d'acheter du matériel d'extension et de vous assurer que les performances du serveur restent suffisantes pour satisfaire la communauté des utilisateurs.