Définitions des types d'événements et intégrité des composants

Server Administrator classe les événements affectant certains composants critiques de votre système selon un type d'événement. Les trois types d'événements les plus courants affichés pour la condition d'un composant sont Normal, Avertissement et Critique.

Ce module d'aide définit les termes pour les types d'événements, les états et les gravités. Lisez ce module d'aide si vous voulez plus de détails sur les différents termes utilisés par Server Administrator pour classifier les événements et identifier l'intégrité des composants.

Types d'événements et gravités associées

Si Server Administrator rapporte l'intégrité d'un composant ou classifie un événement, les attributs distinctifs de l'événement sont les suivants : le composant ou la redondance qui sont surveillés et le type, l'état et la gravité de l'événement subi par le composant.

[Retour au début]

Composant ou redondance

Server Administrator classifie les composants et la redondance de certains composants selon le type, la gravité et l'état.

Composant

Tous les composants d'un système ont une importance. Les applications de gestion de systèmes comme Server Administrator distinguent certains composants pour leur donner une attention spéciale. Les systèmes informatiques intègres doivent avoir une alimentation constante de courant électrique à des tensions appropriées pour faire fonctionner leurs composants système correctement. Le courant électrique est fourni par le commutateur de courant alternatif (CA) du système aux blocs d'alimentation du système. Les composants des systèmes doivent également avoir une plage opérationnelle de températures à l'intérieur du châssis. Les applications qui s'exécutent et font des calculs sur des données nécessitent une mémoire vive qui fonctionne bien. De ce fait, le commutateur d'alimentation, les blocs d'alimentation, les ventilateurs et la mémoire système sont parmi les composants les plus importants contrôlés par Server Administrator.

Redondance

Server Administrator surveille l'intégrité des composants redondants et rapporte la condition de redondance du système.

Selon l'importance d'un système à la mission de l'entreprise ou de l'organisation, certains composants de système sont installés dans le système avec une redondance planifiée. En général, un système qui est essentiel à la mission d'une organisation a des composants redondants. Un composant redondant est conçu pour prendre la relève lorsque son composant compagnon tombe en panne. La redondance permet de protéger un système contre les temps d'arrêt causés par des pannes ou des composants endommagés.

Redondance totale

La redondance totale de tout le système signifie que tous les périphériques fonctionnent dans les limites normales. Si un système doit avoir quatre ventilateurs pour avoir une redondance totale et qu'ils fonctionnent tous bien, le système a une redondance totale du composant de ventilation. Si un des deux ventilateurs principaux est en panne, chaque ventilateur en a un en réserve. La redondance totale n'exige aucune action autre que l'entretien préventif normal. 

Dégradation de la redondance

La dégradation de la redondance indique que certains des composants nécessaires pour une redondance totale ne fonctionnent pas. Le système fonctionne, mais trop peu de composants fonctionnent pour permettre à un composant opérationnel de prendre la relève en cas de panne. Par exemple, s'il faut quatre ventilateurs pour une redondance totale, trois ventilateurs opérationnels représentent une dégradation de la redondance. Un seul des deux ventilateurs en a un de réserve s'il tombe en panne.

Perte de la redondance

La perte de la redondance indique que le système n'a qu'un nombre minimum de composants qui fonctionnent pour empêcher une panne du système. Aucun composant redondant ne fonctionne. Si quatre ventilateurs sont requis pour une redondance totale et que seulement deux ventilateurs fonctionnent, aucun des ventilateurs principaux n'en a un en réserve s'ils tombent en panne.

[Retour au début]

Type

Un événement est classifié par type. Des exemples de types d'événements sont Normal, Avertissement et Critique. 

Normal

Les événements de type normal indiquent qu'un composant fonctionne dans une plage de valeurs qui permet au composant de bien fonctionner dans le système. Un autre terme souvent appliqué aux composants dont la condition est normale est OK. Lorsqu'un composant est OK ou qu'un événement est normal, l'opérateur du système n'a aucune action correctrice à prendre.

Avertissement

Des événements d'avertissement se produisent lorsqu'un composant géré ne fonctionne pas de façon optimale, mais qu'il fonctionne tout de même. Les événements d'avertissement donnent le temps d'agir aux opérateurs de système. L'action appropriée pour un événement d'avertissement est souvent d'étudier davantage la situation et de planifier l'entretien du composant. Les avertissements indiquent également à l'opérateur du système qu'il devrait faire plus attention à un composant jusqu'à ce que le composant revienne à la normale. Les utilisateurs privilégiés et les administrateurs peuvent définir les valeurs minimale et maximale d'un événement d'avertissement. En définissant la plage d'avertissement, les utilisateurs privilégiés et les administrateurs peuvent incorporer le temps de réaction qu'ils veulent pour s'occuper d'un composant opérationnel qui commence à montrer des signes de performance dégradée.

Critique/Panne

Un événement critique/de panne indique qu'un composant fonctionne en dehors des limites de bon fonctionnement ou qu'il ne fonctionne pas du tout. Un composant qui ne fonctionne pas du tout est souvent appelé irrécupérable. Le fabricant du système définit la plage critique/de panne d'un composant car c'est le fabricant qui connaît le mieux la mécanique du composant et son bon fonctionnement. Un événement critique ou de panne a une connotation plus urgente qu'un avertissement et les opérateurs de système prennent ce type de dégradation des performances d'un composant plus au sérieux. Les actions appropriées pour un composant qui a un problème critique ou tombe en panne peuvent inclure un arrêt immédiat du système ou le remplacement d'un composant dans les délais les plus brefs.

[Retour au début]

État

L'état d'un composant ou d'un attribut du système est opérationnel, dégradé ou non opérationnel. 

Opérationnel

Une température opérationnelle indique que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage normale de fonctionnement. 

Dégradé

Une température dégradée signifie que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage d'avertissement définie par les températures minimale et maximale de fonctionnement requises pour un avertissement. La température du châssis est soit en dessous du minimum normal, soit au-dessus du maximum normal.

Une redondance dégradée signifie que trop peu de composants fonctionnent pour assurer que chaque composant critique en a un autre qui peut prendre la relève en cas de panne.

Non opérationnel

Un composant ou un attribut de composant non opérationnel signifie que le composant fonctionne dans la plage de panne ou est irrécupérable. En prenant la température comme exemple, si le système fonctionne encore, la température est si loin au-dessus ou en dessous de la plage normale qu'elle peut déclencher un arrêt thermique du système, ou endommager ou détruire des composants du système. 

[Retour au début]

Gravité

Tous les types d'événements et tous les états des composants ont une gravité.  Les gravités des événements sont : Informatif, Secondaire, Principal, Critique/Panne.

Informatif

L'état normal d'un événement ou d'un composant est un état opérationnel et la gravité associée à un événement normal est informative. La seule action que Server Administrator prend pour un événement normal est à titre d'information. Server Administrator informe l'opérateur de système que le composant est normal.

Secondaire

Un événement d'avertissement peut être secondaire ou critique selon le composant. Par exemple, si vous enlevez un ventilateur dans un système de ventilation redondante, la gravité de cet événement est mineure.

Principal

Certains événements d'avertissement peuvent indiquer des risques majeurs pour le système. Si un ventilateur reste en dehors du système pour une période de temps prolongée, l'événement peut devenir majeur car la redondance serait compromise. L'absence prolongée d'un composant d'un système dont la mission au sein d'une organisation exige une redondance peut entraîner des pannes de composants sans dispositifs de réserve et pourrait mener à une panne du système.

Critique 

Les événements qui détectent des composants dans la plage de panne sont critiques. Les pannes de composants tels que les ventilateurs, les cordons d'alimentation en CA ou les modules de mémoire compromettent le fonctionnement du système et la préservation de ses données.

[Retour au début]

Relation entre le type d'événement, la gravité et l'état

Le tableau suivant fournit un exemple d'événements pour des composants importants et montre les relations entre le type d'événement, la gravité et l'état.

Composant Type d'événement ou d'alerte Gravité État
Cordon d'alimentation en CA Normal Informative Opérationnel
Cordon d'alimentation en CA Panne Critique Dégradé
Bloc d'alimentation Panne Critique Dégradé
Redondance (du système d'alimentation) Totale Informative Opérationnel
Redondance (du système d'alimentation) Dégradé Mineure Dégradé
Redondance (du système d'alimentation) Perdu Majeure Dégradé
Température Normal Informative Opérationnel
Température Avertissement Mineure Dégradé
Température Panne Critique Dégradé
Thermique Arrêt Critique Non opérationnel

[Retour au début]