Ereignistypdefinitionen und Funktionszustand von Komponenten

Server Administrator klassifiziert Ereignisse, die sich auf bestimmte wichtige Komponenten des Systems auswirken, mit Hilfe eines Ereignistyps. Normal, Warnung und Kritisch sind die drei am häufigsten als Komponentenstatus angezeigten Ereignistypen.

In diesem Hilfemodul werden die Begriffe im Zusammenhang mit Ereignistypen definiert. Hierzu gehören Status und Schweregrade. Wenn Sie ausführlichere Informationen zu den einzelnen Begriffen wünschen, die für die Klassifizierung von Ereignissen durch Server Administrator und zur Bestimmung der Funktionszustand von Komponenten verwendet werden, lesen Sie dieses Hilfemodul.

Ereignistypen und zugehörige Schweregrade

Im Folgenden werden die unterscheidbaren Attribute des Ereignisses aufgeführt, unabhängig davon, ob Server Administrator den Funktionszustand einer Komponente ausgibt oder ein Ereignis klassifiziert: die überwachte Komponente bzw. Redundanz sowie Typ, Status und Schweregrad des Ereignisses, dem die Komponente unterliegt.

[Zurück zum Seitenanfang]

Komponente oder Redundanz

Server Administrator klassifiziert sowohl Komponenten als auch die Redundanz bei bestimmten Komponenten anhand von Typ, Schweregrad und Status.

Komponente

Alle Komponenten in einem System sind in einem bestimmten Grade wichtig. Systemverwaltungsanwendungen wie Server Administrator schenken einigen Komponenten besondere Aufmerksamkeit. Für den fehlerfreien Betrieb eines Computersystems ist insbesondere eine stabile Spannungsversorgung mit korrekter Spannung erforderlich, damit die Systemkomponenten ordnungsgemäß betrieben werden können. Der elektrische Strom wird über den Wechselstromschalter des Systems an die Netzteile des Systems geliefert. Die Temperaturen im Gehäuse müssen innerhalb des Betriebstemperaturbereichs der Komponenten des Systems liegen. Das Ausführen von Programmen und die Verarbeitung von Daten erfordert einen gut funktionierenden RAM-Speicher. Zur Erfüllung dieser Anforderungen überwacht Server Administrator unter anderem diese wichtigen Komponenten: Netzschalter, Netzteile, Lüfter und Systemspeicher.

Redundanz

Server Administrator überwacht die Funktionszustand von redundanten Komponenten und meldet den Redundanz-Status für das System.

Abhängig davon, wie wichtig ein System für die Erreichung von kritischen Zielen in einem Unternehmen oder einer Organisation ist, werden bestimmte der in das System eingebauten Komponenten redundant ausgelegt. Ein System, das wichtig für die Erreichung von kritischen Zielen in einer Organisation ist, hat sehr wahrscheinlich redundante Komponenten. Fällt eine Komponente aus, geht die redundante Komponente in Betrieb. Redundanz verhindert Betriebsunterbrechungen bei Herunterfahren oder beschädigten Komponenten.

Volle Redundanz

Volle Redundanz für das gesamte System ist hergestellt, wenn alle Geräte innerhalb ihrer Grenzwerte arbeiten. Wenn bei einem System für volle Redundanz vier Lüfter erforderlich sind und alle Lüfter arbeiten, ist für das System vollständige Redundanz für Lüfterkomponenten hergestellt. Wenn einer der beiden primären Lüfter ausfällt, steht für jeden Lüfter ein Reservelüfter bereit. Bei voller Redundanz sind neben der normalen vorbeugenden Wartung keine Maßnahmen erforderlich. 

Herabgesetzte Redundanz

Bei herabgesetzter Redundanz funktionieren einige der Komponenten nicht, die für volle Redundanz erforderlich sind. Das System ist in Betrieb, es funktionieren jedoch nicht genügend Komponenten, so dass im Falle eines Komponentenausfalls keine betriebsbereite Komponente in Reserve ist, die den Betrieb übernehmen könnte. Wenn zum Beispiel vier Lüfter für eine volle Redundanz erforderlich sind, stellen drei betriebsbereite Lüfter eine herabgesetzte Redundanz dar.  Nur für einen der beiden primären Lüfter steht ein Ersatzlüfter zur Verfügung. 

Verlorene Redundanz

Bei verlorenen Redundanz funktioniert nur die minimale Anzahl an Komponenten, um einen Systemfehler zu vermeiden. Es funktionieren keine redundanten Komponenten. Wenn bei einem System für die volle Redundanz vier Lüfter erforderlich sind und nur zwei Lüfter funktionieren, hat keiner der primären Lüfter einen Lüfter in Reserve, der bei einem Lüfterausfall in Betrieb gehen könnte.

[Zurück zum Seitenanfang]

Typ

Ein Ereignis wird nach Typ klassifiziert. Beispielereignistypen sind: Normal, Warnung und Kritisch. 

Normal 

Ereignisse vom Typ Normal geben an, dass eine Komponente innerhalb eines Bereichs funktioniert, in dem die Komponente ihre Funktion im System fehlerfrei ausüben kann. Ein anderer Begriff, der Komponenten mit dem Status Normal häufig zugewiesen wird, ist OK. Wenn eine Komponente OK ist oder ein Ereignis normal ist, braucht der Systembediener keine Korrekturmaßnahmen einzuleiten.

Warnung 

Warnungsereignisse treten auf, wenn eine verwaltete Komponente nicht optimal funktioniert, aber weiterhin betriebsfähig ist. Warnungsereignisse gewähren Systembedienern eine Reaktionszeit. Die geeignete Maßnahme auf Warnungsereignisse ist häufig eine genauere Untersuchung und die Terminfestlegung für die Wartung der Komponente. Warnungen alarmieren den Systembediener auch, einer Komponente größere Aufmerksamkeit zu widmen, bis sie zum normale Betrieb zurückkehrt. Hauptbenutzer und Administratoren können die minimalen und maximalen Werte für ein Warnungsereignis definieren. Die Berechtigung zur Festlegung des Warnungswertebereichs ermöglicht Hauptbenutzern und Administratoren, eine Reaktionszeit einzubauen, die ihnen bleibt, um auf eine funktionierende Komponente mit Anzeichen von Leistungsbeeinträchtigung zu reagieren.

Kritisch/Fehler

Ein kritisches Fehlerereignis weist darauf hin, dass eine Komponente entweder außerhalb der Grenzen funktioniert, die einen ordnungsgemäßen Betrieb gewährleisten, oder ganz ausgefallen ist. Eine Komponente, die überhaupt nicht mehr funktioniert, wird häufig als nicht wiederherstellbar bezeichnet. Der kritische Fehlerbereich für eine Komponente wird von deren Hersteller definiert, da dieser die Komponente entwickelt hat und am besten weiß, bei welchen Parametern die Komponente ordnungsgemäß funktioniert. Kritische Fehlerereignisse sind dringlicher als Warnereignisse, und Systembediener erachten diesen Typ der Beeinträchtigung bei der Komponentenleistung als schwerwiegender. Geeignete Maßnahmen bei einer kritischen oder fehlerhaften Komponente können das sofortige Herunterfahren des Systems oder das Veranlassen des baldigen Austauschs der Komponente sein.

[Zurück zum Seitenanfang]

Zustand

Das Statusattribut einer Komponente oder eines Systems ist Betriebsbereit, Herabgesetzt oder Nicht betriebsbereit. 

Betriebsbereit

Eine betriebsfähige Temperatur bedeutet, das Temperatursonden in einem Gehäuse Temperaturen messen, die im normalen Betriebsbereich liegen. 

Herabgesetzt

Eine Temperatur herabgesetzter Betriebsbereitschaft bedeutet, dass Temperatursonden in einem Gehäuse Temperaturen messen, die im Warnungsbereich liegen. Der Warnungsbereich ist durch die minimalen und maximalen Betriebstemperaturen, die für eine Warnung erreicht werden müssen, definiert. Die Temperatur im Gehäuse liegt entweder unter der minimalen oder über der maximalen Normaltemperatur.

Eine herabgesetzte Redundanz bedeutet, dass nicht genügend Komponenten funktionieren, um zu gewährleisten, dass für jede wichtige Komponente eine Reservekomponente vorhanden ist, die bei einem Ausfall den Betrieb übernehmen könnte.

Nicht betriebsbereit

Eine nicht betriebsbereite Komponente oder das Attribut Nicht betriebsbereit bedeutet, dass die Komponente entweder im Fehler- oder Nicht-wiederherstellbar-Bereich arbeitet. Bei dem Temperaturbeispiel wäre ein System, das weiterhin funktioniert, die Temperatur liegt jedoch so weit über dem maximalen oder unter dem minimalen Wert, dass ein Herunterfahren des Systems wegen extremer Temperaturen ausgelöst werden könnte oder dass Systemkomponenten beschädigt oder zerstört werden könnten. 

[Zurück zum Seitenanfang]

Schweregrad

Jeder Ereignistyp und -status für eine Komponente wird gemäß seines Schweregrads bewertet.  Schweregrade für Ereignisse sind u. a. Zur Information, Minder schwer, Schwerwiegend, Kritisch/Fehler.

Zur Information

Bei einer Komponente mit Status Normal oder beim Ereignistyp Normal ist die Komponente betriebsbereit, und der dem Ereignis Normal zugeordnete Schweregrad ist Informativ. Server Administrator führt für normale Ereignisse nur Maßnahmen zu Informationszwecken aus. Server Administrator informiert den Systembediener, dass eine Komponente normal funktioniert.

Minder schwer

Ein Warnereignis kann Minder schwer oder Kritisch sein, abhängig von der Komponente. Wenn Sie beispielsweise einen Lüfter in einem System mit Lüfter-Redundanz ausbauen, ist der Schweregrad dieses Ereignisses Minder schwer.

Schwerwiegend

Bestimmte Warnungsereignisse können auf schwerwiegende Probleme im System hinweisen. Wenn ein Lüfter für längere Zeit aus dem System entfernt wird, könnte das Ereignis schwerwiegend werden, da die Redundanz gefährdet ist. Die längere Abwesenheit einer Systemkomponente, deren Funktion in einer Organisation Redundanz erfordert, könnte zu Komponentenausfällen führen, ohne dass Reservekomponenten verfügbar wären, was möglicherweise zu einem Systemausfall führt.

Kritisch 

Werden Komponenten erkannt, die innerhalb des Fehlerbereichs arbeiten, liegt ein kritisches Ereignis vor. Fehlerhafte Komponenten, wie Lüfter, Netzkabel oder Speichermodule, gefährden unterbrechungsfreien Betrieb des Systems und die Bewahrung der Daten.

[Zurück zum Seitenanfang]

Wie Ereignistyp, Schweregrad und Status miteinander in Beziehung stehen

Die folgende Tabelle liefert Beispielereignisse für wichtige Komponenten und stellt den Zusammenhang zwischen Ereignistyp, Schweregrad und Status dar.

Komponente Ereignis- oder  Warnungstyp Schweregrad Zustand
Netzkabel Normal Zur Information Betriebsbereit
Netzkabel Fehler Kritisch Herabgesetzt
Netzteil Fehler Kritisch Herabgesetzt
Redundanz (für Stromversorgungssystem) Voll Zur Information Betriebsbereit
Redundanz (für Stromversorgungssystem) Herabgesetzt Minder schwer Herabgesetzt
Redundanz (für Stromversorgungssystem) Verloren Schwerwiegend Herabgesetzt
Temperatur Normal Zur Information Betriebsbereit
Temperatur Warnung Minder schwer Herabgesetzt
Temperatur Fehler Kritisch Herabgesetzt
Temperaturbedingtes Herunterfahren Kritisch Nicht betriebsbereit

[Zurück zum Seitenanfang]