Definiciones de tipos de sucesos y condición de componentes

Server Administrator clasifica los sucesos que afectan a ciertos componentes fundamentales de su sistema usando un tipo de suceso. Normal, advertencia y crítico son los tres tipos de sucesos más comunes que se muestran como el estado de los componentes.

Este módulo de ayuda define los términos para los tipos de sucesos, los estados y las gravedades. Lea este módulo de ayuda si desea obtener más detalles sobre los diferentes términos que el Server Administrator usa para clasificar sucesos y para identificar el estado de los componentes.

Tipos de sucesos y gravedades correspondientes

Ya sea que Server Administrator informe acerca del estado de un componente o que clasifique un suceso, los atributos del suceso que se pueden distinguir son: el componente o la redundancia que se supervisa y el tipo, estado y gravedad del suceso que el componente atraviesa.

[Volver al principio]

Componente o redundancia

Server Administrator clasifica tanto los componentes como la redundancia de algunos componentes de acuerdo al tipo, la gravedad y el estado.

Componente

Todos los componentes de un sistema son importantes de alguna manera. Las aplicaciones de administración de sistemas como Server Administrator destacan algunos componentes para darles atención especial. Los equipos en buen estado dependen especialmente de un suministro estable de energía eléctrica en voltajes adecuados para que los componentes del sistema funcionen adecuadamente. La energía eléctrica se suministra a través del interruptor de CA (corriente alterna) del sistema y hacia los suministros de energía del sistema. Los componentes de los sistemas también requieren un rango de temperaturas funcional dentro del chasis. La ejecución de programas y la elaboración de cálculos sobre los datos requiere que la memoria de acceso aleatorio funcione bien. Como resultado de estos requisitos, el interruptor de corriente, los suministros de energía, los ventiladores y la memoria del sistema son algunos de los componentes más importantes que supervisa Server Administrator.

Redundancia

Server Administrator supervisa la condición de los componentes redundantes y notifica el estado de la redundancia del sistema.

Dependiendo de que tan vital sea un sistema para la misión de una entidad comercial u organización, algunos componentes del sistema están instalados en el mismo con redundancia planificada. Es más probable que un sistema que es fundamental para la misión de una organización tenga componentes redundantes. Un componente redundante está diseñado para hacerse cargo del funcionamiento cuando su componente de acompañamiento falla. La redundancia ayuda a proteger a un sistema para que no experimente tiempo de indisponibilidad debido a un apagado o a daños de los componentes.

Redundancia total

Redundancia total para todo el sistema significa que todos los dispositivos están funcionando dentro de los límites normales. Si un sistema requiere cuatro ventiladores para redundancia total y los cuatro están funcionando, el sistema tiene redundancia total para el componente del ventilador. Si cualquiera de los dos ventiladores principales falla, cada uno tiene un respaldo. La redundancia total no requiere ninguna acción además del mantenimiento preventivo normal.

Redundancia degradada

Redundancia degradada significa que algunos de los componentes que se necesitan para la redundancia total no están funcionando. El sistema está operativo, pero no hay suficientes componentes funcionando para permitir que un componente operativo se haga cargo de la operación en caso de que falle un componente. Por ejemplo, si se requieren cuatro ventiladores para lograr redundancia completa, tres ventiladores en operación indicarán una redundancia degradada. Sólo uno de los dos ventiladores principales tiene un ventilador emergente en caso de que falle.

Redundancia perdida

Redundancia perdida significa que el sistema tiene sólo el número mínimo de componentes funcionando para evitar la falla del sistema. No hay ningún componente redundante funcionando. Si se requieren cuatro ventiladores para la redundancia total y sólo dos ventiladores están funcionando, ninguno de los ventiladores principales tiene un respaldo si un ventilador falla.

[Volver al principio]

Tipo

Un suceso se clasifica por tipo. Normal, advertencia y crítico son ejemplos de tipos de sucesos.

Normal

Los sucesos normales indican un componente que está funcionando dentro de un rango de valores que activa al componente para realizar bien su función en el sistema. El término que se aplica a los componentes que funcionan en estado normal es En buen estado. Cuando un componente está en buen estado, o un suceso es normal, el operador del sistema no tiene que realizar ninguna acción correctiva.

Advertencia

Los sucesos de advertencia se producen cuando un componente administrado no está funcionando óptimamente, pero aún es capaz de funcionar. Los sucesos de advertencia proporcionan cierto tiempo de ventaja a los operadores del sistema. La acción adecuada para un suceso de advertencia es a menudo investigar más y programar el mantenimiento del componente. Las advertencias también alertan al operador del sistema para que ponga más atención a un componente hasta que regrese a su estado normal. Los usuarios avanzados y los administradores pueden definir los valores mínimo y máximo para un suceso de advertencia. El privilegio de definir el rango de advertencia permite a los usuarios avanzados y a los administradores conformar el tiempo de reacción que desean cuando se maneja un componente operativo que está comenzando a mostrar signos de funcionamiento degradado.

Crítico/Falla

Un suceso crítico o de falla indica que un componente está funcionando fuera de los límites del funcionamiento adecuado o que no está funcionando en absoluto. Un componente que no está funcionando en absoluto a menudo se denomina no recuperable. El fabricante del sistema define el rango crítico o de falla para los componentes, ya que el fabricante conoce mejor el diseño del componente y su funcionamiento más adecuado. El suceso crítico o de falla tiene una connotación más urgente comparado con el advertencia y los operadores del sistema toman más seriamente este tipo de degradación del funcionamiento de un componente. Las acciones adecuadas para un componente crítico o en falla pueden incluir el apagado inmediato del sistema o la programación del reemplazo del componente en poco tiempo.

[Volver al principio]

Estado

El estado del atributo de un componente o sistema es operativo, degradado o no operativo.

Operativo

Una temperatura operativa significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas en el rango normal de operación.

Degradado

Una temperatura degradada significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas que están dentro del rango de advertencia definido por las temperaturas de operación mínima y máxima requeridas para una advertencia. La temperatura en el chasis está por debajo de la temperatura mínima normal o sobre la temperatura máxima normal.

Una redundancia degradada significa que no hay suficientes componentes funcionando para asegurar que cada componente fundamental tenga un respaldo que se haga cargo de la operación en caso de que falle.

No operativo

Un componente o un atributo de un componente no operativo significa que el componente está funcionando en un rango de falla o no recuperable. Usando el ejemplo de la temperatura, si el sistema aún está funcionando, la temperatura está tan por encima o por debajo del rango normal que puede desencadenar un apagado térmico del sistema o podría dañar o destruir los componentes del mismo.

[Volver al principio]

Gravedad

Cada tipo de evento y estado de un componente se clasifica de acuerdo a su gravedad. Las gravedades de los sucesos incluyen informativo, leve, grave, crítico/falla.

Informativo

Un suceso normal o el estado de un componente está en un estado operativo y la gravedad asociada con un suceso normal es informativa. La única acción que realiza Server Administrator para un suceso normal es informativa. Server Administrator informa al operador del sistema que el componente está normal.

Leve

Un suceso de advertencia puede ser leve o crítico, dependiendo del componente. Por ejemplo, si desmonta un ventilador en un sistema con redundancia de ventiladores, la gravedad de ese suceso es leve.

Grave

Algunos sucesos de advertencia pueden indicar riesgos graves para el sistema. Si un ventilador permanece fuera del sistema por un periodo largo, el suceso podría convertirse en grave porque estaría poniéndose en un compromiso la redundancia. La ausencia por un periodo largo de un componente en un sistema cuya misión en una organización requiere redundancia, podría ocasionar fallas de los componentes sin respaldos disponibles y podría conducir finalmente a una falla del sistema.

Crítico

Los sucesos que detectan componentes dentro del rango de falla son críticos. La falla de componentes como los ventiladores, los cables de corriente alterna o los módulos de memoria ponen en peligro la capacidad del sistema para funcionar y preservar los datos.

[Volver al principio]

Cómo están relacionados el tipo de suceso, la gravedad y el estado

La siguiente tabla proporciona ejemplos de sucesos para componentes importantes y muestra cómo están relacionados el tipo de suceso, la gravedad y el estado.

Componente Tipo de suceso o de alerta Gravedad Estado
Cable de corriente alterna Normal Informativo Operativo
Cable de corriente alterna Falla Crítico Degradado
Suministro de energía Falla Crítico Degradado
Redundancia (para el sistema de energía) Total Informativo Operativo
Redundancia (para el sistema de energía) Degradado Leve Degradado
Redundancia (para el sistema de energía) Perdida Grave Degradado
Temperatura Normal Informativo Operativo
Temperatura Advertencia Leve Degradado
Temperatura Falla Crítico Degradado
Térmico Apagado Crítico No operativo

[Volver al principio]