Los sistemas basados en el procesador POWER7 incluyen una amplia lógica de recuperación de hardware
y firmware.
Manejo de comprobación de la máquina
El firmware se encarga de manejar las comprobaciones de la máquina. Cuando se produce una
comprobación de máquina, el firmware analiza el error para poder identificar el dispositivo que falla, y
crea una entrada del registro cronológico de errores.
Si el sistema se ha degradado hasta tal punto que el procesador de servicio no puede alcanzar el estado
de espera, la capacidad de analizar el error no existe. Si el error se produce durante las actividades del
hipervisor, éste inicia un rearranque del sistema.
En modalidad particionada, un error que se produzca durante la actividad de la partición se notifica al
sistema operativo de la partición.
Herramientas de diagnóstico
Hay herramientas disponibles que le ayudarán a diagnosticar y solucionar problemas relacionados con el
hardware.
v Códigos de progreso (puntos de comprobación) de la POST (autoprueba de encendido), códigos de
error y procedimientos de aislamiento
La POST comprueba la inicialización del hardware y del sistema. Las funciones de diagnóstico de IPL
prueban algunos componentes e interconexiones del sistema. La POST genera punto de comprobación
de ocho dígitos para marcar el progreso de puesta en marcha del nodo de cálculo.
Utilice el módulo de gestión para ver los códigos de progreso.
En la documentación de un código de progreso se incluyen las acciones de recuperación de cuelgues
del sistema. Consulte el apartado "Códigos de progreso de la POST (puntos de comprobación)" en la
página 231 para obtener más información.
Si el procesador de servicio detecta un problema durante la POST, se registra un código de error en el
registro cronológico de sucesos del módulo de gestión. Los códigos de error también se anotan en el
syslog de Linux o en el registro de diagnósticos de AIX, si es posible. Consulte "Códigos de referencia
del sistema (SRC)" en la página 110.
El procesador de servicio puede generar códigos que apunten a procedimientos de aislamiento
específicos. Consulte "Problemas del procesador de servicio" en la página 479.
v Diagnósticos mediante indicadores luminosos
Utilice los LED de diagnóstico para identificar hardware anómalo. Si está encendido el LED de error de
alojamiento de la parte frontal o posterior del Chasis IBM Flex System Enterprise, uno o varios LED de
error del nodo de cálculo también estarán encendidos. Utilice los LED de diagnóstico del nodo de
cálculo para ayudarle a identificar el elemento anómalo.
Ubicaciones de los LED
Consulte "LED de la placa del sistema" en la página 15.
Panel frontal
Consulte "Botones del panel de control y LED del Nodo de cálculo" en la página 11.
v Tablas de resolución de problemas
Utilice las tablas de resolución de problemas para encontrar soluciones a los problemas que tengan
unos síntomas identificables.
Consulte la información en línea y la publicación Guía de determinación de problemas y de servicio del
nodo de cálculo.
v Recopilación de datos de volcado
En algunas circunstancias, un error podría requerir que se efectuara un volcado, para poder mostrar
más datos. El Gestor de virtualización integrado (IVM) o Hardware Management Console (HMC)
104
Power Systems: Guía de instalación y servicio del Nodo de cálculo de IBM Flex System p270