Finally the help of IT is here

Blog de soluciones informaticas.

Failed incomplete array (Problema visibilidad discos en RAID)

Escrito por Xavier Xaus Nadal on mayo 19th, 2013

Save pagePDF pageEmail pagePrint page

Failed incomplete array es un mensaje que os podría aparecer en el caso que hubierais perdido de una SAN uno de los enclosures o expansiones de discos por o bien falta de conectividad o bien, un fallo de configuración en el switch de selección de velocidad entre las expansiones y la cabina principal.

Lo que nos sucedió es que teníamos configurado un switch de selección de velocidad a 4 GB y debería haber estado en 2 GB, se nos fue la luz en el CPD, en este momento la cabina se apagó repentinamente por que el SAI petó (Estaba ya muy viejo y le petó un fusible) era una SAI pequeña. Cuando volvió la corriente a la sala técnica la cabina arrancó toda de golpe como es de esperar y sin ningún orden específico. Como todos sabréis primero se deben arrancar las expansiones, esperar unos 3 minutos y finalmente la unidad principal con sus controladoras etc, para que pueda detectar sin problemas todas las expansiones, discos, etc.. conectados a la unidad principal.

Seguro que muchos estaréis pensando, pues en mi cabina esto no pasa, arranca automáticamente todo y sin ningún problema, tenéis razón en la que os mostramos en este artículo también, pero si habláis con vuestro partner os dirá que todo tiene un orden y las cabinas deben seguir el suyo de arranque.

Lo que os vamos a mostrar está basado en una Cabina IBM Storage DS4700 con una unidad principal más 1 expansión de discos, todo con discos Fiber Channel (FC) y con Hot Spare configurados, todas las LUN que hay creadas están montadas sobre RAID 5 para mayor disponibilidad. El rendimiento como todos sabéis es inferior que en RAID 10 u otros, pero te garantiza que te pueden fallar hasta 2 discos de un RAID sin pérdida de datos. En el caso que falle un disco entraría el disco de Hot Spare, y en el caso que fallar también el de hotSpare entraría el del Raid5.

Como podéis ver en la imagen a continuación es que aparentemente todos los discos están en buen estado, que el hot spare está en modo stand by (correcto) y que no hay ningún problema a ningún nivel.

Failed Array

Pero si nos vamos a la pestaña de discos lógicos en lugar de al estado de los discos físicos veremos el siguiente mensaje.

Incomplete array

Aquí ya os podréis imaginar que hemos perdido los datos, que no se podrán recuperar, etc.. pero no es así, los datos están a buen recaudo, únicamente tenemos que seguir unos pasos concretos para recuperar el Array y disponer de todos los datos como hasta antes del apagón.

Lo que deberemos hacer es acceder de nuevo al panel de discos físicos para solventar el problema que nos muestra el Recovery Guru Failed incomplete array o Failed Logical Drive – Drive Failure

ds4700

Marcar el primer disco que compone el Array con el fallo y pulsar sobre el menú Advanced –> Recovery –> Revive –> Drive, escribir la palabra yes y cuando tengamos esto realizado desconectamos los hot-spare para que no entre si hubiera algún problema ahora mismo. Parece peligroso, por que perdemos una parte de la protección de discos, pero es un momento y recordad que seguimos teniendo la protección del raid.

Cuando tengamos desconfigurados todos los hot-spare seguimos con el proceso Advanced –> Recovery –> Revive –> Drive con cada uno de los discos restantes hasta finalizar con todos los discos del RAID.

Hemos solventado el problema. El Array ha vuelto a la normalidad y si os conectáis a alguno de los servidores que tienen estos discos los podréis ver con normalidad.

En el caso que tengáis un Vmware por debajo deberéis hacer un refresco del Storage para que se os vean las LUN de nuevo, si en ellas teníais máquinas virtuales configuradas y están apagadas pero disponéis de un clúster con HA habilitada las máquinas se os arrancarán automáticamente cuando vean el array de nuevo.

Como podréis comprobar la alarma del recovery guru donde indicaba Failed incomplete array se ha solventado.

Si tenéis algún problema podéis escribir un comentario en el post, pero supongo que iréis más rápido llamando a soporte de vuestra cabina  o al soporte de vuestra cabina.

En un futuro ya pondremos una línea 902 por ejemplo para que podáis hacernos cualquier consulta online.

Saludos y hasta pronto, espero que el artículo os haya servido de ayuda.

Related Posts Plugin for WordPress, Blogger...
Etiquetas: , , ,


Leave a Reply

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>