La Web del Programador: Comunidad de Programadores
 
    Pregunta:  59606 - DISCOS DAÑADOS EN ARRAY
Autor:  Ruperto Bocanegra Padilla
Tengo una maquina SUPERMICRO...
Tiene instalado OPENSUSE 10...
Tiene un disco duro SCSI de 72 GB con el Sistema operativo...
Ademas tiene SEIS (6) discos duros SATA cada uno de UN (1) TERA...
Esos seis discos duros, estan configurados por software como RAID 5...
Ese volumen lo tenia trabajando con SAMBA...
Compartiendo unos archivos... IMAGENES TIFF....
Tenia mas o menos 3 TERAS de informacion...
la vaina es que no tengo copia o backup de esa informacion....

Lo que paso es lo siguiente....
En la ultima apagada de la maquina...
al reinicialo... el sistema operativo hizo un cheque del sistema FSCK forzado...
El mensaje que daba antes de iniciar el chequeo era que el arreglo estaba arrancando con 5 discos duros de 6...
por lo tanto entraba en chequeo forzado...
Cuando el fsck estaba en 40% se reventava el proceso
y entraba en modo de comandos # y pedia que se recuperara el filesystem manaualmente....

Los diagnosticos que le hago con el comando cdadm --examine /dev/md0 me dicen
que el disco /dev/sda1 esta fuera de linea...
al revisar el sistema con cat /proc/mdstat....
me dice que el disco 1 esta fuera de linea....
reviso la razon de la salida de linea.... con el comando dmesg y con el comando cat /var/log/messages
y me dice que el disco duro /dev/sda1 estaba presentando problemas de temperatura y que el sistema lo coloco fuera de linea...
al parecer este problema era persistente desde el 27 de noviembre...

Yo intente recuperar el sistema haciendo un FSCK desde la linea de comandos...
el proceso paso las 5 fases... arrojo errores... me pidio conectar algunos inodes....

Algo que tambien intente fue montar el disco logicamente en el arreglo
con el comando mdadm --add /dev/md0 /dev/sda1
el disco subio... el comando cat /proc/mstat me arrojaba el estaba reconstruyendo el arreglo.. porcentualmente...
cuando llego al 100% pense que ya lo tenia solucionado...
paso la carga... pero a los 5 minutos... el sistema volvio a sacar el /dev/sda1 fuera de linea....
Y al subir el sistema operativo vuelve a forzar el FSCK...

Lo que es peor... ahora saco de linea otro disco duro del arreglo...
y como es logico entonces en la carga del sistema...
ya no puede subir el /dev/md0... el arreglo...

la razon... por lo que arroja el sistema de mensages del /proc/messages y dmsg y el cat /var/log/mesagges
el problema del calor de los discos persiste....
yo reviso la temperatura de la maquina y esta fresca.... no tiene probleas de ventilacion....

Por la BIOS de la BOARD... corri una verificacion de superficio del disco /dev/sda1...
el progama aborta y me arroja que el disco tiene problemas...
por lo que concluyo que el disco esta dañado... ?????? nose ????
sin embargo... me queda la duda de porque con el comando de montaje del disco en el array lo sube...
mdadm --add /md0 /dev/sda1.... el sistema lo subio como si estubiera bueno.... y lo recupero hasta el 100%

Yo tengo otro disco de un TERA para colocar como reemplazo a ese disco duro...
despues de apagar la maquina... lo coloco el la misma posicion del disco dañado....
la BIOS me arroja el mensaje de que el disco no esta congurado... mientras que los restantes 5 discos me dicen LEGACY....
cuando la maquina entra a buscar el sistema operativo... no encuentra nada... y me dice que la maquina no tiene sistema operativo...

Mientras yo arranque el servidor con el disco original... el sistema operativo entra normalmente...
pero como lo comente anteriormente... no sube el arreglo... y me deja en la linea de comando
solicitandome que recupere el sistema de archivos manualmente... #

La verdad ahora no se que hacer...

  Respuesta:  Jose Ramon Castelo
Hola,

No sé si llego tarde.
En mi opinión, lo que debes hacer es colocar el disco nuevo y probar a arrancar el equipo desde un CD estilo R.I.P (Recovery Is Possible) que lo puedes descargar en http://rip.7bf.de/current/.
Una vez arrancado desde el CD, prueba a reconstruir el RAID y después arranca el equipo ya sin el CD.

Espero que te sirva.
Un saludo desde A Coruña (España)