Accueil > Prévention RAID 5

Prenez des précautions, faites des clones physiques des disques !

Ces clones vous serviront à revenir en arrière ou vous pourrez nous les fournir. Ne pas compresser les fichiers images des clones.

Statistiques :

Pour information, voici les statistiques des RAID 5 sous Windows traités par Recoveo sur une année.

Les résultats sont sans équivoque !

Dans de nombreux cas, la perte de milliers de fichiers à cause d'une mauvaise manipulation souvent effectuée dans la panique est catastrophique pour la société ou l'organisme qui en est victime.

Ex. Serveur RAID 5 reçu d'un lycée professionnel deux semaines avant la rentrée scolaire.

Aucune sauvegarde récente. Les mauvaises manipulations rendent impossible la récupération des données.

Sans intervention préalable sur votre support, vous avez une chance maximum de récupérer vos données.

Conseils :

Toute reconstruction du volume RAID avec une mauvaise configuration, des disques défaillants, inversés ou désynchronisés est FATALE pour vos données.

Ne tentez une reconstruction que si vous remplacez UN disque défaillant par un NEUF.

Ne réintégrez jamais de disque dur offline.


Avant toute tentative de reconstruction hasardeuse, nous vous conseillons de cloner ou de faire des images de vos disques durs comme filet de sécurité.

Attention, nous ne saurions être tenus responsables d'une mauvaise utilisation du logiciel.
Vérifiez l'exactitude des informations fournies (lecteur cible) avant de commencer l'opération.

Prévention RAID 5 : précautions élémentaires et gestes à risques lors d'une panne sur un RAID 5

Beaucoup s'imaginent que les probabilités de panne sur un RAID 5 sont très faibles, compte tenu de la sécurité apportée par le système de parité.

Cependant, un système d'alertes mal configuré ou un matériel de piètre qualité (carte RAID ou disques durs) peut conduire à une panne de plusieurs disques durs ce qui conduit à un arrêt irréversible du RAID et donc à une inaccessibilité des données.

Cas d'école

Prenons un cas d'école :

Serveur IBM RAID 5 de 3 disques durs SAS Disques durs Savvio® 15K de 300 Go sous Windows 2008 server

Le volume RAID 5 est tombé en panne subitement.

Via l'utilitaire RAID de la carte Adaptec :

1 disque dur OK
1 disque dur HS (non reconnu)
1 disque dur offline

Le volume RAID a lui aussi un état Array/logical drive offline.

Le client a perdu l'accès à une base SQL très importante et à l'ensemble des fichiers partagés (type Office).

Dans la panique, il croit bien faire en replaçant le disque défectueux par un neuf puis en changeant l'état du disque dur en online ce qui débloque l'option rebuild. La reconstruction "forcée" se termine sans erreur mais le système refuse de redémarrer.

Recoveo examine les disques durs. Le test de XOR ne démontre pas de problème de parité, ce qui est normal puisque la reconstruction s'est bien terminée. Une fois les paramètres du RAID identifiés grâce à notre outil RAIDfix, nous remontons sur notre serveur une image totale du volume RAID de 600 Go. Nous nous rendons compte que le système de fichier est altéré mais retrouvons tout de même les fichiers .mdf et .ldf.

Lors du test, nous diagnostiquons le fichier comme corrompu.

Les tests sur les fichiers récents montrent qu'ils sont tous endommagés, sauf quelques fichiers txt ou log de quelques ko.

Explications :

Le disque dur en état offline a été désactivé du RAID 5 dans un premier temps, pour une raison x ou y (secteurs défectueux, erreurs d'accès temporaires etc.). Le système d'alerte n'étant pas configuré, ce disque dur n'a pas été remplacé immédiatement par un disque dur spare.

Le RAID 5 fonctionne alors sur 2 disques durs en mode dégradé (disques 0 et 1) jusqu'à ce que le disque dur n°1 ne s'endommage, ce qui provoque un arrêt du RAID 5.

Lors de la reconstruction, la carte RAID a utilisé les secteurs du disque dur à jour et ceux du disque dur offline depuis longtemps qui est désynchronisé.

Par conséquent, les fichiers les plus récents (créés ou modifiés après la panne du premier disque dur) sont endommagés car la parité sur l'emplacement de ces fichiers a été recalculée lors du rebuild.

Voici le résultat simplifié d'une reconstruction avec un disque dur désynchronisé :

Les cases jaunes représentent des parties du fichier qui sont incohérentes et qui vont provoquer une erreur à l'ouverture ou un contenu dégradé.

Si vos données sont importantes, ne jouez pas au hasard !

carre