Ersetzen einer defekten Platte in einem RAID
Der Austausch einer Festplatte in einem RAID-System ist ein heikler Vorgang, bei dem Ihre Daten besonders gefährdet sind. Der Einsatz eines RAID-Systems erhöht zwar die Sicherheit und/oder die Leistung Ihres Informationssystems, sollte aber nicht von der Einführung solider Datensicherungs- und Wiederherstellungsverfahren entbunden werden.
RAID-Systemausfälle: Verstehen und antizipieren
Die Durchführung einer RAID-Ausfallsimulation während der Installation eines neuen Systems kann für Ihr Unternehmen von Interesse sein . Dies wird Ihnen helfen, die Konfiguration Ihres RAID-Systems zu verstehen, die korrekte Umsetzung der administrativen und materiellen Verfahren im Falle eines Ausfalls zu testen und, falls nötig, eine angemessene PCA/PRA zu initiieren.
Die am häufigsten eingesetzten RAID-Systeme sind RAID 0, RAID 1, RAID 5 und RAID 6. Ihr Verhältnis zwischen Leistung, Fehlertoleranz und Datensicherheit hängt davon ab, wie die Festplattencluster, aus denen sie bestehen, zusammengefasst werden. Mit Ausnahme von RAID 0, das nur auf die Lese-/Schreibgeschwindigkeit ausgerichtet ist, erfordert jedes RAID-System die Sicherheit von mindestens einer Festplatte.
Die Sicherheit eines RAIDs ist jedoch relativ, auch in Systemen, die als zuverlässig gelten. Die meisten Ausfälle beginnen mit dem Verlust einer einzelnen Festplatte innerhalb der Konfiguration. Ein Kaskadeneffekt kann jedoch auftreten, wenn die Festplatten in einem Cluster oder RAID zur selben Serie oder Charge gehören.
Eine RAID-Festplatte austauschen: die einzelnen Schritte
Der Austausch einer Festplatte in einem RAID-System erfordert eine Reihe von Schritten.
Bei den meisten Ausfällen wird ein Alarm an , den RAID-Administrator, gesendet (E-Mail-Alarm, akustisches Signal, Warnleuchte…). Es ist dann wichtig, diese Warnungen zu registrieren, Zweifel auszuräumen und die entsprechenden Verfahren einzuleiten . Solange der RAID-Speicher zugänglich ist und vor jeder anderen Operation, ist es unerlässlich, eine Sicherung der Daten durchzuführen und/oder die täglichen Sicherungen zu überprüfen.
Der zweite Schritt ist der Austausch der defekten Festplatte. Dies ist der kritischste Schritt bei der Bewältigung des Ausfalls: Mit Ausnahme von RAID 6 ist das System zu diesem Zeitpunkt nicht mehr sicher. Da die Lieferung eines Ersatzlaufwerks manchmal mehrere Tage dauern kann, kann die Zeit der Verwundbarkeit sehr lang sein.
Der dritte Schritt ist die Rekonstruktion der Daten im RAID-System, nachdem die defekte Festplatte ausgetauscht wurde. Dieser Prozess ist ebenfalls kritisch und heikel, da er irreversible Schreibvorgänge auf die neue Festplatte und manchmal auch auf die Paritätsbereiche der anderen Festplatten beinhaltet.
Kaskaden von RAID-Systemausfällen: Ihre letzten Möglichkeiten
Wie bereits erwähnt, kann es zu RAID-Systemausfällen kommen, wenn die Festplatten aus der gleichen Charge oder Serie stammen. Diese kaskadierenden Ausfälle können dazu führen, dass Ihre Daten verloren gehen oder nicht mehr zugänglich sind. Eine RAID-Datenrettung sollte in Betracht gezogen werden.
Im zweiten Schritt (und immer mit Ausnahme von RAID 6) sollten Sie auf keinen Fall mehr als eine defekte Festplatte austauschen, da dies zu einem dauerhaften Datenverlust führen kann. Und im Falle eines Datenverlustes ist die beste Maßnahme, die Stromversorgung der Festplatten abzuschalten.
Wenn eine Festplatte im RAID-System während der Datenrekonstruktionsphase ausfällt, können schlechte Informationen unwiederbringlich auf die anderen Festplatten geschrieben werden. Diese korrupten Schreibvorgänge können dann zu einem dauerhaften Datenverlust führen.
In allen Fällen ist es daher besser, sich an ein Datenrettungslabor zu wenden, das Ihre Daten extrahieren und eine Kopie Ihrer defekten Festplatten anfertigen kann, bevor andere Maßnahmen (Austausch von Festplatten, Datenrekonstruktion usw.) durchgeführt werden.
13 März 2020