Avatar von Fahim
  • Fahim

mehr als 1000 Beiträge seit 28.10.2007

Gegen die meiste Bitfäule hilft ein Schreib-Lese-Test

Ich habe Fehler schon an vielen Stellen gesehen, an Datenträgern, Kabeln und auch zwischen einer Controller-Karte und dem PCI-Bus.
Deshalb teste ich bei jedem neuen Rechner mit einen RAM-Test, mit Memtest86+, und sehe bei neuen Datenträgern erstmal nach den SMART-Daten falls vorhanden und mache dann einen kompletten Schreib-Lese-Test, z. B. mit

badblocks -wsv -c 65536 -t random -o log.txt /dev/<device> 2>&1 | tee logg.txt

Damit fallen mir Fehler wie der im Artikelanfang beschriebene, Inkompatibilität zwischen der Firmware bestimmter Festplatten mit dem RAID-Hostadapter sofort auf.
Einige USB-Sticks sind mir bei dem Test sogar schon gestorben, aber besser die sterben beim Test als im Einsatz.
Durch Wiederholung und Vergleich der Logdateien von Badblocks sieht man wo die Fehler auftreten und wenn die Stellen nicht gleich sind, liegt es meist an der Verbindung und nicht dem Datenträger, denn Fehler wandern normalerweise nicht durch den Datenträger.

Das funktioniert auch bei Rechnern auf denen schon etwas vorinstalliert ist: Einfach ein Knoppix Booten, mit dd ein Image vom Datenträger ein Backup anlegen, z. B. auf einer USB3-Festplatte mit X TB, danach mit Badblocks testen und hiernach das Backup mit dd zurück kopieren. Hierbei wird auch doppelt getestet, denn bei einem Fehler bricht dd normalerweise mit einem Fehler ab; das Backup zu erstellen und zurück zu kopieren ist daher auch ein Test.

Übrigens hilft ECC-RAM auch nicht immer, denn wenn man zu schnelle Timing-Werte einstellt treten ECC-Fehler auf und das Betriebssystem hängt sich dann meist auf.
Wenn man nicht im Error-Log vom BIOS nachsieht, merkt man das erstmal nicht.

Das Posting wurde vom Benutzer editiert (13.10.2013 00:14).

Bewerten
- +