Google-Studie zur Ausfallursache von Festplatten

Eine Google-Studie, bei der die SMART-Daten von mehr als 100.000 Festplatten ausgewertet wurden, versucht zu ergrĂĽnden, welches die bedeutendsten Ursachen fĂĽr den Ausfall einer Festplatte sind.

In Pocket speichern vorlesen Druckansicht 463 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Boi Feddern

Wann geht eine Festplatte kaputt und was ist die häufigste Ursache dafür? Diese Frage versucht eine Studie mit dem Titel Failure Trends in a Large Disk Drive Population (PDF-Datei) von drei Mitarbeitern des Google-Konzerns zu beantworten. Eduardo Pinheiro, Wolf-Dietrich Weber und Luiz Andre Barroso haben dazu ein dreiviertel Jahr lang die SMART-Daten (Self-Monitoring Analysis and Reporting Technology) von mehr als 100.000 Festplatten ausgewertet, die bei Google-Diensten permanent im Einsatz sind.

Bei SMART handelt es sich um einen Selbstdiagnosemechanismus einer Festplatte, über den sie während des Betriebes beispielsweise Protokoll über die Anzahl der Betriebsstunden oder aufgetretenen Schreib- und Lesefehler führt und diese Daten auf Befehl ausgibt. Die Angaben in der Studie basieren auf den SMART-Daten von IDE- und SATA-Platten unterschiedlicher Hersteller mit 5400 und 7200 U/min in Kapazitäten von 80 bis 400 GByte, die ab 2001 in Betrieb genommen wurden. Glaubt man der Studie, wird die landläufige Meinung bestätigt, dass bestimmte Modelle mancher Hersteller häufiger ausfallen als die anderer. Genaue Details, welche Modelle besonders häufig von einem Defekt betroffen sind, werden aber nicht verraten.

Eine statistisch gesehen besonders häufige Ausfallrate ermittelten die Wissenschaftler bei Platten, die zuvor per SMART Scanfehler meldeten. Die so genannten Scan Errors deuten auf eine Beschädigung der Medienoberfläche hin. Auch eine hohe Anzahl an belegten Reservesektoren (Reallocated Sector Count) führten früher oder später meist zum Festplattentod.

Platten, die relativ wenig im Leerlauf liefen und viele Schreib-/Lesevorgänge durchführen mussten, gingen in den ersten drei Monaten und nach fünf Jahren häufiger kaputt als weniger beanspruchte Laufwerke. Auch die Temperatur des Laufwerks hat einen Einfluss auf die zu erwartende Lebensdauer – anscheinend aber nicht so dramatisch, wie gewöhnlich angenommen. Temperaturen von mehr als 45 Grad Celsius machten besonders Laufwerken, die mindestens drei Jahre alt sind, zu schaffen. Jüngeren Platten bereiteten dagegen geringe Betriebstemperaturen zwischen 15 und 30 Grad Celsius besondere Probleme. Geht es nach den Ergebnissen der Studie, wiesen Platten mit einer durchschnittlichen Betriebstemperatur von 40 Grad Celsius die geringsten Ausfallraten auf.

Nicht neu ist allerdings die Erkenntnis, das der SMART-Mechanismus allein nicht immer einen Plattenausfall vorhersagen kann. 36 Prozent der während der Datenerhebung ausgefallenen Laufwerke hatten zuvor keinerlei SMART-Fehler gemeldet. Trotz eines Frühwarnsystems wie SMART sollte man deshalb regelmäßig eine Datensicherung durchführen, um Datenverlusten vorzubeugen. Fehler wie das Durchbrennen eines Chips der Laufwerkselektronik können nämlich ein Laufwerk lahm legen, ohne dass SMART davor hätte warnen können. (boi)