zurück zum Artikel

Ausfallraten von SATA-Festplatten im harten Server-Einsatz

| Christof Windeck

Der Cloud-Storage-Anbieter Backblaze veröffentlicht Daten, die sehr unterschiedliche Ausfallraten verschiedener Festplatten zeigen - allerdings unter untypischen Betriebsbedingungen.

Jede Festplatte fĂ€llt irgendwann aus, man weiß bloß nicht, wann. Der US-amerikanische Cloud-Backup-Dienstleister Backblaze versucht seit Jahren, die fĂŒr seine Zwecke zuverlĂ€ssigsten Platten zu finden, indem er die tatsĂ€chlichen Ausfallraten unterschiedlicher Festplattenmodelle analysiert. Diese Analysen veröffentlicht Backblaze in unregelmĂ€ĂŸigen AbstĂ€nden im Firmen-Blog, stellt aber auch die Rohwerte öffentlich zum Download bereit. Die aktuellen Ausfallraten verschiedener Plattentypen der Firmen HGST, der HGST-Mutterfirma WD, Seagate und Toshiba zeigen, dass die HGST-Laufwerke besonders zuverlĂ€ssig sind – jedenfalls in den Speichersystemen von Backblaze.

Die aktuelle Ausfall-Analyse von Backblaze [1] bezieht sich auf das erste Quartal 2016 und auf mehr als 60.000 Festplatten. Backblaze verwendet dabei nur Daten von Platten, von denen mindestens 45 StĂŒck gleichzeitig im Einsatz sind – hier gibt es große Unterschiede: mehr als 50 Prozent der Platten sind vom 2013 eingefĂŒhrten Seagate-Typ Desktop HDD 4TB (ST4000DM000), wĂ€hrend von 10 anderen Typen auf der Liste jeweils weniger als 1000 StĂŒck liefen.

Zum Alter der Festplatten zum Zeitpunkt des Ausfalls im ersten Quartal 2016 macht Backblaze keine Angaben; vermutlich hatten die vier defekten WD Red 2TB (WD20EFRX) aber schon mehrere Jahre auf dem Buckel, denn diese Baureihe existiert sein 2012. Diese NAS-Laufwerke von WD zeigten jedenfalls mit 12,57 Prozent "Annual(ized) Failure Rate" (AFR) die höchste Ausfallwahrscheinlickeit, wĂ€hrend die 3-TByte-Version derselben Familie (WD30EFRX) bloß eine AFR von 3,09 Prozent aufwies. Insgesamt waren aber alle WD-Platten bei Backblaze weniger zuverlĂ€ssig als die HGST-Laufwerke der Baureihen Deskstar 5K3000, 5K4000, 7K2000, 7K3000 sowie MegaScale 4000 und MegaScale DC 4000.B – das zeigt auch der Vergleich fĂŒr das Gesamtjahr 2015 [2].

Auch bei den von Backblaze verwendeten Seagate-Laufwerke waren AusfÀlle durchweg wahrscheinlicher als bei den HGST-Modellen.

Backblaze: Ausfallraten von Festplatten (0 Bilder) [3]

[4]

Doch je nach Zeitraum schwanken die AFR-Werte pro Plattentyp deutlich, wie ein genauer Blick auf einzelne Modelle in der Auswertung fĂŒr den Zeitraum Q2/2013 bis Q4/2015 zeigt. FĂŒr diesen Zeitraum hat Backblaze fĂŒr die HGST Deskstar 7K3000 eine AFR von 1,8 Prozent ermittelt, wĂ€hrend der Wert im Q1/16 dann nur noch 0,81 Prozent betrug. Die Daten eines einzelnen Quartals lassen also nur geringe RĂŒckschlĂŒsse auf die Gesamtlebensdauer eines Plattentyps zu.

Es fehlen auch Werte wie die mittlere Lebensdauer zum Zeitpunkt des Ausfalls. In den Daten fĂŒr 2015 nennt Backblaze lediglich ein mittleres Alter aller im jeweiligen Zeitraum noch laufenden Platten eines Typs. Wenig ĂŒberraschend hat die Platte mit der damals höchsten AFR von 10,16 Prozent, die Seagate Barracuda LP 5900 1,5TB (ST31500541AS), auch das höchste Durchschnittsalter, nĂ€mlich mehr als fĂŒnfeinhalb Jahre.

Die AFR-Werte fĂŒr die seltener verwendeten Plattentypen lassen gar keine RĂŒckschlĂŒsse auf die ZuverlĂ€ssigkeit zu. Das zeigt das Beispiel der heliumgefĂŒllten Ultrastar He8 von HGST. FĂŒr sie nennt Backblaze fĂŒr die 2,5 Jahre bis Ende 2015 eine AFR von 4,89 Prozent, im Q1/16 fiel dann aber keine weitere Platte mehr aus. Schaut man genauer hin, betreibt Backblaze seit Anfang 2015 offenbar genau ein (Test?-)System – einen sogenannten Storage Pod, siehe unten – mit der Ultrastar He8, denn darauf deutet das Ende 2015 dafĂŒr genannte mittlere Plattenalter von 10,7 Monaten hin. Wenn aber in einem einzigen Testsystem ĂŒber 14 Monate gerade einmal zwei von 45 Platten ausgefallen sind, dann ist das wohl kaum mehr als anekdotische Evidenz.

Die Annual oder Annualized Failure Rate (AFR) soll darstellen, wie viele Platten anteilig pro Jahr ausfallen. Dazu berechnet Backblaze zunĂ€chst die kumulativen "Drive Days" eines Plattentyps fĂŒr einen gegebenen Zeitraum, etwa die tatsĂ€chliche Betriebszeit aller Platten eines Typs fĂŒr ein Quartal. Bei 1000 stĂ€ndig laufenden Platten ergeben sich daraus vom 1. Januar bis zum 31. MĂ€rz 2016 (91 Tage wegen Schaltjahr!) 91.000 Drive Days. Die darauf bezogene Ausfallrate wird dann aufs Jahr hochgerechnet, also mit (366/91) multipliziert. Die von Backblaze genannten "Drive Days" liegen teilweise höher als das Produkt aus jeweils genannter Plattenzahl und Quartalstagen, aber die Abweichungen sind meistens gering. Vermutlich gibt es eine Ungenauigkeit bei der automatisierten Erfassung der Daten aus den Server- und SMART-Logs.

Backblaze Storage Pod mit SATA-Backplane

In den Storage Pods - hier eine Ă€ltere Version fĂŒr 45 Platten - sitzen SATA-Backplanes mit Port-Multiplier-Chips.

(Bild: Backblaze)

Die Festplattenhersteller geben AFR-Werte in den DatenblĂ€ttern ihrer Laufwerke an, die ĂŒblicherweise zwischen 0,4 und 1 Prozent liegen. Diese Werte gelten aber nur fĂŒr den jeweils angenommenen Einsatzzweck und schließen etwa SchĂ€den durch StĂ¶ĂŸe, Überspannung oder falsche Bedienung nicht ein. Außerdem bleibt die Ausfallwahrscheinlichkeit in der Praxis nicht ĂŒber den gesamten Nutzungszeitraum gleich, sondern liegt gemĂ€ĂŸ der "Badewannenkurve" in der ersten Zeit nach der Inbetriebnahme ĂŒblicherweise höher, fĂ€llt dann ab und steigt nach einigen Jahren Nutzung wieder deutlich an.

Die Messwerte von Backblaze lassen nur mit großen EinschrĂ€nkungen RĂŒckschlĂŒsse auf die Ausfallrate der verwendeten Platten in anderen Einsatzszenarien zu. Backblaze verwendet fĂŒr seine Storage-Server nĂ€mlich vorwiegend billige SATA-Platten, die eigentlich nicht fĂŒr den Einsatz in großen Speichersystemen gedacht sind. Auch die Platten der Baureihe WD Red sind dafĂŒr nicht ausgelegt, sondern fĂŒr NAS-Boxen mit maximal acht Laufwerken. Man geht davon aus, dass die krĂ€ftigen Vibrationen benachbarter Festplatten erheblich zum Verschleiß und letztlich zu frĂŒhen AusfĂ€llen beitragen können. Und Backblaze setzt die SATA-Laufwerke in selbst entwickelten "Storage Pods" ein, die jeweils 45 beziehungsweise 60 der 3,5-Zoll-Laufwerke aufnehmen. Von diesen Storage Pods sind je 10 StĂŒck ĂŒbereinander in Racks montiert, letztlich sitzen also 450 bis 600 Festplatten in einem Schrank.

Backblaze verwendet vor allem 4-TByte-Platten und packt damit bis zu 2,4 Petabyte brutto in ein Rack. Platten mit 6 oder 8 TByte kommen derzeit dort seltener zum Einsatz, weil sich deren Kauf aus Sicht von Backblaze bisher nicht lohnt: Manche sind pro Terabyte gerechnet teurer als die 4-TByte-Laufwerke, außerdem kauft die Firma jeweils große Mengen auf einmal zu möglichst gĂŒnstigen Preisen. Dabei gibt es laut Backblaze-Blog derzeit oft noch Probleme mit der Beschaffung, weil nur wenige HĂ€ndler AuftrĂ€ge ĂŒber mehrere tausend gleicher 6- oder 8-TByte-Disks abwickeln können. Schließlich brauchen die 6- und 8-TByte-Platten mehr Strom als die 4-TByte-Modelle, was Energieversorgung und KĂŒhlung mancher Racks ĂŒberfordert.

Backblaze Storage Pod Rack

Bis zu zehn Storage Pods mit je vier Höheneinheiten passen in ein Rack, also bis zu 600 Festplatten.

(Bild: Backblaze)

Dabei nutzt Backblaze ganz bewusst preiswerte Festplattenmodelle und nicht die teureren "Enterprise"- oder "Nearline Storage"-Varianten der Plattenhersteller. Nach EinschĂ€tzung von Backblaze amortisiert sich deren angeblich höhere ZuverlĂ€ssigkeit nicht. Das GeschĂ€ftsmodell von Backblaze zielt außerdem darauf, Backup- und Cloud-Storage-KapazitĂ€t so billig wie möglich bereitzustellen – da besteht schlichtweg kein Spielraum fĂŒr teurere Disks. Aus diesem Grund entwickelt Backblaze auch die Hardware der Storage Pods selbst [5] und verwendet preiswerte SATA-Adapterkarten im Verbund mit SATA-Port-Multiplier-Backplanes statt teurer SAS-Technik.

Backblaze packt nach eigenen Angaben nur Platten gleichen Typs in einen Storage Pod.

Laut Backblaze sind moderate Ausfallraten von rund 10 Prozent AFR kein großes Problem, weil die Storage-Software diese AusfĂ€lle zuverlĂ€ssig kompensiert. Wenn die Platten billig genug sind, lassen sich höhere Ausfallraten deshalb verschmerzen. Bei den Seagate-Platten hebt Backblaze weitgehend zuverlĂ€ssige Warnungen durch die eingebaute SMART-Überwachung hervor, wodurch sich AusfĂ€lle frĂŒhzeitig ankĂŒndigten. Bei den anderen Herstellern funktioniere das weniger zuverlĂ€ssig.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) ĂŒbermittelt werden. Mehr dazu in unserer DatenschutzerklĂ€rung [6].

WĂ€hrend Backblaze frĂŒher Software-RAID 6 mit Linux-Bordmitteln verwendet hat, kommt mittlerweile ein selbst in Java geschriebener Erasure-Coding-Algorithmus [7] zum Einsatz, der jede Datei in 17 gleich große Teile zerlegt, zusĂ€tzlich drei Blöcke mit redundanten Informationen erzeugt und diese 20 Blöcke ĂŒber mehrere Storage Pods verteilt. So stellt Backblaze sicher, dass die Daten auch verfĂŒgbar sind, wenn ein kompletter Storage Pod ausfĂ€llt. (ciw [8])


URL dieses Artikels:
https://www.heise.de/-3210460

Links in diesem Artikel:
[1] https://www.backblaze.com/blog/hard-drive-reliability-stats-q1-2016/
[2] https://www.backblaze.com/blog/hard-drive-reliability-q4-2015/
[3] https://www.heise.de/bilderstrecke/1814993.html?back=3210460;back=3210460
[4] https://www.heise.de/bilderstrecke/1814993.html?back=3210460;back=3210460
[5] https://www.backblaze.com/blog/open-source-data-storage-server/
[6] https://www.heise.de/Datenschutzerklaerung-der-Heise-Medien-GmbH-Co-KG-4860.html
[7] https://www.backblaze.com/blog/reed-solomon/
[8] mailto:ciw@ct.de