Petabyte-Festplatten mit Selbstheilungskräften

Das Speichersystem Exos Corvault von Seagate fasst mehr als zwei Petabyte und soll wartungsfrei laufen. Wir haben hinter die Kulissen geschaut.

In Pocket speichern vorlesen Druckansicht 64 Kommentare lesen
Lesezeit: 5 Min.
Von
  • Lutz Labs

Wer wirklich große Mengen an Speicherplatz braucht, kauft keine einzelnen Festplatten, sondern ein Speichersystem. Seagate hat unter anderem das Corvault im Angebot, es bietet aktuell mehr als 2,1 Petabyte Speicherplatz in einem Rackeinschub mit 4 Höheneinheiten (4 HE), also knapp 18 Zentimetern. 106 Server-Festplatten aus der Exos-Reihe mit einer Speicherkapazität von 20 TByte rotieren darin.

Von diesen 106 Festplatten würden im Lauf der fünfjährigen Garantie normalerweise einige ausfallen. Dann käme ein Techniker, um das defekte Laufwerk durch ein frisches zu ersetzen, den Rest regelt die Storage-Software. Dieser Austausch soll beim Corvault nur in Ausnahmefällen notwendig sein, weil es Selbstheilungsfunktionen hat.

Der Corvault-Rackeinschub benötigt ein Rack mit einer Tiefe von mehr als einem Meter. Die Schublade mit den Festplatten wiegt mehr als 100 Kilogramm – und lässt sich trotz guter Lagerung nur schwer aus dem Rack herausziehen.

Auf einem Presseworkshop in Amsterdam gab Seagate einige Details dazu bekannt. Der häufigste Fehler, der normalerweise zu einem Plattentausch führt, ist der Defekt eines Kopfes oder der Oberfläche einer Scheibe (Platter). Da in einer 20-TByte-Festplatte jedoch 10 Scheiben und 20 Köpfe arbeiten, ist eine solche Festplatte nicht komplett defekt, sondern nur zu 5 Prozent – der Rest, also 19 TByte, lässt sich weiterverwenden.

Bei einem Defekt nimmt der Storage-Controller die Festplatte aus dem Pool heraus, diese testet alle Komponenten durch und meldet dem Controller dann die nun verfügbare Kapazität; die Storage-Software, die auf zwei redundanten Hardware-Controllern mit SAS-Ausgängen läuft, nimmt die Festplatte wieder in den Pool auf. Diesen Vorgang bezeichnet Seagate als Autonomous Drive Regeneration (ADR) oder Selbstheilung, mit weniger Marketing-Sprech könnte man den Vorgang als Erhalt der nicht-defekten Kapazität einer Festplatte bezeichnen.

Da die Daten per Erasure Coding über alle Laufwerke verteilt sind, ist ein Datenverlust recht unwahrscheinlich. Im Seagate-Jargon nennt sich die Technik Autonomic Distributed Allocation Protection Technology (ADAPT). Die Storage-Software bindet sodann ein Terabyte einer Reservefestplatte ein und stellt die Daten aus den redundant gespeicherten wieder her.

Eine Reserve von nur einer 20-TByte-Festplatte reicht demnach aus, um 20 Defekte von Plattenoberflächen oder Köpfen zu auszugleichen. Weiterhin dauert der Rebuild nach einem Plattendefekt durch die deutlich verminderte Datenmenge nur noch wenige Stunden statt einiger Tage oder gar Wochen.

Angaben zur Häufigkeit anderer Fehler wollte Seagate auf Nachfrage nicht machen, der Ausfall eines Kopfes oder zu viele Fehler auf der Oberfläche einer Scheibe seien jedoch sehr häufig. Die ADR-Technik ist aktuell in Exos-Festplatten ab 18 TByte Speicherplatz implementiert. In einer zweiten Generation soll bei einem Defekt nicht mehr die gesamte Festplatte aus dem Pool verschwinden, sondern nur der defekte Teil. Zudem soll die Kapazität der Festplatten in den nächsten Jahren deutlich steigen: Mittels Heat Assisted Magnetic Recording will Seagate 2026 Laufwerke mit 50 TByte Speicherplatz anbieten, damit würde die Gesamtkapazität des 4HE-Rackeinschubs auf 5,3 PByte steigen.

Wir hatten die Gelegenheit, mit der Hilfe eines Seagate-Ingenieurs einige Messungen an dem System laufen zu lassen. Die Anbindung des Servers per SAS erwies sich dabei als Bremse, vermutlich war nur einer der beiden Storage-Controller mit dem Server verbunden: Mehr als 7,5 GByte/s konnten wir aus dem System nicht herausholen. Laut Datenblatt erreicht das System beim Lesen bis zu 14 GByte/s, beim Schreiben sind es noch 12 GByte/s.

Auch bei Zugriffen auf zufällige Adressen erinnern die Messungen eher an eine flotte SSD als an ein Festplattensystem: Beim Lesen mit Iometer erreichten wir ohne jegliche Optimierungen mehr als 70.000 IOPS – allerdings spielte dabei der Cache des Controllers eine wesentliche Rolle. Seagate verspricht 17.680 IOPS.

Preise für ein einzelnes Rack werden bei solchen Konfigurationen im Allgemeinen nicht veröffentlicht. Seagate-Manager John Voss sagte im Gespräch mit heise online, dass Kunden mit etwa 30 US-Dollar pro TByte rechnen könnten. Dabei liegt der Preis seinen Angaben zufolge sogar unter dem eines traditionellen JBOD-Systems ohne ADR-Technik.

Eine Kostenersparnis sieht Seagate zudem vor allem im Betrieb des Systems. Da der unregelmäßige Austausch defekter Festplatten entfalle, seien die Kosten für die Servicetechniker deutlich geringer als bei einem traditionellen RAID-System.

Zu guter Letzt entsteht durch die Wiederherstellung der guten Kapazität weniger Elektroschrott, weil die Laufwerke ja nicht ausgetauscht werden müssen und zugleich eine geringere CO2-Belastung, weil insgesamt weniger Laufwerke benötigt werden.

Disclaimer: Seagate hat die Reise- und Übernachtungskosten des Autors übernommen. (ll)