c't 19/2023
S. 110
Wissen
Selbstheilendes Speichersystem

Speichergigant

Seagate Corvault speichert 2,3 Petabyte mit Selbstheilung

Das Speichersystem Corvault von Seagate fasst über hundert 20-TByte-Festplatten, was zu einer Gesamtkapazität von mehr als zwei Petabyte führt. Bei einem Laufwerksdefekt prüft das System, ob es intakte Teile weiternutzen kann. Das soll den Wartungsaufwand enorm vermindern.

Von Lutz Labs

Wer richtig viel Speicherplatz braucht, kauft keine einzelnen Festplatten, sondern ein Speichersystem. Solche gibt es von verschiedenen Herstellern, auf den ersten Blick unterscheiden sie sich vor allem durch Kapazität und Preis. Seagate bewirbt sein Corvault-System mit einer besonders hohen Ausfallsicherheit. Wir haben uns die Technik dahinter genauer angeschaut.

Das Corvault ist ein Rackeinschub mit etwa 18 Zentimetern Höhe, meistens als vier Höheneinheiten (4 HE) bezeichnet. Darin stecken dicht aneinander 106 Festplatten aus der Exos-Reihe, Netzteile sowie die Ansteuerelektronik. Der Host-Computer ist über eine Mehrfach-SAS-3-Verbindung angeschlossen, die netto bis zu 17,6 GByte/s überträgt.

Von diesen 106 Platten werden mit hoher Wahrscheinlichkeit im Lauf der fünfjährigen Garantie einige ausfallen. Dann kommt normalerweise ein Techniker, um das defekte Laufwerk durch ein frisches zu ersetzen, den Rest regelt die Storage-Software. Dieser manuelle Austausch entfällt beim Corvault.

Zu einem Wechsel führt nach Angaben von Seagate meistens der Defekt eines Kopfes oder der Oberfläche einer Scheibe. Da in einer 20-TByte-Festplatte jedoch 10 Scheiben und 20 Köpfe arbeiten, ist eine solche Festplatte nicht komplett defekt, sondern meist nur zu 5 Prozent.

Defektmanagement

Bei Exos-Platten ab 18 TByte hat Seagate die neue Selbstheilungstechnik Autonomous Drive Regeneration (ADR) in die Firmware gebaut. Bei einem Defekt nimmt der Storage-Controller des Corvault eine solche Platte vorübergehend aus dem Pool. Sie testet dann ihre Komponenten durch und meldet ihre Restkapazität. Daraufhin nimmt der Controller die Festplatte wieder in den Pool auf.

Die Storage-Software bindet anschließend den fehlenden Speicher über eine Reserveplatte ein und stellt die Daten aus der Redundanz wieder her. Da die Daten des Racks per Erasure Coding, bei Seagate Autonomic Distributed Allocation Protection Technology (ADAPT) genannt, über alle Laufwerke verteilt sind, ist ein Datenverlust unwahrscheinlich. Der Rebuild dauert durch die deutlich kleinere zu prüfende Datenmenge nur noch wenige Stunden statt einiger Tage oder gar Wochen.

Testlauf

Wir hatten die Gelegenheit, mit der Hilfe eines Seagate-Ingenieurs einige Messungen an dem System vorzunehmen. Die Anbindung des Servers per SAS erwies sich dabei als Bremse: Mehr als 7,5 GByte/s konnten wir aus dem System nicht herausholen, der Ingenieur vermutete, dass das System nicht über ausreichend Verbindungen zum Host verfügte. Laut Datenblatt erreicht das System beim Lesen bis zu 14 GByte/s und beim Schreiben 12 GByte/s.

Bei Zugriffen auf zufällige Adressen schafften wir ohne jegliche Optimierungen mehr als 70.000 IOPS (Input/Output operations Per Second), allerdings half dabei der Cache des Controllers enorm. Seagate verspricht beim Lesen 17.680 IOPS, die wir nach Abschalten des Caches dann auch knapp erreichten. Das ist zwar nicht so rasant wie eine moderne SSD, aber immer noch weit schneller als herkömmliche Plattenarrays.

Kostenfrage

Preise für ein einzelnes Rack werden bei solchen Konfigurationen im Allgemeinen nicht veröffentlicht. Mit rund 30 US-Dollar pro TByte Speicherplatz sollten Kunden aber rechnen, das von uns getestete System würde also mehr als 60.000 Dollar kosten. Die Kosten für ein klassisches JBOD-System liegen in der gleichen Größenordnung, im laufenden Betrieb aber dürfte das Corvault durch die geringere Wartungsanfälligkeit weniger Servicekosten verursachen.

Seagate hat die Reisekosten des Autors übernommen. (ll@ct.de)

Kommentieren