Intels Distributed Asynchronous Object Storage im Test

Der Distributed Asynchronous Object Storage, kurz DAOS, ist Intels Ansatz zum schnellen und redundanten Speichern von Daten in verteilten Umgebungen.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 16 Min.
Von
  • Martin Gerhard Loschwitz
Inhaltsverzeichnis

Unter den zahlreichen Produkten für Software-defined Storage gehört Intels DAOS (Distributed Asynchronous Object Storage) zu den eher unbekannteren Vertretern. Das dürfte zwei Gründe haben. Zum einen hatte Intel DAOS als Storage-Stack speziell für sein Storage Class Memory (SCM) Optane entwickelt, um dessen Performance handhaben zu können. Zum anderen ist DAOS recht jung: 2016 entstand DAOS 0.1. Produktiv nutzbar ist in den Augen der Entwickler erst die Version 2.0 von Ende 2021. Seit der Version 2.6 erlaubt DAOS offiziell den Betrieb mit Metadaten auf regulären SSDs.

Gerade in der jüngeren Vergangenheit hat DAOS sich in vielerlei Hinsicht gemausert, die aktuelle Version 2.6 hat von den grundsätzlichen Designentscheidungen abgesehen nicht mehr allzu viel mit den Versionen der DAOS-1er-Reihe zu tun. Inzwischen erreicht der Storage-Stack regelmäßig Spitzenwerte im IO500-Benchmark und hat vielerorts mittlerweile andere Systeme verdrängt. Heute setzen zahllose Installationen, die zu den schnellsten der Welt nach IO500-Rangliste gehören, auf DAOS. Grund genug, sich DAOS einmal anzusehen.

iX-tract
  • DAOS ist Intels Open-Source-Ansatz für Software-defined Storage, der die Vorteile moderner Speicher- und Netzwerktechnik perfekt ausnutzen soll.
  • DAOS besteht aus einem Objektspeicher, der sich als File-, Block- oder Objekt-Storage, aber auch als Speicher für Hadoop oder Apache Spark verwenden lässt.
  • Zwar setzte DAOS ursprünglich Intel-PMem-Speicher voraus. Nach dessen Abkündigung haben die DAOS-Entwickler die Software aber so umgebaut, dass sie künftig auch mit normalem DRAM funktioniert.
  • Durch asynchrone Replikation vermeidet DAOS Latenzen; durch diverse moderne Kernel-Techniken wie SPDK und DPDK erhöht DAOS weiter die Performance.
  • Die Einrichtung ist vergleichsweise komplex; weil das Werkzeug noch nicht sehr alt ist, ist auch die Integration in Linux-Distributionen in Teilen noch immer eine Herausforderung.

DAOS war ursprünglich keine Eigenentwicklung von Intel. 2012 verleibte man sich den damaligen Anbieter Whamcloud ein, der an einem versatilen Storage-Stack für die eigene Plattform gearbeitet hatte, dem heutigen Urahn und technischen Fundament von DAOS. Das Ziel: einen extrem leistungsfähigen POSIX-kompatiblen Speicher fürs HPC (High-Performance Computing) zu entwickeln. Die ersten Gehversuche nutzten LustreFS und ZFS, boten aber schon eine eigene API für die Steuerung. 2015 bekam der Stack erweiterte Replikation und Selbstheilungsfeatures und wurde damit explizit redundant.

Das war die Leseprobe unseres heise-Plus-Artikels "Intels Distributed Asynchronous Object Storage im Test". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.