Datenarchitektur: DuckLake vereint Katalog und Tabellenmetadaten

Mit der Spezifikation DuckLake und deren Implementierung eines Lakehouse-Formats treten die DuckDB-Macher gegen OpenTable-Formate wie Iceberg und Co. an.

Artikel verschenken

2

09.07.2025, 10:00 Uhr

Lesezeit: 12 Min.

iX Magazin

Von

Matthias Niehoff

Datenarchitektur: DuckLake vereint Katalog und Tabellenmetadaten
- Blob Storage als Basis aller Data Lakes
Ein Katalog für viele Tabellen und eine Datenbank für alle Metadaten
Implementierungen bringen Spezifikationen zum Leben
Der DuckLake-Vorstoß

Artikel in iX 8/2025 lesen

Mit dem Fokus auf Datenanalyse und OLAP-Workloads hat DuckDB Labs die SQL-Datenbank DuckDB als leichte und weniger komplexe Alternative zu etablierten Werkzeugen wie Apache Spark oder pandas entwickelt. Künftig sollen Lakehouse-Formate wichtiger werden, verkündete DuckDB Anfang des Jahres auf seiner Entwicklerkonferenz DuckCon. Viele Anwenderinnen und Anwender von DuckDB erwarteten daraufhin eine bessere Unterstützung für Apache Iceberg und Delta – insbesondere für das Schreiben und nicht nur Lesen.

Stattdessen kündigte DuckDB Labs mit DuckLake aber eine komplett neue Spezifikation inklusive Implementierung eines Lakehouse-Formats an – und damit eine direkte Konkurrenz zu Iceberg und Co..

DuckLake unterstützt die Trennung von Datenverarbeitung und -speicherung – für einfachere Skalierung.
Für schnelle Metadatenzugriffe per SQL-Abfrage greift DuckLake auf Datenbanken wie DuckDB oder PostgreSQL zurück.
DuckLake tritt mit einer einfachen, skalierbaren Architektur gegen OpenTable-Formate wie Apache Iceberg und Delta an.

Im Kern legt die Spezifikation fest, alle Metadaten eines Lakehouse in einer relationalen Datenbank und die eigentlichen Daten wie üblich in einem Blob/Object Store zu speichern. Das Speichern in der relationalen Datenbank soll sowohl Performancevorteile bieten als auch den Weg für neue Funktionen eröffnen.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Was die Voraussetzungen für den Kaltstart eines Rechenzentrums sind

Für den RZ-Neustart nach einem Totalausfall muss die Infrastruktur auf den Ernstfall vorbereitet werden. Dabei hilft das Site Reliability Engineering.

Eigene Wetterstationen liefern lokales Wetter

Wetterstationen für Garten und Balkon mit iPhone-Anbindung im Test

Eigene Wetterstationen messen Temperatur, Luftfeuchtigkeit und mehr vor Ort und liefern die Werte ans iPhone. Wir haben 7 Stationen mit Außensensor getestet.

Kaltstart eines Rechenzentrums: Die Vorarbeiten

Wer seine IT-Infrastruktur schnell wieder hochfahren will, muss sie zuvor automatisiert haben. Das verändert hauptsächlich die Art zu administrieren.

Amazon Echo Studio im Test: Smart Speaker mit Heimkino-Modus

Bei der Neuauflage des Amazon Echo Studio lassen sich bis zu fünf dieser vernetzten Lautsprecher (und ein Subwoofer) zu einem Heimkinosystem zusammenschließen.

Analyse: Probleme der deutschen Energiewende und wie sie sich lösen ließen

Der hohe Anteil an wetterabhängiger Stromerzeugung erzeugt ungewöhnliche Probleme. Zum Glück gibt es jeweils Lösungen, die der Markt schon aufdrängt.

Elektro-Kleinwagen Cupra Raval: Mehr Dynamik zum Einstieg

Der Cupra Raval ist die dynamischere Variante der günstigen Elektro-Einstiegsmodelle VW ID. Polo und Skoda Epiq – sogar ein Sportmodell hat Cupra angekündigt.