So funktioniert ArcticDB: Vom Dataframe zur Hochleistungsdatenbank

Für riesige Datenmengen braucht man andere Lösungen als klassische Datenbanken. Wir erklären, wie ArcticDB effizient Datenreihen in Python speichert.

Artikel verschenken

2

02.03.2026, 07:00 Uhr

Lesezeit: 14 Min.

iX Magazin

Von

Dr. Fabian Deitelhoff

So funktioniert ArcticDB: Vom Dataframe zur Hochleistungsdatenbank
- Architekturansätze und Unterschiede
Spaltenbasierte Speicherung und Segmentierung
Versionierung und Zeitreisen
Native pandas-Integration und API am Beispiel
Datensätze für das Update
Indizes, Schemaflexibilität und Abfragen
Fazit

Data-Scientists sind häufig mit enormen Mengen an Zeitreihendaten konfrontiert, beispielsweise bei der quantitativen Analyse. Um diese Herausforderung zu meistern, entwickelte die Man Group, ein britischer Finanzdienstleister, eine eigene, Dataframe-zentrierte Datenbank: ArcticDB. Das Besondere: Das System speichert pandas-Dataframes spaltenorientiert und stellt jede Änderung als neue Version bereit. Durch diese Art der Speicherung, unveränderliche (immutable) Versionierung und native pandas-Integration erleichtert ArcticDB den Umgang mit riesigen Datensätzen.

Klassische Datenbanken und Dateiformate stoßen beim Verarbeiten riesiger Datenmengen an ihre Grenzen.
Die Open-Source-Datenbank ArcticDB ist speziell für Big Data und High-Performance Computing konzipiert: Sie speichert spaltenbasiert statt zeilenweise, nutzt Versionierung sowie Append-Streaming und integriert pandas nativ.
Alternative Produkte wie ClickHouse, TimescaleDB und InfluxDB oder Formate und Techniken wie Apache Parquet und Delta Lake haben eine andere Ausrichtung. Sie verwenden SQL und klassische Time-Series-Konzepte.

Dr. Fabian Deitelhoff ist IT-Leiter Head of Software Development und Head of Product bei der Education Partners GmbH. Zudem ist er als Autor, Dozent und Softwareentwickler tätig.

Herkömmliche Dateiformate und Data-Warehouse-Systeme reichen nicht immer aus, um Dataframes mit Milliarden Zeilen effizient zu verarbeiten. Das Konzept von ArcticDB stellt Dataframes in den Mittelpunkt des Datenmodells (siehe Artikel „Our Journey Creating ArcticDB: Solving the Challenge of Dataframes at Scale“ von William Dealtry, einem der Hauptentwickler von ArcticDB). Zwei Ideen sind dabei zentral: günstiger Cloud-Speicher und Immutabilität. Statt Daten nachträglich zu ändern, erzeugt ArcticDB bei jeder Schreiboperation eine neue Version, was Skalierung und Zeitreisen ermöglicht. Daraus leiten sich die Kerneigenschaften des Datenbanksystems ab:

pandas in, pandas out: Die Python-API arbeitet direkt mit Dataframes und verzichtet auf SQL.
Serverlos und unveränderlich: ArcticDB läuft als Embedded-Engine auf dem Client, nutzt Objektspeicher (S3, LMDB) und speichert Daten als unveränderliche Versionen.
Spaltenorientiert und leistungsfähig: Die Datenbank nutzt spaltenbasierte, komprimierte Segmente, um sehr große Dataframes schnell zu lesen und zu schreiben. Persistente Strukturen schützen ältere Versionen vor Beschädigung.

Die genannten Prinzipien bestimmen Architektur, API und Anwendungsfälle.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Kaltstart eines Rechenzentrums: Die Vorarbeiten

Wer seine IT-Infrastruktur schnell wieder hochfahren will, muss sie zuvor automatisiert haben. Das verändert hauptsächlich die Art zu administrieren.

Mann und Frau, die zwischen MSCI World, FTSE All-World und S&P 500 wählen

Den passende Basis-ETF finden: Es muss nicht immer der MSCI World sein

Wir stellen Alternativen zum MSCI World vor, die sich als Basis fürs Portfolio eignen – darunter den FTSE All-World und einen Welt-Index ohne US-Unternehmen.

Apple MacBook Neo im Test: schick, rasant – und günstig

Das MacBook Neo hat einen Smartphone-Prozessor, fährt aber trotzdem Kreise um Windows-Notebooks mit x86-CPUs: Im Mainstream sind neue Zeiten angebrochen.

DIY-Wärmepumpe: Wie man als Hobby-Handwerker 10.000 Euro spart

Wie ein Hausbesitzer seine Wärmepumpe selbst einbaute, 10.000 Euro sparte und welche Hürden er dabei meistern musste – ein Videobeitrag.

Elektroautos und Plug-in-Hybride: Das unterschätzte AC-Laden

Rasantes DC-Laden wird plakativ beworben, doch in der Praxis spielt AC-Laden meist eine größere Rolle. Welche Fallstricke gibt es beim Laden an Wechselstrom?

Ein glänzendes, blau-grünes Quadrat mit der Zahl "26.4." auf einem blauen Hintergrund, umgeben von einem sanften Lichteffekt.

21 Tipps zu iOS 26.4: Akku-Limit, Untertitel, Ambient-Widget und mehr

Apple geht mit Systemversion 26.4 Problempunkte an und ergänzt nützliche Features. 21 Tipps zu den Neuerungen, die im Alltag auf iPhone, iPad und Mac zählen.