Freie Datenbank PostgreSQL bekommt spaltenorientierte Engine

Für die Analyse großer Datenmengen bringt das spalten- gegenüber dem zeilenorientierten Speichern Geschwindigkeits- und Platzgewinne. Die von Citusdata entwickelte Erweiterung steht unter der Apache-Lizenz.

In Pocket speichern vorlesen Druckansicht 19 Kommentare lesen
Lesezeit: 1 Min.
Von
  • Christian Kirsch

Mit einer externen Erweiterung können Anwender der freien relationalen Datenbank PostgreSQL Daten spaltenorientiert ablegen und darauf mit den üblichen SQL-Kommandos zugreifen. Die Software wurde von Citusdata entwickelt und steht auf github für Linux und OS X zum Herunterladen zur Verfügung.

Die Erweiterung nutzt das Foreign-Table-Konzept von PostgreSQL, das den in MySQL verwendeten Engines ähnelt. Dadurch können Entwickler die konkrete Datenspeicherung von der Abfrageschicht entkoppeln. Auf Foreign Table greifen Anwendungsprogrammierer genauso zu wie auf die klassischen, PostgreSQL-eigenen. Deshalb ist es auch möglich, Daten aus beiden Tabellentypen per JOIN zu kombinieren.

Mit spaltenweise gespeicherten Daten soll PostgreSQL den TPC-H-Benchmark doppelt so schnell absolvieren.

(Bild: citusdata.com)

Üblicherweise legen relationale Datenbanken ihre Tabellen zeilenweise auf der Platte ab. Für viele OLAP-Anwendungen (Online Analytical Processing) hat sich jedoch das spaltenorientierte Speichern als günstiger erwiesen: Es verkürzt etwa bei Aggregatfunktionen wie SUM, die alle oder die meisten Werte einer Spalte verarbeiten, die Laufzeit wesentlich. Außerdem lassen sich die Daten spaltenweise besser komprimieren, was Plattenplatz spart. So soll PostgreSQL den TPC-Benchmark mit der Erweiterung von Citusdata etwa doppelt so schnell ausführen wie ohne und die Plattenzugriffe sinken auf bis zu einem Zehntel.

Siehe dazu auch: