Freie InfiniDB erweitert MySQL um Datawarehouse-Technik

Das fest mit MySQL integrierte InfiniDB-Backend verwaltet Daten spaltenorientiert und soll dadurch analytische Anwendungen im Terabyte-Bereich ermöglichen.

In Pocket speichern vorlesen Druckansicht 20 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Christian Kirsch

Mit der in Version 1.0 von der texanischen Firma Calpont veröffentlichten InfiniDB gibt es ein weiteres Produkt, das die freie Datenbank MySQL für analytische Aufgaben wie Datamining und Business Intelligence aufrüstet. Kernstück von InfiniDB ist ein Backend ("Engine"), das die Daten spaltenorientiert verwaltet. Die nötige MySQL-Datenbank 5.1.39 ist fest mit dem Backend verbunden. Da es weder im Quellcode noch in der InfiniDB-Dokumentation Hinweise auf andere Storage Engines gibt, scheint es sich um eine beschnittene Variante zu handeln.

InfiniDB ist im modifizierten TPC-H-Benchmark schneller als andere freie spaltenorientierte Datenbanken.

(Bild: mysqlperformanceblog.com)

InfiniDB verwendet eine Multi-Thread-Architektur und soll dadurch Multi-Core-CPUs besser ausnutzen können. Mit einem eigenen Loader will es das Lesen großer Datenmengen bis in den Terabyte-Bereich gegenüber der MySQL-Technik deutlich beschleunigen. SQL-Befehle wie UPDATE und INSERT stehen ebenso zur Verfügung wie ALTER TABLE. Durch den Verzicht auf Indizes soll die Datenbank diese Kommandos in vielen Fällen schneller ausführen als das klassische MySQL. Außerdem bietet InfiniDB Transaktionen und Multi-Version Concurrency Control (MVCC), was das Blockieren von Lesezugriffen beim gleichzeitigen Ändern der Daten vermeidet.

Der MySQL-Performance-Blog sieht InfiniDB in einem modifizierten TCP-H-Benchmark gegen die ebenfalls freien spaltenorientierten Datenbanken Infobright, LucidDB und MonetDB mit großem Abstand vorn. Das gleichfalls um MySQL herum gebaute kommerzielle Kickfire taucht dort nicht auf.

Neben der unter der GPL2 stehenden Community Edition, die es als Quellcode und Binärversion für diverse Linux-Derivate gibt, bietet Calpont eine Enterprise-Ausgabe an. Diese Variante erlaubt den gleichzeitigen Einsatz mehrere Server. Die Preise dafür beginnen bei rund 12.000 US-Dollar. (ck)