Pivotals Greenplum jetzt als Open Source verfügbar

Acht Monate nachdem Pivotal angekündigt hatte, die Quellen seiner Big-Data-Suite nach und nach offenzulegen, veröffentlichte das Unternehmen das Data Warehouse Greenplum unter der Apache-2-Lizenz.

In Pocket speichern vorlesen Druckansicht
Pivotals Greenplum jetzt als Open Source verfügbar
Lesezeit: 1 Min.
Von
  • Rainald Menge-Sonnentag

Im Februar hatte Pivotal angekündigt, wichtige Kernkomponenten seiner Big-Data-Suite als Open-Source-Software zu veröffentlichen. Im April wurde das Unternehmen Platin-Sponsor der Apache Software Foundation (ASF) und veröffentlichte die Quellen von Geode, dem Kern der In-Memory-Datenbank Gemfire. Jetzt hat das Unternehmen auch das Data Warehouse Greenplum als Open Source freigegeben. Die Greenplum Database ist auf PostgreSQL aufgebaut und als MPP-Datenbank (Massively Parallel Processing) auf große Datenmengen ausgelegt.

Ein Greenplum-Cluster besteht aus einem Master-Server und mehreren Segment-Servern. Alle Server teilen sich dasselbe Schema. Die zu analysierenden Daten liegen in den verschiedenen Segmenten, während der Master nur Metadaten verwaltet. Benutzer führen ihre Abfragen über den Master durch, der sich um die Verteilung auf die einzelnen Segmente kümmert.

Von der Offenlegung der Quellen dürfte sich das aus VMware hervorgegangene Pivotal auch Rückenwind im Wettbewerb mit anderen MPP-Datenbanken wie Teradata und IBM Netezza versprechen. Interessierte Anwender können Greenplum auf GitHub herunterladen. Das Projekt steht unter der Apache-2-Lizenz. (rme)