Freie Datenbanken im Unternehmenseinsatz: Ein Vergleich

Seite 5: Freie Datenbanken im Unternehmenseinsatz: Ein Vergleich

Inhaltsverzeichnis

Die bislang diskutierten Features sind vor allem in der klassischen Datenverarbeitung interessant, dem Online Transactional Processing (OLTP). Mit immer besseren Möglichkeiten zur Datenerfassung und -speicherung steigt jedoch auch der Bedarf an Lösungen zur Analyse dieser Daten (Online Analytical Processing, OLAP). Dies geschieht mittels so genannter Business-Intelligence-Software, die auf Daten in einem Data Warehouse zugreift. Dabei handelt es sich um eine Datenbank, deren Schema speziell für diesen Einsatz optimiert wird.

Es gibt keine bekannte Fallstudie für den Einsatz von MaxDB oder Firebird im Rahmen eines Data Warehouse. Dasselbe gilt für Ingres, jedoch wird diese Datenbank im Rahmen der DATAllegro Data Warehouse Appliance eingesetzt. MySQL hingegen ist in dem Markt präsent. So nutzt beispielsweise der O'Reilly-Verlag das System im Rahmen einer selbstentwickelten Data-Warehouse-Lösung. Die Business-Intelligence-Anbieter Business Objects und Hyperion (Essbase) unterstützen den Einsatz von MySQL mit ihren Produkten.

Besonders interessant ist jedoch, dass im letzten Jahr komplette Open Source Business Intelligence Software Stacks entstanden sind, also Projekte, die mehrere Open-Source-Anwendungen zusammenfassen, um komplette Business-Intelligence-Lösungen anzubieten. Eines dieser Projekte ist Bizgres. Es enthält die Bizgres-Datenbank (ein um OLAP-Funktionalitäten erweitertes PostgreSQL), das Bizgres Toolkit (KETL für den Extraction-Transformation-Load-Prozess, Mondrian/JPivot für multidimensionale Analyse, JasperReports für Reporting und OpenI als Framework) und Bizgres Clickstream, eine komplette Beispielapplikation zur Analyse von Log-Daten.

Es ist nicht möglich, im Rahmen eines allgemeinen Vergleichs der Datenbanken einen eindeutigen Sieger zu benennen. Alle fünf vorgestellten Open-Source-Datenbanken bieten einen Funktionsumfang, der ihren Einsatz in großen Unternehmens-Anwendungen rechtfertigt. Dabei hat jedoch jedes System seine Stärken und Schwächen, und welche Datenbank die richtige für einen konkreten Anwendungsfall ist, hängt in erster Linie von den Anforderungen des jeweiligen Szenarios ab.

MySQL und PostgreSQL haben in den letzten Versionen Funktionserweiterungen erhalten, welche den Einsatz in anspruchsvollen Unternehmens-Anwendungen ermöglichen. Damit verwischen sich auch die Unterschiede zwischen diesen beiden Datenbanken: Lange hielt sich das Vorurteil, MySQL sei zwar schnell, aber es mangele an Funktionen, während PostgreSQL über anspruchsvolle Features verfüge, aber langsam sei. Nun hat MySQL mit der Version 5.0 im Bereich der anspruchsvollen Features entscheidend aufgeholt, während PostgreSQL schon lange wesentliche Performance-Gewinne zu verzeichnen hat.

MySQL verbindet eine aktive Community und eine riesige Nutzer-Basis mit der Unterstützung und dem Marketing eines kommerziellen Unternehmens. Während der bisherige Erfolg sich hauptsächlich aus dem Einsatz in Web-Anwendungen speiste, bringt die Version 5 Funktionen mit, die MySQL auch für anspruchsvollere Szenarien qualizieren. Unklar ist bisher, welche Auswirkungen sich aus dem Kauf von Innobase (und damit des InnoDB-Tabellentyps) durch Oracle ergeben.

PostgreSQL verfügt über einen enormen Funktionsumfang und legt großen Wert auf Standardkonformität. Der Entwicklungsprozess vollzieht sich ausschließlich im Rahmen der Open-Source-Community. Nichtsdestotrotz gibt es eine Reihe von Unternehmen, die professionellen Support für PostgreSQL anbieten. Einigen fehlenden Features im Bereich der Skalierbarkeit und Hochverfügbarkeit weist die Roadmap hohe Priorität zu. Daneben ist zu bemerken, dass PostgreSQL im Rahmen der Bizgres-Distribution die einzige Open-Source-Datenbank ist, die einen Business Intelligence Stack für den Einsatz im Data Warehouse-Bereich anbietet.

Firebird, Ingres und MaxDB verfügen über eine lange Geschichte im kommerziellen Bereich und versuchen sich nun mit wechselndem Erfolg daran, in die Open-Source-Softwareentwicklung und -Vermarktung einzusteigen.

Firebird ist es gelungen, sich als Open-Source-Projekt eigenständig weiterzuentwickeln, nachdem Borland den InterBase-Code nach einem kurzen Ausug in die Open-Source-Welt wieder schloss. Die Community wächst, die Datenbank verfügt über eine loyale Nutzerbasis und die Weiterentwicklung des Codes wird vorangetrieben. Als Schwachstellen sind derzeit noch die geringe Dokumentation zu nennen sowie die unzureichenden Fähigkeiten des Systems in Bezug auf Hochverfügbarkeit und Skalierbarkeit. Aber das Projekt hat Schwung und eine klare Roadmap, sodass die kommenden Versionen diese Probleme angehen werden.

Ingres lässt kaum Wünsche offen, was Funktionen, Skalierbarkeit und Stabilität anbelangt. Leider wurde die Software lange Jahre vom Anbieter Computer Associates (CA) vernachlässigt, kaum weiterentwickelt und schlecht vermarktet. Der Verkauf an die Investoren von Garnett & Helfrich Capital sowie der Versuch, seit letztem Jahr eine Open-Source-Community um das System aufzubauen, könnten dies ändern und Ingres wieder zu einer ernst zu nehmenden Größe im Datenbank-Markt machen.

SAP DB ist zwar schon seit 2000 Open Source, zog aber dennoch wenig Aufmerksamkeit auf sich. Erst als MySQL 2003 begann, das System als MaxDB zu vermarkten, wuchs das öffentliche Interesse. Die Weiterentwicklung der Datenbank geschieht jedoch weiterhin ausschließlich innerhalb der SAP AG, die nur geringes Interesse für eine Anbindung an die Open-Source-Community zeigt. Da auch keine öffentliche Roadmap vorliegt, ist unklar, ob und wann die fehlenden Funktionen angegangen werden.

Für die nächsten Jahre ist bei MySQL und PostgreSQL eine Konsolidierung auf hohem Niveau zu erwarten, während die Entwicklung der Open-Source-Newcomer Ingres, Firebird und MaxDB spannend bleibt. Die kommenden Themen im Datenbank- Bereich sind OLAP-Fähigkeiten, XML-Unterstützung und die performante Verarbeitung sehr großer Datenmengen (Very Large Databases). Die Zukunft der Open-Source-Datenbanken wird davon abhängen, inwiefern sie innovative Lösungen in diesen Bereichen anbieten können. (odi)


Lizenzen

Firebird: Interbase Public License (IPL), ähnlich Mozilla Public License 1.1

Ingres: Computer Associates Trusted Open Source License 1.1 (CATOSL), von der OSI als Open-Source-Lizenz anerkannt

MaxDB: Duale Lizenzierung (General Public Licence (GPL) und kommerziell)

MySQL: Duale Lizenzierung (General Public Licence (GPL) und kommerziell)

PostgreSQL: BSD-Lizenz

Jutta Horstmann bietet mit ihrer Firma Data in Transit IT-Dienstleistungen rund um Open-Source-Software an und ist technische Projektleiterin des Portals OpenUsability.org. (odi)