Big Data: HBase 1.0 erschienen

Die Hadoop-Datenbank schlechthin hat nach rund sieben Jahren Entwicklung den für Open-Source-Projekte wichtigen Schritt hin zu einer Version 1.0 vollzogen.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
HBase 1.0
Lesezeit: 2 Min.
Von
  • Alexander Neumann

Mit HBase hat ein weiteres Big-Data-Projekt der Apache Software Foundation den Sprung auf die Version 1.0 vollzogen. HBase ist eine verteilte Datenbank, die nach dem Prinzip von Googles BigTable-Technik arbeitet, vorrangig im Kontext von Hadoop- und HDFS-Anwendungen (Hadoop File System) zum Einsatz kommt und deswegen auch als die Datenbank schlechthin für das Big-Data-Framework bezeichnet wird.

Im Gegensatz zu einigen anderen NoSQL-Datenbanken bietet HBase eine mit relationalen Datenbanken vergleichbare starke Konsistenz an. HBase ist insbesondere für den Einsatz in Cluster-Umgebungen geeignet, da es für die Speicherung der Daten die Funktionen des verteilten Hadoop-Dateisystems HDFS verwendet. Die beachtlichen Performancewerte bei Schreib- und Leseoperationen, die unter anderem die sortierte Ablage und den damit verbundenen schnellen Index-Zugriff auf die Daten ermöglichen, führten zum Einsatz von HBase in Systemen bei etwa Facebook, eBay, Salesforce und Yahoo, die bekanntlich große Datenmengen verarbeiten müssen.

Mit der Freigabe einer Version 1.0 wollen die Entwickler zum Ausdruck bringen, dass die Datenbank nach rund sieben Jahren Entwicklung mittlerweile einen hohen Reifegrad besitzt. Seit der Freigabe der letzten Version 0.98 vor etwa einem Jahr sind offenbar mehr als 1500 Änderungen in HBase eingezogen. Das hat anscheinend zu einem besseren Verhalten geführt, ohne dass darunter die Stabilität der Datenbank hat leiden müssen. Darüber hinaus wurden neue APIs eingeführt, einige ausgewählte Schnittstellen wurden hingegen neu organisiert. Außerdem haben die Entwickler die Nutzeroberfläche und die Dokumentation stark überarbeitet. (ane)