Big Data: Apache Hive 1.0 veröffentlicht

Knapp sechs Jahre nach dem ersten öffentlichen Release kann die Entwicklergemeinde hinter der Data-Warehouse-Software für Hadoop die erste Major-Version feiern.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen
Lesezeit: 1 Min.
Von
  • Julia Schmidt

Das Apache-Hive-Team hat Version 1.0 seines Projekts freigegeben. Beschäftigt man sich mit dem Thema Big Data, trifft man unweigerlich auf das Framework Hadoop, das zum Speichern und Bearbeiten von Daten auf dezentral gelagerter Hardware gedacht ist. Die Hive-Software bietet hierzu ergänzend eine SQL-ähnliche Abfragesprache, mit der sich unter anderem Daten extrahieren und transformieren lassen die in Hadoops File-System (HDFS) oder ähnlichen Systemen wie Apache HBase gespeichert sind.

In den vergangenen Jahren hatte man bei Hive im Zuge der Stinger Initiative daran gearbeitet, die Leistungsfähigkeit und den Funktionsumfang der Software zu verbessern. Nach deren erfolgreichem Abschluss ist nun mit Stinger.next eine Neuauflage des Projekts im Gange. Ihr Ziel ist es, die Reaktionszeiten für Anfragen unter eine Sekunde zu drücken und Hive als SQL-Interface für Anfragen im Giga-, Tera- und Petabyte-Bereich zu etablieren.

Die Freigabe der Version 1.0 zum jetzigen Zeitpunkt bedeutet, dass man nun in Sachen Stabilität und Ausgereiftheit einen Stand erreicht habe, der sich als gute Grundlage für kommende Entwicklungsschritte eignet. Das aktuelle Release hat vor allem eine ganze Reihe Bugfixes erhalten. Als Verbesserung weisen die Release Notes den nun als öffentliche API freigelegten HiveMetaStoreClient aus. Außerdem soll intern nun wohl immer geprüft werden, ob ein Build Abhängigkeiten zu Snapshots aufweist, da dieser Umstand nicht gewünscht ist. (jul)