Hadoop-Warehouse Hive bekommt Views
In Version 0.6 haben die Entwickler von Hive, einem freien Hadoop-Aufsatz, unter anderem Unterstützung für Views eingebaut.
- Christian Kirsch
Das freie Hive verwendet SQL für die Auswertung von Datenbeständen, die von Hadoop verwaltet werden. Es erzeugt aus diesen Standardabfragen die Java-Klassen, die Hadoop-Daten nach dem Map-Reduce-Schema auswerten. Version 0.6 enthält neben über 150 Fehlerkorrekturen neue Funktionen, unter anderem zum Verwenden von VIEW
s. Ein sogenannter Skew Join soll weniger Speicher beim Verknüpfen mehrerer Tabellen verbrauchen.
Voraussetzung zum Betrieb von Hive und Hadoop mindestens in Version 0.17 und Java 1.6. Wer es aus den Quellen erstellen will, benötigt Ant. Ein Artikel in iX 12/2010 beschreibt den Einsatz von Hive in der Praxis. (ck)