Erste kommerzielle Distribution des neuen Hadoop veröffentlicht
Nur rund eine Woche nach der Fertigstellung von Version 2.2 des Big-Data-Frameworks Hadoop bietet Hortonworks nun seine Variante an. HDP 2.0 enthält zudem die Ergebnisse der zweiten Phase der Stinger Initiative.
- Julia Schmidt
Knapp eine Woche nach der Freigabe der ersten stabilen Hadoop-Version des 2.x-Entwicklungszweigs bringt das Softwareunternehmen Hortonworks mit seiner Data Platform (HDP) die erste kommerzielle Distribution des unter dem Dach der Apache Foundation entwickelten Big-Data-Frameworks auf den Markt. Teil von HDP 2.0 ist zudem unter anderem Version 0.12 des SQL-Layers Apache Hive.
Sie kann als Ergebnis der zweiten Phase der zu Beginn des Jahres gestarteten Stinger Initiative verstanden werden, die damals mit der Mission an den Start gegangen war, Hive 100-mal schneller zu machen. Zu den Verbesserungen in der aktuellen Variante zählen, was den SQL-Aspekt des Projekts angeht, unter anderem die Unterstützung von VARCHAR und DATE sowie die Möglichkeit, Structs und Unions mit GROUP BY zu verarbeiten. In puncto Geschwindigkeit ließen sich beispielsweise die Zeit, die zum Starten von Anfragen bei Datenbanken mit mehr als 500 Partitionen benötigt wird, reduzieren und Befehle wie ORDER BY und COUNT überarbeiten.
Neben Hive sind auch andere aktuelle Projekte aus dem Hadoop-Ökosystem Teil der Distribution, etwa Apache HBase 0.96.0, das es unter anderem ermöglicht, Snapshots zu machen. Eine Übersicht der verwendeten Versionen zeigt die unten stehende Abbildung.
(Bild:Â Hortonworks )
(jul)