Hortonworks Data Platform 3.0.0 veröffentlicht

Die Hortonworks Data Platform 3.0 basiert auf Hadoop 3.1 und ermöglicht unter anderem die Containerisierung von Big-Data-Anwendungen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Hortonworks Data Platform 3.0.0 veröffentlicht
Lesezeit: 2 Min.
Von
  • Alexander Neumann

Die im Juni angekündigte Version 3.0 von Hortonworks' Data Platform (HDP) ist nun generell verfügbar. Außerdem hat das Unternehmen die Version 2.7 von Apache Ambari und das 1.5-Release von SmartSense freigegeben. Ersteres ist ein Installations- und Managementwerkzeug für Hadoop-Cluster. Es geht dem Hadoop-Administrator dabei während des gesamten Lebenszyklus des Clusters zur Hand und fasst viele manuelle Aufgaben unter einer einheitlichen Weboberfläche zusammen. SmartSense gibt Anwendern unter anderem die Möglichkeit, Analysen und Verbesserungsvorschläge für ein HDP-Cluster anzufordern.

HDP 3.0 kann sowohl lokal als auch in den Cloud-Plattformen AWS, Microsoft Azure und Google Cloud bereitgestellt werden. Viele der neuen Funktionen von HDP 3.0 basieren auf Apache Hadoop 3.1. Als wichtigste Features werden Containerisierung, GPU-Unterstützung, Erasure Coding und NameNode Federation genannt.

Die Containerisierung soll Kunden die Möglichkeit geben, Container für den Einsatz neuer Analysen zu nutzen und Apps schnell zu starten. Es werden darüber hinaus nun auch Deep-Learning-Anwendungen mit TensorFlow unterstützt, die auf umfangreiche und teure GPU-Ressourcen angewiesen sind. Außerdem hat das Data-Warehouse-Tool Apache Hive jetzt offenbar den gewünschten Reifegrad erreicht. Es sei zu einer wirklich integrierten Datenbank geworden, die erwünschte Dinge wie eine vernünftige Gesamtleistung, ACID-Compliance oder Indizierung mitbringe. Mit NameNode Federation können Kunden auf Tausende von Knoten und eine Milliarde Dateien skalieren. Die höhere Verfügbarkeit mit mehreren Name Nodes und Standby-Funktionen ermöglicht offenbar ununterbrochene Cluster-Operationen, wenn ein Name Node ausfallen sollte.

Um einen Data Lake bereitzustellen, kommen Apache Ranger und Apache Atlas standardmäßig zum Einsatz. Entfernt wurden hingegen Komponenten wie Apache Falcon, Apache Mahout, Apache Flume und Apache Hue, dafür jedoch Funktionen von Apache Slider in YARN integriert. Wer tiefer in die Neuerungen der einzelnen Komponenten der Hortonworks Data Platform einsteigen möchte, findet im Blog-Beitrag zur Ankündigung ausführliche Informationen. Außerdem hat Hortonworks Release Notes zu HDP 3.0, Ambari 2.7 und SmartSense 1.5 bereitgestellt. (ane)