NĂ€chste Hadoop-Generation erreicht Beta-Status
Apache Hadoop 2.x ist die Ăberarbeitung des Big-Data-Frameworks vor dem Hintergrund, dass sich die Anforderungen an FlexibilitĂ€t und VerfĂŒgbarkeit verĂ€ndert haben. Mit der Beta-Version steht auch die finale Freigabe der nĂ€chsten Generation kurz bevor.
Mit der Veröffentlichung [1] von hadoop-2.1.0-beta [2] hat der 2.x-Release-Strang des unter dem Dach der Apache Software Foundation entwickelten Big-Data-Frameworks den Sprung zur Beta geschafft. Das bedeutet offenbar, dass auf dem Weg hin zu einer fertigen Version der nĂ€chsten Hadoop-Generation innerhalb der nĂ€chsten Wochen nur noch kleinere Fehler zu beseitigen sind. Diese soll dann als Hadoop 2.2.0 ĂŒber die Ziellinie gehen.
Das in Java geschriebene Big-Data-Framework wurde speziell zur Entwicklung skalierbarer, verteilter Anwendungen zur Analyse groĂer Datenmengen ausgelegt. Es implementierte den von Google entwickelten MapReduce-Algorithmus. Dabei werden Daten ĂŒber die Knoten eines Hadoop-Clusters verteilt redundant gespeichert, die Analyseprogramme laufen parallel auf allen Knoten und analysieren die jeweils dort vorgehaltenen Daten.
Hadoop 2 entsteht nun vor dem Hintergrund, dass sich die Anforderungen und Erwartungen an FlexibilitĂ€t und VerfĂŒgbarkeit von Unternehmen wie Facebook oder Twitter gegenĂŒber dem Zeitraum der Entstehung des Frameworks 2005 massiv verĂ€ndert haben. Die neue Generation von Hadoop enthĂ€lt deswegen die neue MapReduce-Implementierung YARN. Die neue Architektur ist insofern flexibel, dass sie keine reine MapReduce-Ablaufumgebung mehr ist. MapReduce ist nur noch eine Möglichkeit, andere, verteilte und nicht verteilte Programme sind demnach im Hadoop-Cluster genauso willkommen.
Mit der Freigabe der Beta-Version sind die Entwickler nun zuversichtlich, dass Anwendungen auf Basis des HDFS (Hadoop File System) kompatibel mit YARN-Anwendungen sind. AuĂerdem haben sie die Grundlage dafĂŒr geschaffen, dass sich Hadoop 2.x binĂ€rkompatibel [3] zu MapReduce-Anwendungen verhĂ€lt, die mit dem derzeit stabilen Hadoop 1.x gebaut werden. ZusĂ€tzlich ist es mittlerweile möglich, Hadoop-Anwendungen mit Windows Server und Windows Azure [4] zu betreiben. Weitere Neuerungen sind zudem die NFSv3-UnterstĂŒtzung fĂŒr HDFS und neue Client-Bibliotheken fĂŒr YARN-Entwickler. (ane [5])
URL dieses Artikels:
https://www.heise.de/-1942438
Links in diesem Artikel:
[1] http://markmail.org/message/3wb7pk576mvzq4pd
[2] http://www.apache.org/dyn/closer.cgi/hadoop/common/
[3] https://issues.apache.org/jira/browse/MAPREDUCE-5108
[4] https://issues.apache.org/jira/browse/HADOOP-8562
[5] mailto:ane@heise.de
Copyright © 2013 Heise Medien