zurück zum Artikel

Hadoop 1.0 ist fertig

Dr. Oliver Diedrich

Version 1.0 des "Big Data"-Frameworks bringt Verbesserungen bei der Hadoop-Datenbank HBase sowie die Möglichkeit, über HTTP auf das Hadoop-Dateisystem HDFS zuzugreifen.

Die Entwickler von Apache Hadoop [1] haben die Version 1.0 des "Big Data"-Frameworks veröffentlicht. Hadoop 1.0 entstammt dem Security-Branch 0.20 von Hadoop und ist der Nachfolger der Version 0.20.205; das kürzlich veröffentlichte [2] erste Release von Hadoop 0.23, das eine neue Map-Reduce-Imlementierung [3] mitbringt, soll zu Hadoop 2 werden.

Zu den Neuerungen gehören die Kerberos-basierte Nutzerauthentifizierung, Verbesserungen bei der auf Hadoop aufsetzenden verteilten Datenbank HBase [4] und Performanceverbesserungen. Mit Webhdfs ist es jetzt möglich, über HTTP auf das Hadoop-Dateisystem HDFS zuzugreifen – quasi eine HTTP-API für Hadoop. Weitere Details nennen die Release Notes [5].

Hadoop ist ein freies Framework unter Apache-2-Lizenz zur Entwicklung skalierbarer, verteilter Anwendungen zur Analyse großer Datenmengen (Big Data) auf der Grundlage des von Google entwickelten MapReduce-Algorithmus. Daten werden über die Knoten eines Hadoop-Clusters verteilt redundant gespeichert, die Analyseprogramme laufen parallel auf allen Knoten und analysieren die jeweils dort vorgehaltenen Daten. Die Apache-Software ist Grundlage diverser Hadoop-Distributionen, wie sie beispielsweise HortonWorks [6] und Cloudera [7] anbieten, sowie verschiedener kommerzieller Big-Data-Angebote unter anderem von IBM [8]. Zahlreiche Anwender [9] haben Hadoop-basierte Lösungen im Produktiveinsatz. (odi [10])


URL dieses Artikels:
https://www.heise.de/-1402010

Links in diesem Artikel:
[1] http://hadoop.apache.org
[2] https://www.heise.de/news/Hadoop-Release-beschleunigt-Map-Reduce-1379685.html
[3] http://hadoop.apache.org/common/docs/r0.23.0/hadoop-yarn/hadoop-yarn-site/YARN.html
[4] http://hbase.apache.org/
[5] http://hadoop.apache.org/common/docs/r1.0.0/releasenotes.html
[6] http://hortonworks.com/
[7] http://www.cloudera.com
[8] https://www.heise.de/news/IBM-bringt-Hadoop-in-seine-Cloud-1366283.html
[9] http://wiki.apache.org/hadoop/PoweredBy
[10] mailto:odi@ix.de