Spring for Apache Hadoop 2.0 veröffentlicht

Das Framework zur Entwicklung von Hadoop-Anwendungen berücksichtigt nun die neue Generation von Hadoop.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Rund fünfzehn Monate nach der Veröffentlichung der Version 1.0 hat die Pivotal-Tochter SpringSource nun Spring for Apache Hadoop 2.0 freigegeben. Stand die Version 1.0 noch im Zeichen von Hadoop 1.x, berücksichtigt das jetzige Release die neue Generation des Big-Data-Frameworks, die im Herbst 2013 veröffentlicht wurde.

Hadoop 2.x entstand vor dem Hintergrund, dass sich die Anforderungen und Erwartungen an Flexibilität und Verfügbarkeit seit dem Entstehen des Frameworks 2005 massiv verändert haben. Hadoop wurde damals speziell für die Entwicklung skalierbarer, verteilter Anwendungen zur Analyse großer Datenmengen entworfen. Es implementierte den von Google entwickelten MapReduce-Algorithmus. Aufgrund der anderen Anforderungen entstand mit Hadoop 2.x die neue, Datenverarbeitung von Datenhaltung trennende Architektur YARN (Yet Another Resource Negotiator). Sie ist insofern flexibel, dass sie keine reine MapReduce-Ablaufumgebung mehr ist. MapReduce ist nur noch eine Möglichkeit – andere, verteilte und nicht verteilte Programme sind demnach im Hadoop-Cluster genauso willkommen.

Spring for Hadoop 2.0 ist für die Entwicklung nach dem Spring-Programmiermodell mit den Versionen 2.2.0 und 2.4.0 von Hadoop sowie die Distributionen Pivotal HD 2.0, Cloudera CDH 5 und Hortonworks HDP 2.1 präpariert. Da bei Hadoop 2.x darauf geachtet wurde, Kompatibilität zu älteren Hadoop-Installationen herzustellen, lässt sich das neue Spring for Hadoop ebenfalls bei Hadoop-1.x-Anwendungen einsetzen. (ane)