Verarbeiten großer verteilter Datenmengen mit Hadoop

Ein neuer Artikel auf heise Developer stellt Apache Hadoop, eine freie Implementierung des MapReduce-Programmiermodells vor, mit dem sich Datenmengen im Giga- und Petabereich effizient verarbeiten lassen.

46

01.04.2010, 09:20 Uhr

Lesezeit: 1 Min.

Developer

Von

Alexander Neumann

Internetfirmen wie Facebook, Google und Yahoo müssen für den Betrieb ihrer Dienste täglich Datenmengen im Giga- und Petabereich speichern und effizient verarbeiten. Den Part der Datenverarbeitung können Googles Programmiermodell MapReduce oder die Open-Source-Nachbildung Apache Hadoop übernehmen, indem sie die Eingabedaten in Teilstücke partitionieren, um sie anschließend als unabhängige Teilaufgaben bearbeiten zu können.

Ein neuer Artikel auf heise Developer führt in das Thema Map/Reduce ein und zeigt insbesondere, wie die freie Apache-Implementierung funktioniert und vor allem, wo sich der Einsatz von Hadoop lohnt.

Siehe dazu auch:

Verarbeiten großer verteilter Datenmengen mit Hadoop

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}

${intro} ${title}

Verarbeiten großer verteilter Datenmengen mit Hadoop

Spiele

Für alle unter 30: heise+ mit 50% Rabatt

Das digitale Abo für IT und Technik.