Hadoop-Distribution von Yahoo

Yahoo stellt den Quellcode seiner intern genutzten und erweiterten Hadoop-Distribution zur Verfügung und übergibt die Patches an die Apache Software Foundation.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Yahoo hat eine eigene auf dem Java-Framework Apache Hadoop aufsetzende Distribution zur Verfügung gestellt, die bislang bei Yahoo nur intern zum Einsatz kam. Die Firma bietet sie über Yahoos Developer Network sowie über die GitHub-Hosting-Site als Quelltextvariante an. Die Downloads basieren auf der Alpha-Version der Hadoop-0.20-Release. Die bereitgestellten Patches sollen komplett an das Apache-Projekt übergeben werden. Yahoo wird keine Dienstleistungen für die Distribution anbieten, offeriert sie aber als getestete und erweiterte "robuste Plattform" für Firmen, die kommerzielle Lösungen anbieten möchten.

Hadoop ist ein Java-Framework zum Erstellen verteilt arbeitender Anwendungen, die umfangreiche Berechnungen auf großen Datenmengen in Clustern durchführen, und Yahoos quelloffene Implementierung von Googles MapReduce API. Hadoop-Anwendungen sollen gut mit der Zahl der Knoten skalieren; Yahoo hat eigenen Angaben zufolge die größte Hadoop-Installation mit einem Cluster aus mehreren tausend Knoten im Einsatz. (ane)