Big Data: Hadoop-Distribution fĂĽr Windows-Server
Als offenbar erster Anbieter einer Distribution des Big-Data-Frameworks Hadoop unterstĂĽtzt das von Yahoo gegrĂĽndete Unternehmen Hortonworks mit einer speziellen Variante seiner Plattform die Windows-Welt.
- Alexander Neumann
Hortonworks, Anbieter einer Distribution des Big-Data-Frameworks Apache Hadoop, hat eine Beta-Version seiner Hortonworks Data Platform (HDP) für den Windows Server veröffentlicht. Das fertige Release will das unter anderem von Yahoo gegründete Unternehmen innerhalb der nächsten Monate bereitstellen. Hadoop ist ein Java-Framework für skalierbare, verteilte Systeme, das von der Apache Foundation entwickelt wird und den durch Google bekannten MapReduce-Ansatz nutzt. Bislang boten Hortonworks und andere Distributeure von Hadoop allein Versionen für Linux-Systeme an.
Das Produkt ist in Zusammenarbeit mit Microsoft entstanden, beide Unternehmen haben daran anscheinend innerhalb der letzten anderthalb Jahre gearbeitet. Erste AnkĂĽndigungen der Kooperation waren im Oktober 2012 bekannt geworden. Damals hieĂź es, dass Microsoft-Kunden zukĂĽnftig ĂĽber HDInsight Server fĂĽr Windows und Windows Azure HDInsight Service eine zu Windows Server und Windows Azure kompatible Hadoop-Version erhalten sollen.
Hortonworks sieht die Notwendigkeit seiner Windows-Variante der Plattform darin begrĂĽndet, dass sehr viele Unternehmen Windows Server in ihren Anwendungen einsetzen wĂĽrden. Die neue Distribution wird jedoch nicht Deployment-Umgebungen unterstĂĽtzen, bei denen sowohl Windows- als auch Linux-Knoten installiert sind. Anwender mĂĽssen sich entweder fĂĽr das eine oder andere System entscheiden.
Die Windows-Variante soll über kurz oder lang die gleichen Komponenten der Linux-Version enthalten, als Basis wird derzeit HDP 1.1 herangezogen, aktuell ist hingegen HDP 1.2. Unterstützt werden Windows Server 2008 und Windows Server 2012. Wie die Linux ist auch die Windows-Version Open-Source-Software. Da die Hortonworks Data Platform for Windows und der HDInsight Service on Windows Azure auf der gleichen Codebasis beruhen, können Microsoft-Kunden ihre Hadoop-Anwendungen anscheinend ohne größere Probleme zwischen lokalen und Cloud-Umgebungen portieren.
Microsofts steht mit seinem Schritt, eine Hadoop-Distribution zu unterstĂĽtzen, statt ein eigenes Produkt auf den Markt zu bringen, nicht allein da. Auch Oracle hatte sich durch seine Zusammenarbeit mit Cloudera, einem weiteren Distributor, schon hinter das Big-Data-Framework Hadoop gestellt. SAP verbĂĽndete sich gleich mit mehreren Hadoop-Anbietern. (ane)