Menü
Developer

Big Data: Hadoop-Distribution für Windows-Server

Von
vorlesen Drucken Kommentare lesen 2 Beiträge

Hortonworks, Anbieter einer Distribution des Big-Data-Frameworks Apache Hadoop, hat eine Beta-Version seiner Hortonworks Data Platform (HDP) für den Windows Server veröffentlicht. Das fertige Release will das unter anderem von Yahoo gegründete Unternehmen innerhalb der nächsten Monate bereitstellen. Hadoop ist ein Java-Framework für skalierbare, verteilte Systeme, das von der Apache Foundation entwickelt wird und den durch Google bekannten MapReduce-Ansatz nutzt. Bislang boten Hortonworks und andere Distributeure von Hadoop allein Versionen für Linux-Systeme an.

Das Produkt ist in Zusammenarbeit mit Microsoft entstanden, beide Unternehmen haben daran anscheinend innerhalb der letzten anderthalb Jahre gearbeitet. Erste Ankündigungen der Kooperation waren im Oktober 2012 bekannt geworden. Damals hieß es, dass Microsoft-Kunden zukünftig über HDInsight Server für Windows und Windows Azure HDInsight Service eine zu Windows Server und Windows Azure kompatible Hadoop-Version erhalten sollen.

Hortonworks sieht die Notwendigkeit seiner Windows-Variante der Plattform darin begründet, dass sehr viele Unternehmen Windows Server in ihren Anwendungen einsetzen würden. Die neue Distribution wird jedoch nicht Deployment-Umgebungen unterstützen, bei denen sowohl Windows- als auch Linux-Knoten installiert sind. Anwender müssen sich entweder für das eine oder andere System entscheiden.

Die Windows-Variante soll über kurz oder lang die gleichen Komponenten der Linux-Version enthalten, als Basis wird derzeit HDP 1.1 herangezogen, aktuell ist hingegen HDP 1.2. Unterstützt werden Windows Server 2008 und Windows Server 2012. Wie die Linux ist auch die Windows-Version Open-Source-Software. Da die Hortonworks Data Platform for Windows und der HDInsight Service on Windows Azure auf der gleichen Codebasis beruhen, können Microsoft-Kunden ihre Hadoop-Anwendungen anscheinend ohne größere Probleme zwischen lokalen und Cloud-Umgebungen portieren.

Microsofts steht mit seinem Schritt, eine Hadoop-Distribution zu unterstützen, statt ein eigenes Produkt auf den Markt zu bringen, nicht allein da. Auch Oracle hatte sich durch seine Zusammenarbeit mit Cloudera, einem weiteren Distributor, schon hinter das Big-Data-Framework Hadoop gestellt. SAP verbündete sich gleich mit mehreren Hadoop-Anbietern. (ane)