Menü
Developer

Spring for Hadoop 1.0 fertig

Von
vorlesen Drucken Kommentare lesen 1 Beitrag

Etwa ein Jahr nach der Veröffentlichung des ersten Meilensteins hat SpringSource nun die fertige Version 1.0 von Spring for Apache Hadoop freigegeben. Das Ziel des Projekts soll die Vereinfachung der Entwicklung von Hadoop-Anwendungen sein.

SpringSource habe beobachtet, dass die verschiedenen Komponenten des Hadoop-Ökosystems mit ihren unterschiedlichen Ursprüngen zu verschiedenen Herangehensweisen bei der Konfiguration und im API-Design führten, erläutert Costin Leau in einem Blogpost zur Veröffentlichung. Auf diese Weise entstünden schlecht strukturierte Anwendungen, die eher zusammengeflickten Ansammlungen von Codeschnipseln, Skripten und Kommandozeilenprogrammen glichen.

Spring for Hadoop möchte an diesem Punkt ansetzen und die von Spring bekannte Template API auf Hadoop anwenden, was Helferklassen wie HBaseTemplate und HiveTemplate erzeugt. Spring-Funktionen wie Thread-safe Access zu tiefer liegenden Ressourcen und leichtgewichtiges Objekt-Mapping sollen sich so auch mit Hadoop-Anwendungen nutzen lassen.

Als weiteres Ziel des Projekts gibt Leau an, Möglichkeiten bieten zu wollen, um Projekte langsam "wachsen lassen" zu können. Hierfür sollen nach Bedarf zusammenstellbare Runner-Klassen zum Ausführen von Hive, Pig Skripten und ähnlichem dienen. Nähmen die Projekte an Komplexität zu, bestünde dann die Möglichkeit, Spring Batch zu nutzen, um die einzelnen Schritte zu koordinieren und sie über eine REST-API zu verwalten.

Spring for Apache Hadoop soll wohl mit den meisten momentan verfügbaren 1.x-Hadoop-Distributionen arbeiten können, in dem aus Greenplum HD hervorgegangenen Pivotal HD ist es bereits standardmäßig enthalten. (jul)