Menü
Developer

Hadoop-Distribution von Yahoo

vorlesen Drucken Kommentare lesen

Yahoo hat eine eigene auf dem Java-Framework Apache Hadoop aufsetzende Distribution zur Verfügung gestellt, die bislang bei Yahoo nur intern zum Einsatz kam. Die Firma bietet sie über Yahoos Developer Network sowie über die GitHub-Hosting-Site als Quelltextvariante an. Die Downloads basieren auf der Alpha-Version der Hadoop-0.20-Release. Die bereitgestellten Patches sollen komplett an das Apache-Projekt übergeben werden. Yahoo wird keine Dienstleistungen für die Distribution anbieten, offeriert sie aber als getestete und erweiterte "robuste Plattform" für Firmen, die kommerzielle Lösungen anbieten möchten.

Hadoop ist ein Java-Framework zum Erstellen verteilt arbeitender Anwendungen, die umfangreiche Berechnungen auf großen Datenmengen in Clustern durchführen, und Yahoos quelloffene Implementierung von Googles MapReduce API. Hadoop-Anwendungen sollen gut mit der Zahl der Knoten skalieren; Yahoo hat eigenen Angaben zufolge die größte Hadoop-Installation mit einem Cluster aus mehreren tausend Knoten im Einsatz. (ane)