Menü
Developer

Apache Mahout 0.8 freigegeben

vorlesen Drucken Kommentare lesen

Knapp ein Jahr nach dem letzten Release haben die Entwickler von Apache Mahout eine neue Version der Bibliothek skalierbarer Algorithmen für maschinelles Lernen veröffentlicht. Das ursprüngliche Unterprojekt der Such-Engine Lucene war im Mai 2010 in den Status eines Top-Level-Projekts bei Apache erhoben worden.

Die meisten Verbesserungen hat es an der Leistungsfähigkeit der in Mahout enthaltenen Empfehlungsalgorithmen gegeben. Darüber hinaus stehen nun unter anderem eine Streaming-Variante des K-Means-Verfahrens, das schnelleres Bilden von Clustern ermöglichen soll, und Matrixfaktorisierung für die Methode des stochastischen Gradientenabstiegs (SGD) zur Bewertungsvorhersage unter Berücksichtigung von Nutzer und Gegenstand zur Verfügung. Unterstützt wird außerdem SVD++, eine weiteres Matrixfaktorisierungsmodell, und die Möglichkeit, einen oder mehrere Lucene-Storage-Indizes in SequenceFiles zu speichern. Die aktuelle Variante der Bibliothek steht auf der Projektseite zum Download bereit, nähere Details zu Änderungen finden sich im Changelog.

Mahout 0.8 soll die vorletzte Version vor dem Major Release sein, für Version 0.9 sind nur noch Fehlerbereinigungen und Aufräummaßnahmen geplant. Zu diesen zählt auch das Aussortieren nicht länger gepflegter Algorithmen, unter die beispielsweise Clusteringverfahren wie Mean Shift oder Klassifikationsverfahren wie Winnow und Perceptron in ihrer sequenziellen Variante fallen. Sollen sie weiterhin Teil der Bibliothek bleiben, müssen sich vor der nächsten Veröffentlichung Entwickler finden, die sich um deren Erhalt kümmern und gegebenenfalls weitere Verbesserungen einbringen. Ansonsten werden die entsprechenden Verfahren in einer späteren Version als deprecated markiert und in der darauf folgenden entfernt. (jul)