Bibliothek skalierbarer Algorithmen für maschinelles Lernen; bietet stabile Implementierungen von Algorithmen zum maschinellen Lernen mit einem Schwerpunkt auf der Verarbeitung großer Datenmengen, auch verteilt über mehrere Rechner; umfasst Algorithmen wie Spectral Clustering, MinHash Clustering und Naive-Bayes-Klassifikatoren; benötigt Java sowie Maven