Menü

Uber gibt das Machine-Learning-Werkzeug Manifold als Open Source frei

Das visuelle Debugging-Tool Manifold soll dabei helfen, Probleme in Machine-Learning-Modellen aufzudecken.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 2 Beiträge

(Bild: alphaspirit/Shutterstock.com)

Von

Das Entwicklerteam des Fahrdienstleisters Uber hat mit dem Projekt Manifold ein Werkzeug zum visuellen Debuggen von Machine-Learning-Modellen quelloffen zur Verfügung gestellt. Uber hatte Manifold im Januar 2019 vorgestellt, seitdem hat es als Teil der hauseigenen Machine-Learning-Plattform Michelangelo die Entwickler bei ihrer Arbeit unterstützt. Der Open-Source-Version hat Uber gleich ein paar neue Features spendiert.

Uber hat in einem Blogbeitrag die Funktionsweise von Manifold zusammengefasst. Im Kern ist es ein modellagnostisches Visualisierungswerkzeug, das bei Performancediagnosen und dem Debuggen der Modelle helfen soll. Manifold soll es ermöglichen, über die allgemeinen Metriken hinaus zu erkennen, welche Teilmenge von Daten ein Modell ungenau vorhersagt. Es soll außerdem den Unterschied in der Merkmalsverteilung zwischen besser und schlechter abschneidenden Untergruppen von Daten aufzeigen und dadurch Performanceprobleme offenlegen.

Manifold bietet Nutzern zwei Ansichten: einen Performancevergleich, der Modelle und Datensegmente aufzeigt, und eine Feature-Ansicht, die die Funktionen zweier Datensegmente vergleicht. Anwender können darin verschiedene Aktionen (Vergleiche, genauere Analysen etc.) durchführen, um etwaige Fehler aufzudecken.

In der Open-Source-Variante unterstützt Manifold nun eine Anbindung an die im Machine-Learning-Umfeld beliebten Jupyter Notebooks. Das Tool erlaubt nun eine Dateneingabe über Pandas-DataFrame-Objekte und rendert dadurch eine Visualisierung in Jupyter. Durch die Anbindung soll die Community Manifold nutzen können, ohne ihre Workflows ändern zu müssen.

Darüber hinaus sollen Nutzer in der Open-Source-Variante Modelle verschiedener Algorithmentypen analysieren können. Zusätzlich bietet sie einen Support für die Visualisierung numerischer, kategorischer und geographischer Daten.

Einen vollständigen Überblick über die Open-Source-Variante von Manifold bietet Uber in seinem Engineering-Blog. Wer das Tool ausprobieren möchte, ist mit dem GitHub-Repository gut beraten, es existieren sowohl ein npm- als auch ein Python-Paket. (bbo)