Google veröffentlicht Tool zum Einblick in hochdimensionale Daten

Der sogenannte Embedding Projector soll Forschern einen Einblick in Prozesse und Modelle des maschinellen Lernens geben, indem er die hochdimensionalen Daten auf eine 3D- oder 2D-Ansicht projiziert.

 –  0 Kommentare
Google veröffentlicht Tool zum Einblick in hochdimensionale Daten
Anzeige

Im Rahmen der zahlreichen Open-Source-Projekte rund um maschinelles Lernen hat Google nun unter dem Namen "Embedding Projector" ein Werkzeug veröffentlicht, das hochdimensionale Daten graphisch darstellt. Es soll Forschern einen Einblick geben, wie selbstlernende Systeme gesammelte Informationen interpretieren. Je nach Ansatz haben die Daten hunderte oder tausende Dimensionen, sodass es eines speziellen Werkzeugs zur Analyse bedarf.

TensorFlow und andere Systeme für maschinelles Lernen verwenden mathematische Einbettungen (Embeddings), die unterschiedliche Facetten der Daten repräsentieren. Vereinfacht ausgedrückt, projiziert der Embedding Projector die zahlreichen Dimensionen auf eine dreidimensionale Darstellung. Dabei versucht er die Daten so zu rotieren, dass die ersten drei Dimensionen die Varianz innerhalb der Daten so deutlich wie möglich widerspiegeln. Konkret nutzt er zur Strukturierung wahlweise eine Hauptkomponentenanalyse, t-SNE (t-distributed stochastic neighbor embedding) oder eine eigene lineare Projektion.

Anzeige
Die Ansicht zeigt Wörter, für die das Modell in word2vect einen semantischen Bezug zu Weihnachten erkennt.

Anwender können wahlweise in einer 3D- oder 2D-Ansicht durch die Modelle navigieren, um relevante Ausschnitte zu erkennen. So zeigt es beispielsweise anhand des word2vec-Sprachmodells aus dem TensorFlow-Tutorial bei der Auswahl eines Wortes, die in der Nähe befindlichen Begriffe an. Die räumliche Nähe bedeutet für das sprachliche Modell einen semantischen Bezug.

Weitere Details finden sich im Blogbeitrag und auf der TensorBoard-Seite. Die Macher haben auf einer eigenen Website ein paar Beispiele zusammengestellt, mit denen Anwender das Tool mit vorgefertigten Modellen in unterschiedlichen Projektionen ausprobieren können. (rme)

Anzeige