Agilität: Stimmung mithilfe von Machine Learning analysieren

Datenaufbereitung ist ein wichtiger Bestandteil in der Entwicklung von ML-Software. Der Artikel führt Schritt für Schritt durch den Aufbau einer ML-Pipeline.

Lesezeit: 19 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Von
  • Isabel Bär
Inhaltsverzeichnis

Das Beispielprojekt dieses Artikels beschäftigt sich mit politischer Meinungsforschung. Die Aufgabenstellung für das mittels einer Stimmungsanalyse zu lösende Geschäftsproblem ist bereits definiert: "Automatische Klassifizierung von deutschsprachigen Tweets mit dem Hashtag #Russland in positiv, negativ und neutral". Die Wertschöpfung durch ML ergibt sich aus der signifikanten Vereinfachung und Rationalisierung bisheriger klassischer empirischer Methoden und der Nutzung einer viel größeren Datenmenge, was zu einer erhöhten Aussagekraft der Ergebnisse führt.

Die für das Training benötigten Daten liegen seit der zweiten Phase des ML-Projekts vor und sind teilweise schon aufgearbeitet. Es ist nun an der Zeit, mit der Sentiment-Analyse zu beginnen und mit den Daten zu arbeiten (Phase 3).

Mit dem Einstieg in die dritte Phase stellt sich die Frage, welche Aufgaben vorliegen. Eine Stimmungsanalyse folgt dem Ziel, Textdaten mittels trainierter Algorithmen hinsichtlich des Sentiments, also der Autorenmeinung und Haltung zu einem bestimmten Thema, zu klassifizieren. Dabei gilt es zu klären, welcher Weg zwischen einem Tweet und seiner automatischen Klassifizierung in die Kategorien positiv, neutral oder negativ liegt.