Agilität: Stimmung mithilfe von Machine Learning analysieren

Datenaufbereitung ist ein wichtiger Bestandteil in der Entwicklung von ML-Software. Der Artikel führt Schritt für Schritt durch den Aufbau einer ML-Pipeline.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 19 Min.
Von
  • Isabel Bär
Inhaltsverzeichnis

Das Beispielprojekt dieses Artikels beschäftigt sich mit politischer Meinungsforschung. Die Aufgabenstellung für das mittels einer Stimmungsanalyse zu lösende Geschäftsproblem ist bereits definiert: "Automatische Klassifizierung von deutschsprachigen Tweets mit dem Hashtag #Russland in positiv, negativ und neutral". Die Wertschöpfung durch ML ergibt sich aus der signifikanten Vereinfachung und Rationalisierung bisheriger klassischer empirischer Methoden und der Nutzung einer viel größeren Datenmenge, was zu einer erhöhten Aussagekraft der Ergebnisse führt.

Die für das Training benötigten Daten liegen seit der zweiten Phase des ML-Projekts vor und sind teilweise schon aufgearbeitet. Es ist nun an der Zeit, mit der Sentiment-Analyse zu beginnen und mit den Daten zu arbeiten (Phase 3).

Mit dem Einstieg in die dritte Phase stellt sich die Frage, welche Aufgaben vorliegen. Eine Stimmungsanalyse folgt dem Ziel, Textdaten mittels trainierter Algorithmen hinsichtlich des Sentiments, also der Autorenmeinung und Haltung zu einem bestimmten Thema, zu klassifizieren. Dabei gilt es zu klären, welcher Weg zwischen einem Tweet und seiner automatischen Klassifizierung in die Kategorien positiv, neutral oder negativ liegt.