iX 2/2021
S. 108
Wissen
Agilität

Stimmung mithilfe von ML analysieren

Entlang der Pipeline

Isabel Bär

Datenaufbereitung ist ein wichtiger Bestandteil in der Entwicklung von ML-Software. Der Artikel führt am Beispiel einer Stimmungsanalyse von Tweets Schritt für Schritt durch den Aufbau einer ML-Pipeline.

Das Beispielprojekt dieses Artikels beschäftigt sich mit politischer Meinungsforschung. Die Aufgabenstellung für das mittels einer Stimmungs­analyse zu lösende Geschäftsproblem ist bereits definiert: „Automatische Klassifizierung von deutschsprachigen Tweets mit dem Hashtag #Russland in positiv, negativ und neutral“. Die Wertschöpfung durch ML ergibt sich aus der signifikanten Vereinfachung und Rationalisierung bisheriger klassischer empirischer Methoden und der Nutzung einer viel größeren Datenmenge, was zu einer erhöhten Aussagekraft der Ergebnisse führt.

Die für das Training benötigten Daten liegen seit der zweiten Phase des ML-Projekts vor (siehe dazu „Das Beste aus beiden Welten“ in iX 11/2020 [1]) und sind teilweise schon aufgearbeitet. Es ist nun an der Zeit, mit der Sentiment-Analyse zu beginnen und mit den Daten zu arbeiten (Phase 3, siehe Abbildung 1).

Kommentare lesen (1 Beitrag)