iX 2/2021
S. 108
Wissen
Agilität

Stimmung mithilfe von ML analysieren

Entlang der Pipeline

Isabel Bär

Datenaufbereitung ist ein wichtiger Bestandteil in der Entwicklung von ML-Software. Der Artikel führt am Beispiel einer Stimmungsanalyse von Tweets Schritt für Schritt durch den Aufbau einer ML-Pipeline.

Das Beispielprojekt dieses Artikels beschäftigt sich mit politischer Meinungsforschung. Die Aufgabenstellung für das mittels einer Stimmungs­analyse zu lösende Geschäftsproblem ist bereits definiert: „Automatische Klassifizierung von deutschsprachigen Tweets mit dem Hashtag #Russland in positiv, negativ und neutral“. Die Wertschöpfung durch ML ergibt sich aus der signifikanten Vereinfachung und Rationalisierung bisheriger klassischer empirischer Methoden und der Nutzung einer viel größeren Datenmenge, was zu einer erhöhten Aussagekraft der Ergebnisse führt.

Die für das Training benötigten Daten liegen seit der zweiten Phase des ML-Projekts vor (siehe dazu „Das Beste aus beiden Welten“ in iX 11/2020 [1]) und sind teilweise schon aufgearbeitet. Es ist nun an der Zeit, mit der Sentiment-Analyse zu beginnen und mit den Daten zu arbeiten (Phase 3, siehe Abbildung 1).

Alle heise-Magazine mit heise+ lesen

3,99 € / Woche

Ein Abo, alle Magazine: c't, iX, Mac & i, Make & c't Fotografie

  • Alle heise-Magazine im Browser und als PDF
  • Alle exklusiven heise+ Artikel frei zugänglich
  • heise online mit weniger Werbung lesen
  • Vorteilspreis für Magazin-Abonnenten
Jetzt unbegrenzt weiterlesen Vierwöchentliche Abrechnung.

Alle Ausgaben freischalten

2,60 € 1,49 € / Woche

Nach Testphase 2,60 € wtl.

  • Zugriff auf alle iX-Magazine
  • PDF-Ausgaben zum Herunterladen
  • Zugriff in der iX-App für unterwegs
  • Über 35% günstiger im Testzeitraum
Jetzt testen Nach Testphase jederzeit monatlich kündbar.

Ausgabe einmalig freischalten

8,90 € / Ausgabe

Diese Ausgabe lesen – ohne Abobindung

  • Sicher einkaufen im heise shop
  • Magazin direkt im Browser lesen
  • Dauerhaft als PDF behalten

Kommentare lesen (1 Beitrag)