iX Special 2020
S. 140
Wissenschaftliches Rechnen
Datenanalyse mit R

Sentimentanalyse von Texten mit R

Die Welt verstehen

Manuel Böhm

Am Beispiel von Merkels Regierungserklärung zur Coronakrise lässt sich das automatische Analysieren von Texten gut zeigen. Hier kann die Statistiksprache R ihre Stärken ausspielen.

Das Auswerten unstrukturierter Daten, vor allem von Texten, erfreut sich auch bei den Anwendern der Statistikprogrammiersprache R wachsender Beliebtheit. Forschungs- und Anwendungsgebiete gibt es viele, etwa die Sentimentanalyse, die Empfindungen und Stimmungen messen soll. Ihr Ziel ist, die Polarität eines Textes einzuschätzen: Ist er eher positiv oder negativ gemeint? Ursprünglich wurde diese Technik von E-Commerce-Plattformen wie Amazon eingesetzt, um herauszufinden, ob ein Produkt empfehlenswert ist oder nicht. Der Fokus hat sich nun weit vom Marketing entfernt: Börsenanalysten untersuchen die Laune von Investoren, Politikwissenschaftler klassifizieren Parlamentsdebatten und Sozialwissenschaftler die Diskurse in sozialen Medien.

Speziell bei großen Textmengen bietet sich das Analysieren mit R an. Es gibt dazu zahlreiche Pakete für verschiedene Anwendungszwecke. Das Folgende zeigt Beispiele anhand dieser Bibliotheken:

Kommentieren