Datenanalyse des sozialen Netzwerks Reddit: Inhaltliche Analyse

Flairs erleichtern die Orientierung in Reddit. Themen lassen sich über Natural Language Processing (NLP) aufspüren. Die Analyse erlaubt die Prognose von Trends.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 11 Min.
Von
  • Prof. Stefanie Scholz
  • Prof. Christian Winkler
Inhaltsverzeichnis

Nach den statistischen und communitybezogenen Auswertungen des Technology-Subreddits stehen in diesem Artikel Fragen zu den konkreten Inhalten der Diskussionen im Zentrum der Analyse. Er widmet sich der Textanalyse mittels NLP.

Der Artikel "Datenanalyse des sozialen Netzwerks Reddit: Daten beschaffen und auswerten" betrachtete innerhalb der statistischen Auswertungen die Flairs – vordefinierte Labels, die die Autoren der initialen Posts auswählen können. Jedoch zeigte diese Analyse bereits, dass man die Flairs bereinigen muss. Erst dann lassen sich valide Aussagen zur Entwicklung der hierdurch gekennzeichneten Themen ableiten.

Mehr zu Data Science / Datenanalyse:

Spannend ist nun aber auch die Frage, ob die Flairs überhaupt die inhaltliche Entwicklung der Diskussionen ausreichend wiedergeben können. Immerhin dürfte es den Autoren bei manchen Themen schwerfallen, sich für ein Flair zu entscheiden. Da sie subjektiv auswählen, ist es interessant, unabhängig von vordefinierten Flairs zentrale Themen zu finden und deren Entwicklung über die Zeit zu analysieren, um weitere oder ganz andere Trends aufzudecken.