Datenanalyse des sozialen Netzwerks Reddit: Inhaltliche Analyse
Flairs erleichtern die Orientierung in Reddit. Themen lassen sich über Natural Language Processing (NLP) aufspüren. Die Analyse erlaubt die Prognose von Trends.
- Prof. Stefanie Scholz
- Prof. Christian Winkler
Nach den statistischen und communitybezogenen Auswertungen des Technology-Subreddits stehen in diesem Artikel Fragen zu den konkreten Inhalten der Diskussionen im Zentrum der Analyse. Er widmet sich der Textanalyse mittels NLP.
Der Artikel "Datenanalyse des sozialen Netzwerks Reddit: Daten beschaffen und auswerten" betrachtete innerhalb der statistischen Auswertungen die Flairs – vordefinierte Labels, die die Autoren der initialen Posts auswählen können. Jedoch zeigte diese Analyse bereits, dass man die Flairs bereinigen muss. Erst dann lassen sich valide Aussagen zur Entwicklung der hierdurch gekennzeichneten Themen ableiten.
Spannend ist nun aber auch die Frage, ob die Flairs überhaupt die inhaltliche Entwicklung der Diskussionen ausreichend wiedergeben können. Immerhin dürfte es den Autoren bei manchen Themen schwerfallen, sich für ein Flair zu entscheiden. Da sie subjektiv auswählen, ist es interessant, unabhängig von vordefinierten Flairs zentrale Themen zu finden und deren Entwicklung über die Zeit zu analysieren, um weitere oder ganz andere Trends aufzudecken.
Das war die Leseprobe unseres heise-Plus-Artikels "Datenanalyse des sozialen Netzwerks Reddit: Inhaltliche Analyse". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.