iX 7/2021
S. 116
Praxis
Data Science

Datenanalyse eines sozialen Netzwerks, Teil 1: Daten beschaffen und auswerten

Beziehungssache

Prof. Dr. Stefanie Scholz, Dr. Christian Winkler

Reddit beherbergt große Mengen nutzergenerierter Inhalte. Wenn man diese Daten herunterlädt, analysiert und in Beziehung zueinander setzt, lässt sich erkennen, welche Themen zum Trend avancieren.

Diese dreiteilige Artikelserie zeigt, wie sich Daten des sozialen Netzwerks Reddit erschließen lassen. Dabei geht es um mögliche Auswertungen, deren Interpretationen und statistische Validierung. Dieser Teil beschäftigt sich damit, wie man Daten von Reddit herunterlädt, extrahiert, in eine Datenbank übernimmt und Trends vorhersagt.

Reddit ist eine Social-Media-Plattform, auf der Nutzer Inhalte hochladen können (siehe Kasten „Im Aufwind“). Andere Mitglieder können diese Posts bewerten. Viele Upvotes lassen einen Post im Ranking steigen, bei Downvotes fällt er.

Kommentieren