Datenanalyse des sozialen Netzwerks Reddit: Daten beschaffen und auswerten

Die großen Mengen nutzergenerierter Daten des Netzwerks lassen sich analysieren und in Beziehung zueinander setzen um daraus avancierende Trends zu erkennen.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 10 Min.
Von
  • Prof. Stefanie Scholz
  • Prof. Christian Winkler
Inhaltsverzeichnis

Diese dreiteilige Artikelserie zeigt, wie sich Daten des sozialen Netzwerks Reddit erschließen lassen. Dabei geht es um mögliche Auswertungen, deren Interpretationen und statistische Validierung. Dieser Artikel beschäftigt sich damit, wie man Daten von Reddit herunterlädt, extrahiert, in eine Datenbank übernimmt und Trends vorhersagt.

Reddit ist eine Social-Media-Plattform, auf der Nutzer Inhalte hochladen können. Andere Mitglieder können diese Posts bewerten. Viele Upvotes lassen einen Post im Ranking steigen, bei Downvotes fällt er.

Anders als Facebook und andere Netzwerke arbeitet Reddit communitybasiert. Communitys (Subreddits) sind grundsätzlich wohlwollend und unterstützen einander. Jedes dieser Subreddits hat viele Millionen Mitglieder und entsprechend viele Beiträge, die oft bis in die Gründungsphase von Reddit im Jahr 2008 zurückgehen. Alle seitdem erzeugten Posts und Kommentare stehen zur Verfügung.