Datenanalyse mit Python: Erste Schritte mit Pandas – Fussballdaten auswerten

Pandas ist die Standard-Bibliothek für alle, die mit Python Daten verarbeiten möchten. So lässt sich auch die erste Bundesligasaison einfach analysieren.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 17 Min.
Inhaltsverzeichnis

Wer Daten mit Python ver- oder bearbeiten möchte, kommt kaum um die Bibliothek Pandas herum. Sie ist gewissermaßen der Goldstandard für Python, wenn es um strukturierte Informationen geht.

Wie groß die Ursprungsdaten sind, spielt für Pandas keine Rolle: Die Bibliothek kommt mit CSV-Dateien zurecht, dem Excel-Format von Microsoft und auch mit großen Datenmengen in einer JSON-Datei. Dabei ist es egal, ob Sie ein kleines oder großes Datenprojekt angehen möchten, Pandas vereinfacht in der Regel immer den Umgang mit Daten jeder Art.

Programmieren in Python

Wir erklären in diesem Artikel die grundlegenden Konzepte, mit denen Pandas arbeitet: die Series und den Dataframe. Außerdem zeigen wir, wie man sich freie Fußballdaten aus dem Netz holt und so etwa die erste Bundesligasaison 1963/64 analysiert. Grundlegende Python-Kenntnisse sind dafür hilfreich, Sie sollten also schon einmal Bibliotheken mit Pip installiert haben.