Python und KI: Analyse großer Sportdatensätze mit dem scikit-learn-Package

Mit scikit-learn gelingen erstaunlich genaue und komplexe Machine-Learning-Analysen von Fussballdatensätzen auch mit geringem Programmieraufwand in Python.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 14 Min.
Von
  • David Kliment
  • Prof. Christian Leubner
Inhaltsverzeichnis

Zehn Spieler können innerhalb von zehn Minuten mit nur drei Bällen über sieben Millionen Datenpunkte erzeugen", erklärte Oliver Bierhoff, Manager der Nationalmannschaft schon während der Fussball-WM 2014 in einer gemeinsamen Presseerklärung von DFB und SAP. Zahlen, Daten und Fakten sollten schon damals zu besseren Trainingsergebnissen und einer optimalen Vorbereitung auf kommende Gegner führen: Zumindest bei der WM 2014 schien das geklappt zu haben, in den Folgejahren konnte wohl auch die Datenanalyse die deutsche Nationalmannschaft nicht retten – das ist aber eine andere Baustelle.

Im Bereich der Datenerfassung und -vermarktung haben sich inzwischen spezialisierte Unternehmen etabliert. Der Anbieter StatsBomb vertreibt unterschiedliche Datensätze und Analysen in einem kostenpflichtigen Angebot.

Für die ersten Schritte und um ein Gefühl für den Aufbau und die Detailtiefe der erfassten Daten zu bekommen, bietet sich aber das kostenfreie Angebot von StatsBomb auf GitHub an. Dieses beschränkt sich auf Spieldaten des FC Barcelona in unterschiedlichen Wettbewerben. Für die erste Division der spanischen Liga, kurz La Liga genannt, sind Spieldaten von der Saison 2003/2004 bis zur Saison 2018/2019 verfügbar, die einen guten Eindruck von den Analysemöglichkeiten vermitteln.