Hackerkonferenz rC3: Per Datenanalyse das Bikesharing optimieren

Ein Physikstudent in Marburg störte sich daran, dass Leihräder an Stationen oft in Eilsituationen vergriffen waren. Mit einem Daten-Scraper fand er die Lösung.

In Pocket speichern vorlesen Druckansicht 47 Kommentare lesen

(Bild: lzf/Shutterstock.com)

Lesezeit: 4 Min.

In Marburg betreibt der Bikesharing-Anbieter Nextbike 37 feste Leihstationen mit rund 230 Rädern. Das sind nicht sehr viele für eine Stadt mit rund 76.000 Einwohnern, von denen rund 25.000 Studenten sind. Als einer von ihnen ärgerte sich Martin Lellep darüber, just dann kein mietbares Fortbewegungsmittel vorzufinden, wenn er ein solches dringend benötigt hätte, um etwa einen Bus zu erreichen. Also baute er sich mit einem Web-Scraper ein Programm, um Daten der Nextbike-Räder zu sammeln, zu speichern und zu analysieren.

Die einschlägige Programmierschnittstelle (API) von Nextbike hatte der Open-Data-Aktivist Constantin Müller alias ubahnverleih bereits per Reverse Engineering nachgebaut und für iOS auf seiner Github-Seite – zusammen mit vielen anderen Datenzugangspunkten für Sharing-Anbieter aus aller Welt – veröffentlicht. Lellep fragte diese alle 30 Sekunden zwischen März und Dezember 2020 sowie Juni und Dezember 2021 ab, wie er am Mittwoch auf dem virtuellen Hackertreffen rC3 (remote Chaos Communication Congress) darlegte. Dazu schrieb er in Python eine einfache Extract-Transform-Load-Pipeline (ETL) und Analysecode, um die insgesamt über eine Million erhobenen Datenpunkte auf seinem Server zuhause verarbeiten zu können.

Beim Bikesharing fallen viele Daten an. Martin Lellep hat einen Anbieter in Marburg untersucht und unter anderem die Vorteiler der Radnutzung herausgestellt. In seinem Blog finden sich viele interaktive Grafiken zu seiner Untersuchung.

(Bild: Blog-Eintrag von Martin Lellep, dort gibt es ergänzendes Material und interaktive Grafiken)

Alle Marburger Leihfahrräder haben eine einzigartige ID. Lellep erstellte nun unter anderem eine interaktive Karte mit den Nextbike-Stationen und der Zahl der dort durchschnittlich geparkten Drahteseln. Es stellte sich heraus, dass die meisten Mietstellen im Zentrum lagen. Das größte Angebot gab es am Hauptbahnhof, während am kleineren Südbahnhof oft alle Räder vergriffen waren.

Der Physiker, der momentan in England für seine Doktorarbeit forscht, ließ sich auch ein Histogramm für die Nutzungszeit über die einzelnen Stunden der Wochentage auswerfen. Die größte Nachfrage herrschte demnach am Montagmittag und -nachmittag. Auch an anderen Wochentagen war mittags sowie am frühen Abend gegen 18 Uhr Primetime. Samstags waren die Räder ab 13 Uhr bis abends begehrt. In Mitte der Woche war die Lage relativ entspannt, am Freitagmorgen besonders einfach, ein Bike zu bekommen. Am Hauptbahnhof war die Wahrscheinlichkeit, ein Rad zu finden, generell hoch. An der Uni-Fachschaft für Wirtschaftswissenschaften waren die Ständer dagegen zu 70 Prozent über den Tag verteilt leer. Generell empfiehlt es sich Lellep zufolge, kleinere Stationen möglichst zu vermeiden.

Damit auch Stadtplaner für den Radverkehr Schlüsse aus dem Datenmaterial ziehen können, baute der Forscher eine Matrix und Netzwerkgrafik mit den Übergängen der Räder von einer Station zur anderen mit rund 1400 Einträgen und über 3000 potenziellen Verbindungsmöglichkeiten. Daraus lässt sich ablesen, dass ein gemietetes Utensil häufig an der gleichen Stelle zurückgegeben wird. Dies gilt vorwiegend für Stationen im Außenbereich, die recht isoliert wirken. Die populärste, über 2000-mal gefahrene Route führte vom Hauptbahnhof zum Ginseldorfer Weg im Norden. Laut Lellep bietet es sich daher, dort und auf anderen viel genutzten Strecken die Radinfrastruktur auszubauen.

Die in den gut 15 untersuchten Monaten bei 207.000 Trips insgesamt zurückgelegte Distanz betrage 322.658 Kilometer, führte der Datenanalyst aus. Diese Strecke reiche "mehrfach um die Erde". Die Nutzer hätten dabei 8,6 Millionen Kalorien verbraucht, was dem Gehalt von tausenden Nutella-Gläsern entspreche, sowie 40.332 Kilogramm CO₂ und 25.813 Liter Treibstoff im Wert von fast 34.000 Euro eingespart. Die Quote der Inanspruchnahme der Räder sei im Sommer am höchsten. In den überlappenden Monaten der beiden einbezogenen Jahre sei die Zahl der geparkten Bikes in diesem Jahr gegenüber 2020 gestiegen, was eventuell mit mehr Homeoffice in Pandemiezeiten zusammenhänge.

Mit Maschinenlernen seien mittlerweile auch recht präzise Vorhersagen für verfügbare Räder an einzelnen Stationen möglich, berichtete Lellep. Er habe hier ein entsprechendes Projekt zusammen mit dem AstA Marburg aufgesetzt. Generell zeigten die Analysen, dass sich die Lebensqualität der Bewohner und Bikesharing-Fans der hessischen Stadt "bei moderaten Kosten" verbessern lasse.

(ps)