36C3: BahnMining offenbart die nackte Wahrheit hinter der DB-Pünktlichkeitsquote

David Kriesel hat die Daten der Deutschen Bahn zu 25 Millionen Zug-Halten ausgewertet. Es wird deutlich, welcher wo am häufigsten zu spät oder gar nicht kam.

In Pocket speichern vorlesen Druckansicht 782 Kommentare lesen
36C3: BahnMining offenbart die nackte Wahrheit hinter der DB-Pünktlichkeitsquote

David Kriesel hat die tatsächliche Pünktlichkeit der Bahn untersucht

(Bild: CC by 4.0 36C3 media.ccc.de)

Lesezeit: 6 Min.
Inhaltsverzeichnis

Ende 2018 verriet die Deutsche Bahn (DB), dass 74,9 Prozent aller ihrer Züge im Fernverkehr pünktlich gewesen seien. Obwohl David Kriesel wusste, dass das Transportunternehmen dazu alle zählte, die weniger als sechs Minuten Verspätung hatten, schien ihm die ausgewiesene Quote recht hoch zu liegen. Habe er als Vielreisender doch bei über der Hälfte seiner Fahrten mit der Bahn eine E-Mail vom Verspätungsalarm bekommen.

Der Informatiker begann daher am 8. Januar, die DB "vorratsdatenzuspeichern", wie er am Samstag auf dem 36. Chaos Communication Congress (36C3) in Leipzig berichtete. Im Rahmen seines BahnMinings besorgte er sich demnach übers Jahr hinweg die offiziellen Daten zu 25 Millionen Halten an den rund 5700 Bahnhöfen und wertete diese aus. Der Verkehrsbetrieb selbst gibt nur monatliche und jährliche "Pünktlichkeitswerte" heraus, wonach zuletzt im November die Züge des Fernverkehrs um 1,8 Prozentpunkte pünktlicher unterwegs waren als im Vorjahr.

Der am meisten frequentierte Bahnhof war Kriesel zufolge mit über 380.000 Stopps der in Köln am Dom gefolgt von München Ost. An sechster Stelle rangiere Hamburg Dammtor. Der Datenexperte generierte zugleich eine Karte, auf der er die großen Bahnhöfe nach dem Prozentsatz der Pünktlichkeit einfärbte: Knallrot steht dabei für eine Quote von 60 Prozent, blau für 90 Prozent. In Ostdeutschland hat die Übersicht im Ergebnis einen deutlichen Blaustich, während gerade in Nordrhein-Westfalen so ziemlich alles rot ist.

Köln etwa weist eine Pünktlichkeitsrate von 66 Prozent auf, Kriesels Wohnort Bonn sogar nur 59 Prozent. "Ich wohne nur schlecht", schlussfolgerte der Betroffene daraus. Hamburg schneide mit 60 Prozent aber auch kaum besser ab. Die Hansestadt, Köln, Frankfurt am Main Flughafen und insbesondere der dortige Hauptbahnhof (Hbf) seien auch die Regionen, die am meisten Verspätungsminuten ins Netz hinzufügten: allein beim letzteren liege diese unrühmliche Zahl bei 93.000 im auslaufenden Jahr. Bremen, Berlin Hbf und Spandau gehörten dagegen zu den Gebieten, wo die Bahn am meisten Zeit aufhole.

Unter den Zugtypen ist der ICE am pünktlichsten, während IC und vor allem die international verkehrenden EC schlechter abschneiden. Aber auch der Prozentsatz der Ausfälle liegt bei ICEs mit über fünf Prozent am höchsten. ICs kommen hier auf gut drei, ECs auf rund zwei Prozent. Die meisten unterbliebenen Fahrten gab es am 10 März, als Orkan Eberhardt fast den ganzen Fernverkehr lahmlegte, sowie im Juli. "ICEs haben ein fettes Problem im Sommer", verwies Kriesel hier auf rund acht Prozent Ausfallquote, was "über die Fehlertoleranz" hinausgehe.

Dass die Bahn Komplett- oder Teilausfälle nicht in ihre Statistiken einrechne, bezeichnete der Analyst als "finalen Rettungsstuss". Damit stehe sie bei den Monats- und Jahreszahlen besser da und es lohne sich für den Konzern sogar, Ausfälle zu erzeugen, "um die Pünktlichkeit zu pushen". Wenn die letzten Halte ausfielen, könne der Zug schließlich zumindest pünktlich zurückfahren. Auffällig sei hier, dass bei ICEs gerade die frühen und die späten Stopps besonders oft nicht bedient würden, was als "Scheuer- oder Pofalla-Wende" nach dem aktuellen Verkehrsminister oder dem Infrastrukturvorstand der Bahn bezeichnet werde.

Rot steht für eine Pünktlichkeitsquote von 60 Prozent, blau für 90 Prozent.

(Bild: CC by 4.0 36C3 media.ccc.de)

Beziehe man die Ausfälle mit ein, läge die Bahn nur noch bei 72,5 Prozent Pünktlichkeit im Jahresdurchschnitt, wobei jedes Prozent für voraussichtlich verpasste Anschlusszüge stehe, führte der Statistiker aus. Dass das Unternehmen angeblich kein mathematisches Modell kenne, um Ausfälle zu berücksichtigen, bezeichnete er aus faule Ausrede: es sei einfach, alle geplanten Halte zu zählen und die anzurechnen, die tatsächlich erreicht worden seien.

Weiter herausgefunden hat Kriesel, dass die Pünktlichkeit zum Beginn einer Fahrt größer sei als im weiteren Verlauf. Nach über 500 Minuten auf der Schiene träten die meisten Verzögerungen auf. Verspätungen bis zu 40 Minuten könnten am Ende oft noch ein Stück weit aufgeholt werden, jenseits dieser Marke scheine die Bahn Züge irgendwie aufzugeben. Das Ziel für 2019 – eine Pünktlichkeit von 76,5 Prozent – habe die Bahn nach eigenem Ermessen bereits verfehlt, nach seinen Auswertungen komme sie aktuell auf knapp über 75 Prozent. Im Nahverkehr würden durchwegs über 90 Prozent erreicht.

Den Hackern gab der Beobachter rund 500 Datenkombinationen für Züge mit auf den Weg, die eine Wahrscheinlichkeit von über 50 Prozent aufwiesen, mindestens 20 Minuten verspätet zu sein oder durch DB-Verschulden einen Anschluss nicht zu erreichen. Bei diesen lohne es sich, ein an Züge gebundenes Sparticket zu erwerben, um im Nachgang ein unter den genannten Bedingungen gewährtes "Upgrade" auf den Flex-Tarif zu erhalten. Dies treffe durchschnittlich auf 12,4 Prozent der Stopps zu.

Den Datenbestand herausgeben dürfe er nicht, da die DB daran das Urheberrecht habe, betonte Kriesel. Wer bei der Bahn nach "Timetable API" suche, könne die entsprechenden Messwerte aber selbst herunterladen. Dabei sei nur zu beachten, dass die bei der Gesamtzahl der Bahnhöfe erforderlichen knapp zwei Millionen Abrufe pro Tag rasch bei 40 Gigabyte XML und fürs Jahr bei 15 Terabyte landeten. Er habe daher bei der DB angefragt, ob er "automatisiert Daten runterladen und einen kleinen Community-Vortrag halten" dürfe, was ihm ohne Auflagen genehmigt worden sei. Trotzdem habe er auf anonyme Proxy-Server gesetzt, deren Spuren aussähen wie ein "Grundrauschen winziger Abfragen von der ganzen Welt", um kein Aufsehen zu erregen.

Angesichts des "Aufstiegs der Empörten" im auslaufenden Jahrzehnt riet der Informatiker der versammelten Hackergemeinde, Totschlagargumente selbst verstärkt mit dem Verweis auf die Datenlage zu kontern und sich weder auf die Medien, Influencer oder Politiker zu verlassen. Es empfehle sich, eigene Datenprojekte anzustoßen und "zur engagierten Analyse überzugehen". Die rund 5000 im Vortragssaal anwesenden Teilnehmer dankten ihm für sein Engagement mit Standing Ovations. (tiw)