Auto-Pilot

Autobahncruiser wünschen sich schon seit langem eine Software, der sie auf Langstrecken das Steuer in die Hand geben können. Verstärkungslernen ist ein viel versprechender Ansatz, Computer das Fahren zu lehren.

vorlesen Druckansicht 3 Kommentare lesen
Auto-Pilot
Lesezeit: 17 Min.
Von
  • Gernot Goppelt
Inhaltsverzeichnis

Autobahn-Cruiser wünschen sich schon lange eine Software, der sie auf Langstrecken das Steuer in die Hand geben können. Verstärkungslernen (Reinforcement Learning) ist ein ebenso interessanter wie viel versprechender Ansatz, Computer das Fahren zu lehren.

Langweilige Kolonnenfahrten und drögen Stadtverkehr könnte man wie andere stupide Tätigkeiten an eine Maschine delegieren, wenn es nur intelligente Systeme gäbe, die zuverlässig zwischen Fußgängern und Asphalt unterscheiden. Dem Computer das Autofahren beizubringen, gestaltet sich deutlich schwieriger als Fahrstunden für Menschen, dennoch funktioniert Verstärkungslernen für Computer auf demselben bewährten Prinzip von Belohnung und Strafe, das sich in jeglicher Form von Dressur bewährt hat.

Auto-Pilot (10 Bilder)

Bis zum autofahrenden Computer ist es noch ein langer Weg. Die Uni Siegen befasst sich schon seit längerem damit, ein autonomes Fahrsystem zu bauen.

Simulation mit „Need for Speed“

Die Uni Siegen, Institut für Echtzeit Lernsysteme unter Leitung von Prof. Klaus-Dieter Kuhnert, beschäftigt sich schon seit längerem damit, ein autonomes Fahrsystem zu bauen; ein System also, das letztendlich eigenständig Auto fahren soll. In der jetzigen Phase fährt es nur auf einem Simulator. Das hat nicht nur finanzielle Vorteile, auch die Lernsituationen lassen sich leichter anpassen und die Ergebnisse besser kontrollieren. Selbst die Simulatorsoftware stammt vom Discounter: Es ist „Need for Speed“. Das bekannte Rennspiel erwies sich aufgrund seines realistischen Fahrverhaltens als besonders geeignet.

Ein zweiter Rechner sitzt jetzt quasi an diesem ersten und spielt Autorennen. Nein, wirklich: Eine Kamera filmt das Bildschirmgeschehen für das Lernsystem ab; dieses wiederum gibt per Parallelport Joystick-Kommandos an den Spielerechner. Im Unterschied zu sonst oft unbezahlbarem Equipment kann diese Aufstellung jeder Garagenforscher nachbauen. Die anfangs eingesetzte Kamera ist mittlerweile einem SVHS-Kabel gewichen.

Straße im Blick

Computersteuerungen für Fahrzeuge haben zunächst alle ein gemeinsames Problem: Sie müssen ihre Umwelt korrekt aufnehmen und interpretieren. Menschliche Fahrer nutzen vorwiegend die Augen, für den künstlichen Chauffeur liegt also die Kamera nahe. Gemäß dem chinesischen Sprichwort „Ein Bild sagt mehr als 1000 Worte“ kann aus Videoinformationen eine Fülle an Informationen zur Umwelt entnommen werden; dabei ist aber auch die sinnvolle Extraktion dieser Daten aus einem Videobild diffiziler als etwa das direkte Abfragen von Positions- oder Distanzsensoren. Die meisten Fahrsysteme nutzen das Video als primäre Informationsquelle; die wichtigsten Werte sind dabei die Fahrbahnränder (siehe Kasten „Extraktion der Fahrbahnmarkierungen“) am Ende des Beitrags.

Anhand der nachgebildeten Fahrbahnmarkierungen soll ein Algorithmus nun ein der Situation angemessenes Verhalten produzieren. Dabei gibt es unterschiedliche Ansätze, die meistens auf Regelungstechnik oder neuronalen Netzen basieren. Zu diesen Verfahren gesellt sich seit einiger Zeit die Methode des Verstärkungslernens (Reinforcement Learning).

Belohnung und Bestrafung

Verstärkungslernen beruht auf dem Ansatz, dass Verhalten durch Belohnungen und Bestrafungen gelernt werden kann, selbst wenn diese nicht unmittelbar, sondern zeitlich versetzt erfolgen. Auch erlaubt Verstärkungslernen die permanente Verbesserung von Verhalten, es erlaubt also anders als klassische Verfahren das weitere Lernen im Fahrmodus. Verstärkungslernen zeigt deutliche Ähnlichkeiten zum Lernverhalten beim Menschen, und dieses wiederum wird in der „Triune-Brain“-Theorie gut erklärt.

Drei-Einigkeit im Geiste

Dr. Paul MacLean, Senior Research Scientist am National Institute of Mental Health in den USA, hat deutlich zum Verständnis des menschlichen Gehirns beigetragen. Seine „Triune-Brain“-Theorie [1] legt ein evolutionäres Modell zugrunde und beschreibt das menschliche Gehirn als Kombination von drei einzelnen Subgehirnen, dem Stammhirn (archipallium brain), dem Zwischenhirn (palleomammalian brain) und schließlich dem Großhirn (neopallium brain).