Training nur in der Simulation: So soll eine KI das Fahren lernen

Seite 2: Fahren im digitalen Zwilling der realen Welt

Inhaltsverzeichnis

Auch andere Unternehmen sind der Meinung, dass Simulationen ein entscheidender Bestandteil des Trainings und des Testens von KI-Systemen für autonomes Fahren sein sollte. "In vielerlei Hinsicht ist die Simulation sogar nützlicher als das reale Fahren", sagt Jesse Levinson, Mitbegründer und CTO von Zoox, einem Start-up für autonome Fahrzeuge, das 2020 von Amazon übernommen wurde.

Dennoch übertrifft Waabi andere Unternehmen laut eigenen Aussagen darin, wie weit es mit der Simulation alleine kommt. Wie bei Cruise basiert die virtuelle Welt der Firma auf Daten von realen Sensorsystemen, einschließlich Lidar und Kameras. So entsteht ein digitaler Zwilling der realen Welt. Um die virtuelle Welt so realistisch wie möglich zu gestalten, simuliert Waabi dann die Sensordaten, die der Fahr-KI vorgesetzt werden – einschließlich Dingen wie den Reflexionen auf glänzenden Oberflächen, die Bilderkennungssysteme verwirren können. Gleiches gilt für Abgase oder Nebel, die das Lidar-System stören.

Der wichtigste Akteur in Waabi World ist jedoch ein virtueller Fahrlehrer, der gottgleiche Fähigkeiten hat. Während die Fahrer-KI lernt, sich in einer Reihe von Umgebungen zurechtzufinden, lernt ein zweites KI-System, ihre Schwächen zu erkennen – und erstellt spezifische Szenarien, um sie zu testen.

In Waabi World tritt also eine KI gegen eine andere an, wobei der KI-Fahrlehrer lernt, wie er die Fahrer-KI zum Scheitern bringen kann, indem er sie vor maßgeschneiderte Herausforderungen stellt. Die Fahrer-KI lernt wiederum, diese zu bewältigen. Je besser sie wird, desto schwieriger wird es, Szenarien zu finden, in denen sie ausgetrickst werden kann, sagt Urtasun: "Man muss sie Millionen, vielleicht Milliarden von Szenarien aussetzen, um Schwachstellen zu finden." Urtasun denkt, dass das Training der Fahrer-KI in einer umfangreichen Simulation der Art und Weise, wie Menschen selbst neue Fähigkeiten erlernen, am nächsten kommt. "Jedes Mal, wenn wir etwas erlebt haben", sagt sie, "verdrahtet sich unser Gehirn neu".

KI in einer Simulation zu trainieren, indem man sie gegen sich selbst oder einen KI-Gegner antreten lässt – Millionen und Abermillionen Mal – hat sich zu einer sehr leistungsfähigen Technik entwickelt. Auf diese Weise hat die Google-Tochter DeepMind seiner KI das Spielen von Go und "Starcraft" beigebracht; auf diese Weise lernen auch KI-Bots auf virtuellen Spielplätzen wie XLand von DeepMind oder Hide & Seek von OpenAI. Hier werden grundlegende Fähigkeiten durch Versuch und Irrtum vermittelt, die allgemein anwendbar sein sollen.

Der Nachteil, wenn man solchen Systemen in einer Simulation freien Lauf lässt, ist, dass sie lernen können, Schlupflöcher zu finden, die es in der realen Welt nicht gibt. Die Hide & Seek-Bots von OpenAI haben etwa die Fähigkeit entwickelt, in Teams zusammenzuarbeiten, um sich vor anderen KIs zu verstecken – oder sie gemeinsam zu finden. Aber die Systeme fanden auch Lücken in der Simulation, die es ihnen ermöglichte, sich über die vorgebenen Regeln der KI-Physik hinwegzusetzen. Sie katapultieren sich in die Luft oder schieben Objekte durch Wände. Ein Auto sollte hingegen keinesfalls "zu clever" sein.

Waabi muss deshalb dafür sorgen, dass seine Simulation genau genug ist, um zu verhindern, dass die Fahrer-KI solche schlechten Angewohnheiten erlernt. Neuronale Netze werden immer dazu fähig sein, Diskrepanzen zwischen der virtuellen und der realen Welt auszunutzen, sagt Urtasun: "Sie wissen, wie man betrügt." Die Forscherin sagt, dass das Unternehmen Wege entwickelt hat, um die Unterschiede zwischen realer und virtueller Fahrumgebung zu messen und sie so gering wie möglich zu halten. Sie will noch keine Einzelheiten zu dieser neuen Technik nennen, sagt aber, dass Waabi plant, seine Studien zu veröffentlichen.

Wie weit Waabi mit seiner Simulation allein gehen kann, hängt auch davon ab, wie realistisch Waabi World wirklich ist. "Die Simulationen werden immer besser, so dass es immer weniger Dinge gibt, die man im wirklichen Leben lernen kann, die darin noch fehlen", sagt Levinson. "Aber ich glaube, dass es noch lange dauern wird, bis den Unterschied überhaupt nicht mehr gibt."

"Es ist wichtig, ein gesundes Gleichgewicht zwischen Simulation und realen Tests aufrechtzuerhalten", sagt auch Jamie Shotton, leitender Wissenschaftler bei Wayve, einem in Großbritannien ansässigen Unternehmen für autonome Fahrzeugsysteme, das ebenfalls zwischen Fahrten in der Simulation und Fahrten auf realen Straßen hin und her wechselt. "Der ultimative Test für jedes Unternehmen, das autonomes Fahren anbieten will, besteht darin, seine Technik sicher auf der Straße einzusetzen, mit all der Komplexität der realen Hardware."

Urtasun stimmt dem im Prinzip zu. "Es besteht immer noch Bedarf an Tests in der realen Welt", sagt sie. "Aber er ist viel, viel geringer." Was auch immer geschieht, die Forscherin ist der festen Überzeugung, dass der aktuelle Status quo nicht fortbestehen kann. "Alle machen immer das Gleiche, obwohl wir das Problem nicht gelöst haben", sagt sie. "Wir brauchen etwas, das den Prozess beschleunigt. Wir müssen mit einer neuen Denkweise endlich den ganzen Weg gehen."

(bsc)