Evolutionstraining für KI-Algorithmen von selbstfahrenden Autos

Eine effizientere Trainingsmethode für neuronale Netze könnte einen entscheidenden Vorteil in der hart umkämpften Welt des automatisierten Fahrens bieten.

In Pocket speichern vorlesen Druckansicht
Evolutionstraining für KI-Algorithmen von selbstfahrenden Autos

(Bild: Waymo)

Lesezeit: 4 Min.
Von
  • Will Knight
Inhaltsverzeichnis

Ingenieure der Alphabet-Abteilungen Waymo und DeepMind haben sich zusammengetan, um einen effizienteren Prozess zum Trainieren und Optimieren von selbstlernenden Algorithmen des Unternehmens für das autonome Fahren zu finden. Sie verwendeten dafür eine Technik namens populationsbasiertes Training (PBT), das zuvor von DeepMind zur Verbesserung von Videospielen entwickelt wurde. Es orientiert sich an der Evolution, beschleunigt die Auswahl von Algorithmen und Parametern für maschinelles Lernen für eine bestimmte Aufgabe, indem der Kandidatencode aus den "fittesten" Versionen – also jenen, die eine bestimmte Aufgabe am effizientesten ausführen – einer algorithmischen Population ausgewählt wird.

Diese Verfeinerung von KI-Algorithmen könnte Waymo einen Vorteil gegenüber seinen Mitbewerbern verschaffen. In dem Maß, in dem die von selbstfahrenden Autos gesammelte Datenmenge wächst, müssen auch die sie steuernden Algorithmen neu trainiert und kalibriert werden. Inzwischen versuchen Dutzende von Unternehmen, auf echten Straßen die beste Technologie für selbstfahrende Fahrzeuge zu demonstrieren.

"Eine der größten Herausforderungen für jeden, der maschinelles Lernen in einem industriellen System einsetzt, ist es hinzubekommen, das System neu aufzusetzen, um neuen Code zu nutzen", sagt Matthieu Devin, Leiter der Infrastruktur für maschinelles Lernen bei Waymo. "Wir müssen das Netz ständig neu trainieren und unseren Code neu schreiben. Und wenn Sie neu trainieren, müssen Sie möglicherweise Ihre Parameter anpassen."

Moderne selbstfahrende Autos werden durch Algorithmen und Techniken mit fast Rube Goldberg-hafter Komplexität gesteuert. Sie müssen etwa Straßenlinien, Schilder, andere Fahrzeuge und Fußgänger aus Sensordaten erkennen. Diese wirken mit konventionellem, also handgeschriebenem Code zusammen, um das Fahrzeug zu steuern und auf verschiedene Eventualitäten zu reagieren. Jede neue Iteration eines selbstfahrenden Systems muss in der Simulation rigoros getestet werden.

Aktuelle selbstfahrende Fahrzeuge sind in hohem Maße auf das sogenannte Deep Learning angewiesen. Die Konfiguration eines tiefen neuronalen Netzwerks mit den richtigen Eigenschaften und Parametern – Werte, die zu Beginn fest codiert sind – ist jedoch eine schwierige Aufgabe. Kandidaten-Netzwerke und -Parameter werden meist manuell ausgewählt, was zeitaufwendig ist, oder zufällig von einem Computer angepasst, was viel Rechenleistung erfordert.

"Bei Waymo trainieren wir Unmengen verschiedener neuronaler Netze, und die Forscher verbringen viel Zeit damit, herauszufinden, wie sie diese am besten trainieren können", sagt Yu-hsin Chen, eine Infrastrukturingenieurin für maschinelles Lernen bei Waymo.

Laut Chen verwendet ihr Team jetzt PBT, um die Entwicklung von Deep-Learning-Code für die Erkennung von Fahrspurmarkierungen, Fahrzeugen und Fußgängern zu verbessern und die Richtigkeit der beschrifteten Daten zu überprüfen, die dann an andere Algorithmen weitergeleitet werden. PBT reduziere dabei die für die Umschulung eines neuronalen Netzes erforderliche Computerleistung um etwa die Hälfte und habe die Geschwindigkeit des Entwicklungszyklus verdoppelt oder verdreifacht.

Google entwickelt eine Reihe von Techniken, mit denen der Prozess der Schulung von Modellen für maschinelles Lernen automatisiert werden kann. Einige davon werden Kunden bereits im Rahmen des Projekts "Cloud Auto-ML" angeboten. Ein effizienteres und automatisierteres KI-Training wird entscheidend für die Bemühungen sein, die Technologie zu kommerzialisieren und profitabel zu machen.

Mehr Infos

Laut dem leitenden DeepMind-Wissenschaftler Oriol Vinyals, einem der Erfinder von PBT, tauchte die Idee für den Einsatz von PBT bei Waymo bei einem Besuch bei Matthieu Devin auf. Vinyals und Kollegen entwickelten die Technik zunächst, um das Training eines Computers für das Spielen des für Maschinen besonders herausfordernden Videokampfspiels StarCraft II zu beschleunigen.

"Eines der coolen Dinge dabei ist, dass Sie die Entwicklung von Parametern visualisieren können", sagt Vinyals. Mithilfe des evolutionären Prozesses von PBT lässt sich auch leichter nachvollziehen, wie ein Deep-Learning-Algorithmus optimiert und optimiert wurde, weil man eine Art Programm-Abstammungsbaum erhält.

(vsz)