Roboter, die aus Fehlern lernen, könnten eine neue Ära der KI einläuten
Um endlich wirklich smarte Haushaltsroboter zu entwickeln, geht der Informatiker Lerrel Pinto neue Wege. Roboter sollen Daten bereits beim Lernen sammeln.
- Will Douglas Heaven
Wenn man Lerrel Pinto bittet, seine Arbeit zu erklären, schießt der 31-Jährige gerne eine andere Frage zurück: Wann hast du zuletzt einen coolen Roboter in deinem Haushalt gesehen? Die Antwort hängt in der Regel davon ab, ob der oder die Fragende einen Staubsaugerroboter besitzt: gestern oder noch nie.
Pinto will das ändern. Er forscht an der New York University im Bereich Informatik und möchte, dass Roboter im Haushalt viel mehr tun als nur staubsaugen. Er fragt: "Wie können wir Roboter schaffen, die ein integralerer Bestandteil unseres Lebens sind, die Hausarbeiten erledigen, sich um ältere Menschen kümmern oder Rehabilitationsmaßnahmen durchführen?" Sprich: Die einfach da sind, wenn wir sie brauchen. Auf seinen Ansatz und sein Know-how wurde auch die US-Ausgabe von MIT Technology Review aufmerksam, die Jury des Wettbewerbs "Innovatoren unter 35" wählten Pinto daher in den Kreis der Preisträger.
Das Problem ist, dass für die Ausbildung von Robotern mit verschiedensten Fähigkeiten viele Daten benötigt werden. Pintos Lösung besteht darin, neue Wege zu finden, um diese Daten zu sammeln: Er will die Roboter dazu bringen, Daten bereits beim Lernen zu sammeln – ein Ansatz, der als selbstüberwachtes Lernen bezeichnet wird und unter anderem auch von Metas leitendem KI-Wissenschaftler und Pintos NYU-Kollegen Yann LeCun vertreten wird.
"Lerrels Arbeit ist ein wichtiger Meilenstein bei der Zusammenführung von maschinellem Lernen und Robotik", sagt Pieter Abbeel, Direktor des Robot Learning Lab an der Universität von Kalifornien in Berkeley, "auf seine aktuelle Forschung wird man in einigen Jahren zurückblicken, da er viele der ersten Bausteine für die Zukunft des Roboterlernens gelegt hat."
Aus dem Scheitern lernen
Die Idee eines Haushaltsroboters, der Kaffee kochen oder Geschirr spülen kann, ist Jahrzehnte alt. Aber solche Maschinen sind nach wie vor Science-Fiction. Bei den jüngsten Fortschritten in anderen Bereichen der künstlichen Intelligenz, insbesondere bei den großen Sprachmodellen, wurden riesige Datensätze aus dem Internet verwendet. Mit Robotern sei das nicht möglich, sagt Pinto.
Unternehmen, die selbstfahrende Autos entwickeln, sind Millionen von Stunden auf der Straße unterwegs und sammeln Daten, um die Modelle zu trainieren, die ihre Fahrzeuge steuern. Die Hersteller von Haushaltsrobotern stehen vor einer ähnlichen Herausforderung. Sie zeichnen viele Stunden an Aufnahmen aus der Roboterperspektive auf, die verschiedene Aufgaben in unterschiedlichen Umgebungen zeigen.
Pinto erreichte einen seiner ersten Meilensteine im Jahr 2016. Er erstellte den damals weltweit größten Robotik-Datensatz, indem er Roboter dazu brachte, ihre eigenen Trainingsdaten zu erstellen, diese selbstständig zu beschriften und sie rund um die Uhr ohne menschliche Aufsicht laufen zu lassen.
Seitdem haben er und seine Kollegen Lernalgorithmen entwickelt, die es einem Roboter ermöglichen, sich zu verbessern, während er an einer Aufgabe scheitert. Einem Roboterarm kann es viele Male misslingen, ein Objekt zu greifen, aber die Daten aus diesen Versuchen sind trotzdem wertvoll, um damit ein Modell zu trainieren, das erfolgreich ist. Das Team hat diesen Ansatz sowohl mit einem Roboterarm als auch mit einer Drohne demonstriert, wobei jeder heruntergefallene Gegenstand oder jede Kollision zu einer hart erkämpften Lektion wurde.
Ein weiterer Ansatz, den Pinto verfolgt, ist das Kopieren von Menschen. Einem Roboter wird zunächst gezeigt, wie ein Mensch eine Tür öffnet. Anschließend versucht er es selbst, wobei er seinen Datensatz nach und nach erweitert. Und je mehr Türen der Roboter von Menschen öffnen sieht, desto wahrscheinlicher ist es, dass er eine Tür öffnen kann, die er noch nie zuvor gesehen hat.
Low-Tech für smarte Roboter
Pintos neuestes Projekt ist bemerkenswert, weil es vergleichsweise simpel ist: Der Informatiker hat ein paar Dutzend Freiwillige rekrutiert, die mit iPhones, die an Müllgreifzangen befestigt sind, Videos von sich selbst aufnehmen, wie sie verschiedene Gegenstände in ihrer Wohnung anfassen. Pinto glaubt, dass ein paar Hundert Stunden Filmmaterial ausreichen, um ein robustes Greifmodell zu trainieren.
Diese Datenerfassung wird mit effizienten Lernalgorithmen kombiniert, die es den Robotern ermöglichen, mit weniger mehr zu erreichen. Pinto und seine Kollegen haben gezeigt, dass selbst für geschickte Verhaltensweisen wie das Öffnen einer Flasche mit einer Hand nur eine Stunde Training genügen.
Lerrel Pinto hofft, dass er den Robotern einen ähnlichen Durchbruch wie die großen Sprachmodelle verschaffen kann. Auf diese Weise könnte er dazu beitragen, eine neue Ära der KI einzuleiten. "Es gibt diese Idee, dass der Grund, warum wir Gehirne haben, der ist, dass wir uns bewegen", sagt er. Das habe uns die Evolution mit auf den Weg gegeben, um zu überleben und um Nahrung zu finden.
"Letztendlich glaube ich, dass das Ziel der Intelligenz darin besteht, sich zu bewegen und die Welt zu verändern, und ich glaube, dass die einzigen Dinge, die das können, physische Lebewesen sind – wie zum Beispiel ein Roboter."
Lerrel Pinto ist einer der Preisträger des Wettbewerbs "Innovators under 35". Der von der US-Ausgabe der MIT Technology Review ausgerichtete Wettbewerb zeichnet junge Menschen aus, die Innovationen vorantreiben. Die vollständige Übersicht der ausgewählten Talente findet sich hier. Ausgezeichnet und in einem Porträt dargestellt wurden außerdem Young Suk Jo, Yatish Turakhia und Sharon Li, die zudem den besonderen Titel "Innovator of the Year" erhielt.
(jle)