Wenn Roboter um Hilfe bitten

Vertrauensbewertungen helfen großen Sprachmodellen, Unsicherheiten zu erkennen. Das könnte der Schlüssel zu sicheren und vertrauenswürdigen Robotern sein.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Roboter, Softbank Robotics

(Bild: Allen Ren et al./Princeton University)

Lesezeit: 5 Min.
Von
  • June Kim
Inhaltsverzeichnis

Auf dem Küchentisch stehen zwei Schüsseln, eine aus Plastik, die andere aus Metall. Ein Roboter wird gebeten, die Schüssel zu nehmen und sie in die Mikrowelle zu stellen. Welche Schüssel wird er wählen? Ein Mensch würde vielleicht nachfragen, welche Schüssel gemeint ist. Der Roboter könnte bei so einem ungenauen Auftrag die Metallschüssel in die Mikrowelle stellen und Funken fliegen lassen.

Dieses Problem will ein neues Trainingsmodell mit dem Namen "KnowNo" lösen, indem es den Robotern beibringt, bei Unklarheiten um Hilfe zu bitten. Gleichzeitig wird sichergestellt, dass nur dann nachgefragt wird, wenn es wirklich nötig ist. Das Ergebnis ist ein intelligenter Assistent, der versucht zu verstehen, was man möchte, ohne zu sehr zu stören. Das Paper mit den Forschungsergebnissen wurde auf der Conference on Robot Learning im November vorgestellt.

Andy Zeng ist Forscher bei Google DeepMind und hat die neue Technologie mitentwickelt. Seiner Meinung nach sind Roboter zwar in vielen spezifischen Szenarien sehr leistungsfähig, versagen aber oft bei allgemeinen Aufgaben, die einen gesunden Menschenverstand erfordern.

Bittet man zum Beispiel einen Roboter, eine Cola zu holen, muss der erst verstehen, dass er in die Küche gehen, den Kühlschrank finden und die Kühlschranktür öffnen muss. Bislang mussten diese kleinen Teilschritte manuell programmiert werden, weil der Roboter sonst nicht weiß, dass Menschen ihre Getränke normalerweise in der Küche aufbewahren.

Hier könnten große Sprachmodelle Abhilfe schaffen, weil sie eine Menge Wissen über gesunden Menschenverstand eingebaut haben, meint Zeng.

Wenn der Roboter nun aufgefordert wird, eine Cola mitzubringen, kann das Sprachmodell mit seinem allgemeinen Verständnis über die Welt eine Schritt-für-Schritt-Anleitung für den Roboter erstellen.

Das Problem ist nur, dass nicht garantiert werden kann, dass die Schritte für den Roboter tatsächlich ausführbar sind. Vielleicht hat die Person keinen Kühlschrank in der Küche oder der Türgriff des Kühlschranks ist kaputt. In solchen Situationen müssen die Roboter den Menschen um Hilfe bitten.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

KnowNo macht das möglich, indem es große Sprachmodelle mit statistischen Werkzeugen kombiniert, die das Vertrauensniveau quantifizieren.

Bei einer mehrdeutigen Anweisung wie "Stell die Schüssel in die Mikrowelle" generiert KnowNo zunächst mithilfe des Sprachmodells mehrere mögliche nächste Aktionen. Dann erstellt es einen Vertrauenswert, der die Wahrscheinlichkeit vorhersagt, dass jede mögliche Wahl die beste ist.

Diese Vertrauensschätzungen werden mit einem vorher festgelegten Schwellenwert verglichen, der genau angibt, wie zuversichtlich oder zurückhaltend der Benutzer den Roboter bei seinen Aktionen haben möchte. Ein Roboter mit einer Erfolgsquote von 80 Prozent sollte zum Beispiel in mindestens 80 Prozent der Fälle die richtige Entscheidung treffen.

Das ist in Situationen mit unterschiedlichem Risikograd nützlich, sagt Anirudha Majumdar, Assistenzprofessor für Maschinenbau und Luft- und Raumfahrttechnik an der Princeton University und Hauptautor der Studie. Einen Putzroboter möchte man vielleicht nicht zu sehr beaufsichtigen, daher wären einige Fehler hier und da nicht so schlimm. Aber für medizinische Anwendungen müssen Roboter extrem vorsichtig sein und den größtmöglichen Erfolg erzielen.

Gibt es mehrere Optionen für das weitere Vorgehen, hält der Roboter inne, um nachzufragen, anstatt blindlings weiterzumachen: "Welche Schale soll ich aufheben – die aus Metall oder die aus Plastik?"

KnownNo wurde an drei Robotern in über 150 verschiedenen Szenarien getestet. Die Ergebnisse zeigten, dass mit KnowNo trainierte Roboter gleichmäßigere Erfolgsquoten hatten und weniger menschliche Hilfe benötigten als solche, die ohne die gleichen statistischen Berechnungen trainiert wurden.

Lernen Roboter, Unsicherheiten zu erkennen und darauf zu reagieren, kann das ihre Leistung verbessern – denn die menschliche Sprache ist oft mehrdeutig.

Studien zeigen, dass Menschen Roboter bevorzugen, die Fragen stellen, sagt Dylan Losey, ein Assistenzprofessor an der Virginia Tech, der sich auf die Interaktion zwischen Mensch und Roboter spezialisiert hat und nicht an dieser Forschung beteiligt war. Bitten Roboter um Hilfe, erhöht das die Transparenz über den Entscheidungsprozess, was zu besseren Interaktionen führt, sagt er.

Allen Ren, Doktorand der Princeton University und Hauptautor der Studie, sagt, dass es weitere Möglichkeiten gibt, mit denen KnowNo verbessert werden kann. Derzeit geht man davon aus, dass die Sicht des Roboters immer einwandfrei ist, was bei fehlerhaften Sensoren nicht immer der Fall ist. Außerdem kann das Modell aktualisiert werden, um mögliche Fehler aufgrund von menschlicher Hilfe zu berücksichtigen.

Die Fähigkeit von KI, Unsicherheiten auszudrücken, werde dazu führen, dass wir Robotern mehr vertrauen, meint Majumdar. "Die Quantifizierung von Unsicherheiten ist ein fehlendes Element in vielen unserer Systeme", sagt er. "Dadurch können wir besser einschätzen, wie sicher und erfolgreich die Roboter sein werden.

(jle)