KI-Tourist fragt nach dem Weg

Maschinen werden immer verständiger, doch mit dem echten Verstehen von Worten tun sie sich sehr schwer. Facebook-Forscher versuchen deshalb, Algorithmen in der echten Welt lernen zu lassen wie ein Baby.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Künstlich intelligente Sprache

(Bild: Facebook)

Lesezeit: 3 Min.
Von
  • Will Knight
Inhaltsverzeichnis

Wenn man sich in New York ohne Smartphone und Stadtplan verirrt, wird man wahrscheinlich einen Einwohner nach dem richtigen Weg fragen. Forscher bei Facebook trainieren KI-Programme darauf, ebenfalls solche Auskünfte geben zu können. Dadurch sollen sie zugleich deutlich besser darin werden, Sprache zu verwenden.

Mehr Infos

Die Gruppe Facebook Artificial Intelligence Research (FAIR) in New York hat dazu zwei KI-Programme entwickelt: einen „Touristen“, der sich in New York verlaufen hat, und einen „Reiseleiter“, der dem Software-Kollegen mit Anweisungen in natürlicher Sprache dabei helfen soll, sich zurechtzufinden. Der Tourist sieht Fotos der realen Welt, der Leiter eine 2D-Larte mit den wichtigsten Gebäuden. Zusammen haben die beiden die Aufgabe, ein bestimmtes Ziel zu erreichen.

Die Idee dahinter ist: So wie ein Baby lernt, indem es Worte mit Objekten und Handlungen assoziiert, so soll auch der Tourist-Algorithmus allmählich herausfinden, wie Worte und reale Objekte zusammenhängen – oder zumindest, wie sie sich in eine einfache Straßenansicht der Welt einfügen. KI-Forscher hoffen, dass auf diese Weise trainierte Algorithmen leistungsfähiger in der Verwendung von Sprache werden.

Sprache ist für künstliche Intelligenz immer noch eine enorme Herausforderung. Zwar lassen sich leicht Algorithmen entwickeln, die in der Lage sind, auf einfache Anweisungen zu reagieren oder ein rudimentäres Gespräch zu führen. Komplexe Dialoge aber überfordern Maschinen noch. Zum Teil liegt das daran, dass man für das Auflösen von sprachlicher Uneindeutigkeit ein gewisses Allgemeinwissen über die reale Welt braucht. Einem Algorithmus einfache Regeln dafür zu geben oder ihn mit großen Textmengen dafür zu trainieren, führt oft zu absurden Missverständnissen.

„Eine Strategie für die spätere Entwicklung von KI mit Sprachverständnis auf dem Niveau von Menschen besteht darin, diese Systeme auf eine stärker natürliche Weise zu trainieren, indem man Sprache mit konkreten Umgebungen verbindet“, schreiben die Forscher in einem Blog-Beitrag über ihre Arbeit. „So wie Babys zuerst lernen, das zu benennen, was sie sehen und anfassen können, so begünstigt auch dieser Ansatz – manchmal als verkörperte KI bezeichnet – Lernen im Kontext des Umfelds eines Systems statt mit Hilfe von großen Text-Datensammlungen.“

Die Arbeit der Facebook-Forscher ist ein Versuch, Algorithmen mehr gesunden Menschenverstand zu verleihen, indem deren Sprachverständnis eine Grundlage in Form einer vereinfachten Abbildung der echten Welt bekommt.

Das Konzept von „verkörperter KI“ gibt es schon eine ganze Weile. Bislang wurde darin aber zumeist mit simulierten Umgebungen statt echter Bilder gearbeitet. Mehr Realitätsnähe macht das Vorhaben komplizierter, wird aber unverzichtbar sein, wenn KI-Algorithmen nützlicher werden sollen. Mit einer 360-Grad-Kamera machten die Forscher deshalb Aufnahmen der Viertel Hell's Kitchen, Finanzdistrikt, Upper East Side und Williamsburg. Außerdem ließen sie die Algorithmen mit eigenen Protokollen und Sprachen experimentieren. Wie sich dabei zeigte, lieferte das die besten Ergebnisse.

Den Programm-Code für ihr Projekt nennen die Forscher Walk the Talk und haben ihn zur Nutzung durch andere veröffentlicht. Sie hoffen darauf, dass andere KI-Experten ihn für weitere Forschungen über verkörperte KI und Sprach-Algorithmen verwenden werden.

(sma)