Virtuelle Schnitzeljagd soll KIs smarter machen

Facebook und das Georgia Institute of Technology haben virtuelle Welten geschaffen, in denen sich Künstliche-Intelligenz-Systeme austoben können.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 5 Min.
Von
  • Will Knight
Inhaltsverzeichnis

KI-Systemen fehlt oftmals etwas, was man bei Homo Sapiens einen gesunden Menschenverstand nennt. Ein Forscherteam will diesen dem Rechner nun mit Hilfe einer Schnitzeljagd durch ein virtuelles Heim vermitteln – komplett mit simulierten Couchtischen, Sofas, Lampen und Alltagsgegenständen.

Mehr Infos

Die Wissenschaftler des Social-Media-Riesen Facebook und von der Georgia-Tech-Universität haben dazu eine Art Wettstreit für KI-Systeme entwickelt. Ein virtueller Agent muss dabei nach etwas in der Simulation suchen, nachdem er mittels natürlicher Sprache darum gebeten wurde. Der Agent wird dabei beispielsweise im virtuellen Haus in einen zufälligen Raum "gesetzt" und gebeten, etwa die Farbe eines Autos in der Garage zu benennen oder herauszufinden, wo der Couchtisch gerade steht. Das Auffinden dieser Antwort verlangt von dem Agenten, zunächst die Frage zu verstehen und sich dann im virtuellen Raum auf die Suche nach dem relevanten Objekt zu begeben.

"Das Ziel ist die Entwicklung intelligenter Systeme, die sehen, sprechen, vorausplanen und logisch agieren können", so Devi Parikh, Computerwissenschaftlerin an der Georgie Tech und bei Facebook AI Research (FAIR), die die virtuelle Schnitzeljagd mit ihrem Kollegen und Ehemann Dhruv Batra entwickelt hat.

Parikh, Batra und ihre Kollegen bauten einen Agenten, der verschiedene Formen von maschinellem Lernen kombiniert, um Fragen über ein Heim zu beantworten. Er entwickelt auch eine Form von gesundem Menschenverstand durch viel Trial and Error. So findet er die besten Orte für seine Suche – beispielsweise, dass Autos in der Garage stehen und Garagen normalerweise zu finden sind, wenn die Haus- oder Hintertür hinausgeht.

Der Ansatz basiert auf dem sogenannte Reinforcement Learning, eine Form maschinellen Lernens, die von tierischem Verhalten inspiriert wurde. Auch das Imitation Learning, eine Technik, bei der Algorithmen vom Beobachten lernen, wird verwendet. Das virtuelle Heim wurde von FAIR-Forschern sowie an der University of California in Berkeley gebaut.

Eine wachsende Zahl von Forschern experimentiert mit virtuellen Umgebungen, um KI-Systeme zu trainieren. Der Ansatz wird als Weg gesehen, ihre Fähigkeiten zu erweitern und grundsätzliche Einschränkungen in der Echtwelt zu umgehen. Zwar gibt es in jüngster Zeit in Sachen KI große Fortschritte, doch geht es dabei zumeist darum, dass ein Rechner eine einzelne Aufgabe erledigt, etwa das Erkennen von Gesichtern in Bildern oder das Meistern eines Brettspiels. Hinzu kommt, dass KI-Programme normalerweise mit Standbildern und nicht in 3D-Umgebungen trainiert werden.

Frühe KI-Versuche zeigen, dass es unpraktikabel ist, Wissen in die Software "hineinzukodieren". Entsprechend ist die Lösung, dass KI-Programme ihr Wissen selbst erlernen.

Microsoft hat eine Umgebung namens Malmo publiziert, die auf dem Spiel Minecraft basiert. Forscher am Allen Institute for AI (Ai2) in Seattle haben eine weitere 3D-VR-Umgebung gebaut, die KI-Agenten trainieren kann. Dabei werden grundlegende physikalische Gesetze beachtet, die Agenten erlauben, einfache Aktionen durchzuführen. Die Ai2-Forscher wollen ihre Agenten auch mit natürlicher Sprache herausfordern.

Roozbeh Mottaghi, leitender Forscher hinter dem Ai2-Projekt, meint, es sei von großer Wichtigkeit, dass diese virtuellen Umgebungen realistischer werden, damit KI-Agenten wirklich sinnvoll lernen können. Aktuell ist das noch etwas unpraktisch. "Die Gestaltung eines einzigen, realistisch aussehenden Raums kann Monate dauern und es ist teuer." Auch das Definieren realistischer physischer Eigenschaften jedes Objekts sei eine große Herausforderung.

In nächster Zeit könnten die Verfahren aber dabei helfen, dass Chatbots und andere KI-Assistenten nicht mehr ganz so dumm sind. Andere Aufgaben, die längerfristig angelegt sind, etwa das Verstehen natürlicher Sprache, brauchen länger. Eine Maschine kann zwar Muster in einem Text wiederholen, hat aber Schwierigkeiten mit Mehrdeutigkeiten in der Sprache und es fehlt an gesundem Menschenverstand, wie die echte Welt tickt. Virtuelle Umgebungen mit ihrem Lernpotenzial könnten dabei helfen, dass die Systeme weniger Fehler machen.

Facebook kennt das Problem aus eigener Erfahrung. Die Firma schuf einen allgemeinen virtuellen Assistenten namens M, der ab 2015 zur Verfügung stand. Wenn die Software die Fragen nicht verstand, mussten Menschen eingreifen. Der Dienst kam bei den Nutzern jedoch nicht wirklich an und wurde schließlich letztes Jahr eingestellt.

Die neuen Verfahren eignen sich auch für noch futuristischere Projekte. Man stelle sich etwa einen Staubsaugerroboter vor, der im Schlafzimmer tätig werden soll. Selbst wenn die Maschine Stimme und Umgebung versteht, wüsste sie nicht, was ein Schlafzimmer ist und wie man es finden kann. Spätere KI-Programme, die aus dem Modell gelernt haben, könnten das aber von sich aus beherrschen.

"Wir bewegen uns klar zu einem Zeitalter hin, in dem Agenten uns helfen werden", meint Batra. Das kann man schon daran sehen, das etwa Amazon angeblich an einem Heimroboter mit Echo-Technik werkeln soll. "Diese Dinger werden Augen bekommen und einem dann den ganzen Tag über folgen."

(bsc)