KI spielt Adventure: Virtuelle Drachen trainieren Algorithmus

Ein textbasiertes Rollenspiel dient Facebook und seinem Forschungspartner Georgia Tech als Spielwiese für maschinelles Lernen.

In Pocket speichern vorlesen Druckansicht 20 Kommentare lesen

(Bild: Facebook)

Lesezeit: 4 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Mehr als nur Fantasy: Ein KI-System, das Aufgaben in einem Textadventure lösen kann, hat mittlerweile sogar gelernt, andere Spieler zu manipulieren. Die Algorithmen sind damit einen Schritt weiter gekommen, Maschinen beizubringen, Sprache als Mittel zur Zielerreichung zu verwenden.

Sprachmodelle wie GPT-3 sind zwar mittlerweile richtig gut darin, vom Menschen verfasste Sätze nachzuahmen und Geschichten wie am Fließband zu erstellen. Genauso können sie auch Blog-Artikel imitieren oder Reddit-Posts. Aber dieser überaus produktive Output ist eben kaum mehr als das: reine Textproduktion. Wenn Menschen hingegen Sprache benutzen, wird sie auch als Mittel zum Zweck verwendet. Unsere Worte sollen überzeugen, anderen etwas befehlen oder sie sogar manipulieren – sie bringen Menschen zum Lachen und zum Weinen.

Um eine KI zu entwickeln, die Wörter mit einer bestimmten Absicht verwendet, haben Forscher des Georgia Institut of Technology in Atlanta zusammen mit Facebooks AI-Research-Abteilung Techniken kombiniert, die natürliche Sprachverarbeitung (Natural Language Processing, NLP) und verstärkendes Lernen (Reinforcement Learning, RL) zusammenbringen. Maschinen lernen so, sich je nach definiertem Ziel sprachlich anders zu verhalten. In den letzten Jahren haben sowohl NLP als auch RL enorme Fortschritte gemacht, doch es gab nur wenig Ansätze ihrer Kombination.

Deshalb haben die Forschergruppen von Georgie Tech und Facebook ihr System nun in einem textbasierten Multiplayer-Game namens LIGHT trainiert, das im vergangenen Jahr von Facebook entwickelt wurde, um die Kommunikation zwischen menschlichen und KI-gesteuerten Spielern zu untersuchen. Das Game ist in einer Fantasy-Welt angesiedelt, in der sich Tausende von mittels Crowdsourcing entstandenen Objekte, Figuren und Orte befinden, für die es eine Beschreibung gibt und mit denen interagiert werden kann. Das erfolgt durch das Tippen von Text wie in klassischen Adventures. Spieler (ob Mensch oder Computer) kommen vorwärts, indem sie Befehle wie "umarme den Zauberer", "schlage den Drachen" oder "entferne den Hut" eintippen. Zudem können sie mit den Chatbot-kontrollierten Figuren kommunizieren.

Um die KI zu motivieren, diese Dinge auszuführen, fügten die Forscher etwa 7500 Aufgaben aus dem Crowdsourcing hinzu, die nicht Teil der ursprünglichen LIGHT-Version sind. Schließlich kreierten sie auch einen Knowledge Graph, also eine Datenbank mit Subjekt-Verb-Objekt-Verhältnissen, die der KI grundlegende Informationen über die Spielwelt gab.

Auch wurden die prinzipiellen Beziehungen der Figuren festgelegt – etwa, dass der Händler einem Wächter nur dann trauen wird, wenn sie befreundet sind. Das Spiel warten dann auf Aktionen (etwa: "Geh in die Berge" oder "Fresse den Ritter"), die ausgeführt werden müssen, um eine Aufgabe zu bestehen ("Baue den größten Schatzvorrat, den ein Drache je besaß!" und dergleichen).

Dank all dieser Daten konnte die KI so trainiert werden, dass sie ihre Aufgaben allein mittels Sprachverwendung löste. Die Maschinen konnten dafür entweder ein Kommando für diese Aktion selbst "tippen" oder sie konnten alternativ mit anderen Figuren kommunizieren. Wenn die KI beispielsweise ein Schwert benötigte, konnte sie entscheiden, ob sie eines stehlen oder eine andere Figur überzeugen musste, ihr eins zu reichen.

Aktuell handelt es sich bei dem System noch um einen Prototypen, ja fast ein Spielzeug. Und seine Art kann ganz schön unverblümt sein. An einer Stelle, als es einen Eimer braucht, sagt das System: "Gib mir den Eimer oder ich verfüttere dich an meine Katze!" (bsc)