Reinforcement Learning: DeepMind gibt Code für Lab2D frei

Die Lernumgebung soll Entwickler, die sich mit Deep Reinforcement Learning beschäftigen, beim Erstellen von 2D-Umgebungen auf Grid-Basis unterstützen.

(Bild: issaro prakalung/Shutterstock.com)

17.11.2020, 10:45 Uhr

Lesezeit: 2 Min.

Developer

Von

Madeleine Domogalla

Das zur Google-Gruppe gehörende britische Unternehmen DeepMind hat den Code für Lab2D, einer Lernumgebung zum Erstellen von 2D-Grid-Welten, freigegeben. Lab2D ist in den Programmiersprachen C++ und Lua geschrieben. Die Software richtet sich an Unternehmen, die sich mit Deep Reinforcement Learning beschäftigen.

Mit Lab2D 2D-Umgebungen erstellen

DeepMind stellt mit Lab2D ein System zum Erstellen von 2D-Umgebungen für maschinelles Lernen zur Verfügung. Die Umgebungen sind Grid-basiert (englisch für Gitter) und setzen sich aus textbasierten Karten für das Layout der Welt und Lua-Code für ihr Verhalten zusammen. Machine-Learning-Agenten agieren über eine von zwei APIs, die Python-dm_env-API oder die benutzerdefinierte C-API. Letztere verwendet DeepMind Lab, die Lernumgebung für 3D-Umgebungen.

Videos by heise

Lab2D unterstützt mehrere Agenten beziehungsweise Spieler, die in derselben Umgebung interagieren können. Diese Spieler können entweder menschlich oder Computer-gesteuert sein. Ihnen steht eine benutzerdefinierte Ansicht der Welt zur Verfügung, die bestimmte Informationen offenbart oder verdeckt. Entwickler können zudem eine globale Ansicht einrichten, die bestimmte Informationen enthält, die den Spielern aber verborgen bleibt. Das kann sowohl für unvollständige Informationsspiele verwendet werden, bei denen die Spieler kein gemeinsames Wissen teilen, als auch für menschliche Verhaltensexperimente, bei denen der Experimentator den globalen Zustand der Umwelt während des Fortschreitens der Episode sehen kann.

Spiele mit unvollständigen Informationen sind Spiele, bei denen Entscheidungen gleichzeitig getroffen werden müssen und die Akteure bei der Entscheidungsfindung alle möglichen Ergebnisse abwägen müssen – beispielsweise ein Kartenspiel, bei dem die Karten jedes Spielers vor den übrigen Spielern verborgen bleiben. Interessierte erhalten über GitHub weiterführende Informationen zu Lab2D.

(mdo)