Reinforcement Learning: DeepMind gibt Code fĂĽr Lab2D frei
Die Lernumgebung soll Entwickler, die sich mit Deep Reinforcement Learning beschäftigen, beim Erstellen von 2D-Umgebungen auf Grid-Basis unterstützen.
(Bild: issaro prakalung/Shutterstock.com)
Das zur Google-Gruppe gehörende britische Unternehmen DeepMind hat den Code für Lab2D, einer Lernumgebung zum Erstellen von 2D-Grid-Welten, freigegeben. Lab2D ist in den Programmiersprachen C++ und Lua geschrieben. Die Software richtet sich an Unternehmen, die sich mit Deep Reinforcement Learning beschäftigen.
Mit Lab2D 2D-Umgebungen erstellen
DeepMind stellt mit Lab2D ein System zum Erstellen von 2D-Umgebungen fĂĽr maschinelles Lernen zur VerfĂĽgung. Die Umgebungen sind Grid-basiert (englisch fĂĽr Gitter) und setzen sich aus textbasierten Karten fĂĽr das Layout der Welt und Lua-Code fĂĽr ihr Verhalten zusammen. Machine-Learning-Agenten agieren ĂĽber eine von zwei APIs, die Python-dm_env-API oder die benutzerdefinierte C-API. Letztere verwendet DeepMind Lab, die Lernumgebung fĂĽr 3D-Umgebungen.
Videos by heise
Lab2D unterstützt mehrere Agenten beziehungsweise Spieler, die in derselben Umgebung interagieren können. Diese Spieler können entweder menschlich oder Computer-gesteuert sein. Ihnen steht eine benutzerdefinierte Ansicht der Welt zur Verfügung, die bestimmte Informationen offenbart oder verdeckt. Entwickler können zudem eine globale Ansicht einrichten, die bestimmte Informationen enthält, die den Spielern aber verborgen bleibt. Das kann sowohl für unvollständige Informationsspiele verwendet werden, bei denen die Spieler kein gemeinsames Wissen teilen, als auch für menschliche Verhaltensexperimente, bei denen der Experimentator den globalen Zustand der Umwelt während des Fortschreitens der Episode sehen kann.
Spiele mit unvollständigen Informationen sind Spiele, bei denen Entscheidungen gleichzeitig getroffen werden müssen und die Akteure bei der Entscheidungsfindung alle möglichen Ergebnisse abwägen müssen – beispielsweise ein Kartenspiel, bei dem die Karten jedes Spielers vor den übrigen Spielern verborgen bleiben. Interessierte erhalten über GitHub weiterführende Informationen zu Lab2D.
(mdo)