Maschinelles Lernen und "bestärkendes Lernen": OpenAI eröffnet Trainingsbereich für RL-Algorithmen

Die Forschungseinrichtung hat mit der Beta von OpenAI Gym ein Toolkit zum Vergleich von Algorithmen für bestärkendes Lernen vorgestellt.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Maschinelles Lernen: OpenAI eröffnet Trainingsbereich für RL-Algorithmen
Lesezeit: 2 Min.
Von
  • Rainald Menge-Sonnentag

OpenAI ist eine Non-Profit-Organisation, die positive Aspekte von maschinellem Lernen erforschen will. Das Startkapital von Investoren wie Tesla-Chef Elon Musk, LinkedIn-Gründer Reid Hoffman und Amazon Web Services war mit einer Milliarde US-Dollar mehr als komfortabel.

Vier Monate nach der Gründung stellt die Forschungseinrichtung ihr erstes öffentliches Projekt vor: OpenAI Gym ist ein Toolkit zum Entwickeln und Vergleichen von RL-Algorithmen. "Reinforcement Learning" wird in Deutschland als bestärkendes Lernen bezeichnet und beschreibt vereinfacht ausgedrückt ein Training, das die maschinellen Agenten mit Belohnungen in die richtige Richtung weisen will. Damit sollen sie selbst erkennen, welche Auswirkungen ihr Handeln hat und zwischen kurzfristigen und langfristigem Nutzen abwägen.

"Gym" beschreibt im Englischen eine Turnhalle oder ein Fitnessstudio. So gibt es im virtuellen Trainingsbereich unterschiedliche "Geräte" an denen die AI sich messen lassen muss. Zu den Einheiten gehören Atari-Videospielklassiker wie MsPacman und Centipede, typische Kontrollprobleme aus der RL-Literatur wie ein Pendel oder ein Balanceakt und das Brettspiel Go auf 9x9 beziehungsweise 19x19 Feldern. Die Entwickler der Algorithmen können die Bewertungen auf der Open-AI-Site vergleichen.

Die Einheiten sind in Python verfasst, und OpenAI plant Schnittstellen für andere Sprachen. Das Gym ist zu zahlreichen Frameworks wie der Python-Bibliothek Theano und Googles Tensorflow kompatibel. OpenAI Gym besteht aus zwei Komponenten: einer Open-Source-Bibliothek und der Site zum Vergleich der Ergebnisse. Wer selbst mit dem Trainingsraum experimentieren möchte, findet im Tutorial die wichtigsten Informationen (rme)