Reinforcement Learning mit Python: Wie eine KI lernt, ein Spiel zu gewinnen

Mit Reinforcement Learning reagiert eine KI auf Belohnungen. Wir zeigen, wie Sie das mit Q-Learning in einem kleinen Praxisbeispiel für Python umsetzen können.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Zwei Roboterhände auf einer ergonomischen Tastatur

(Bild: maxuser/Shutterstock.com)

Lesezeit: 16 Min.
Von
  • Lea Reinhart
Inhaltsverzeichnis

Kleinkinder, die gerade laufen lernen und künstliche Intelligenzen wie AlphaGo haben mehr gemeinsam, als man denkt. Beide lernen durch Versuch und Irrtum: Das Kleinkind lernt, wie es seine Beine nutzen kann, um aufrecht zu stehen und sich fortzubewegen. Während AlphaGo lernt, wie es beim Go-Spiel gewinnen kann. Und genau darum geht es auch beim Reinforcement Learning: Ein Agent lernt, ein Problem ohne Vorkenntnisse zu lösen, indem er verschiedene Aktionen ausprobiert und dafür Feedback in Form von Belohnungen und Bestrafungen erhält.

Mehr zu Künstlicher Intelligenz

Zwar können solche Systeme sehr komplex werden, kleinere Probleme lassen sich allerdings bereits mithilfe von simplen Reinforcement-Learning-Agenten lösen. In diesem Artikel zeigen wir, wie Sie einen einfachen Reinforcement-Learning-Agenten mit Python implementieren können. Zudem erklären wir Ihnen die benötigten theoretischen Kernkonzepte und verdeutlichen sie praktisch anhand des Programmierbeispiels.

Das Problem, das der Agent zu lösen hat, wird durch die Umgebung (Englisch Environment) bestimmt. In dieser interaktiven Umgebung ist vorgegeben, welche Aktionen der Agent verwenden kann, um sein Ziel zu erreichen und wann der Agent eine Belohnung erhält. Eine Python-Library, die viele Reinforcement Learning Umgebungen bereitstellt, ist OpenAI Gym. Im Folgenden beschäftigen wir uns mit der Umgebung "Gefrorener See" aus der Library, um die benötigten Konzepte zu verdeutlichen.

Das war die Leseprobe unseres heise-Plus-Artikels "Reinforcement Learning mit Python: Wie eine KI lernt, ein Spiel zu gewinnen". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.