KI in Python: Mit neuronalen Netzen ein selbstlernendes System entwickeln

Bei Umgebungen mit vielen Zuständen stößt Q-Learning an seine Grenzen. Mit Deep-Q-Learning setzt man neuronale Netze ein, um ein Problem effizient zu lösen.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen

Erstellt mit Midjourney durch heise online.

Lesezeit: 23 Min.
Von
  • Lea Reinhart
Inhaltsverzeichnis

Eine Künstliche Intelligenz (KI) wie ChatGPT nutzt neuronale Netze, um selbstständig auf eine Eingabe eine möglichst passende Antwort zu finden. Aber wie genau funktioniert so ein neuronales Netz? Und wie kann ein Nutzer es einsetzen, um ein eigenes selbstlernendes System zu entwickeln? In diesem Artikel erklären wir ausführlich die Konzepte von Deep-Q-Learning, bei dem man ein neuronales Netz einsetzt.

Wir zeigen, wie Deep-Q-Learning anhand des CartPole-Problems funktioniert: Die KI soll einen virtuellen Stab auf einem Karren balancieren und dabei in jeder Situation möglichst die optimale Aktion ausführen, damit der Stab nicht umfällt. Dabei erklären wir verschiedene Aspekte neuronaler Netze und wie man sie beim Deep-Q-Learning einsetzt. Außerdem beschreiben wir feste Q-Targets und Replay Buffer.

Mehr zu Künstlicher Intelligenz

So sieht das CartPole-Problem aus: Ein Stab balanciert auf einem Wagen, den die KI steuern kann. Nun darf der Stab nicht umfallen.

Deep-Q-Learning ist dabei nicht nur für KI-Entwickler interessant, sondern auch für jeden, der verstehen möchte, wie Maschinen durch Trial-and-Error selbstlernende Systeme entwickeln können, die in der Lage sind, komplexe Aufgaben zu bewältigen. Da wir mit diesem Artikel tief in die Materie einsteigen, setzen wir Grundkenntnisse in Python und Machine Learning voraus. Wer noch eine kurze Auffrischung braucht, findet in unserem Einstiegsartikel zum Q-Learning einen einfachen Zugang zum Thema und die Erklärungen für viele der hier verwendeten Fachbegriffe.

Das war die Leseprobe unseres heise-Plus-Artikels "KI in Python: Mit neuronalen Netzen ein selbstlernendes System entwickeln". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.