Unendliche saubere Energie? DeepMind-KI soll Plasma in Fusionsreaktor steuern

Eine unerschöpfliche Energiequelle ist der Traum der Fusionsforschung. Algorithmen von Deepmind könnten dabei helfen, diesen Traum zu verwirklichen.

In Pocket speichern vorlesen Druckansicht 59 Kommentare lesen

(Bild: Deepmind)

Lesezeit: 7 Min.
Von
Inhaltsverzeichnis

DeepMind, die KI-Tochter der Google-Mutter Alphabet, hat seine Algorithmen erneut erfolgreich auf ein schwieriges wissenschaftliches Problem angewendet. In Kooperation mit dem Swiss Plasma Center der Eidgenössischen Technischen Hochschule Lausanne (EPFL) in der Schweiz hat die in Großbritannien ansässige Firma nun ihre Deep-Reinforcement-Learning-KI darauf trainiert, ultraheißes Plasma in einem experimentellen Kernfusionsreaktor zu kontrollieren.

Einem im Journal Nature veröffentlichten Paper zufolge kann das System Physikern helfen, die Funktionsweise der Kernfusion besser zu verstehen und möglicherweise dabei helfen, die Erschließung dieser erträumten unbegrenzten Quelle für saubere Energie zu beschleunigen. "Das ist eine der anspruchsvollsten Anwendungen von Reinforcement Learning in einem Echtsystem", kommentiert Martin Riedmiller, Forscher bei DeepMind.

Bei der Kernfusion werden die Kerne von Wasserstoffatomen zusammengepresst, um schwerere Atome wie Helium zu bilden – ein Vorgang, der auch auf der Sonne abläuft. Dabei wird im Verhältnis zu einer winzigen Menge Ausgangsstoff enorm viel Energie erzeugt, was sie grundsätzlich zu einer sehr effizienten Energiequelle macht. Die Kernfusion ist dabei weitaus sauberer und sicherer als fossile Brennstoffe oder auch die herkömmliche Kernkraft. Letztere nutzt die Kernspaltung, bei der Kerne auseinandergetrieben werden und es entsteht radioaktiver Müll, der entsorgt werden muss.

Die Kontrolle der Kernfusion in Reaktoren ist technisch jedoch sehr schwierig. Das zentrale Problem: Atomkerne stoßen sich gegenseitig ab. Sie in einem Reaktor zusammenzubringen, ist nur bei extrem hohen Temperaturen möglich, die oft Hunderte von Millionen Grad erreichen – heißer als es im Zentrum der Sonne ist. Bei diesen Temperaturen ist Materie weder fest noch flüssig noch gasförmig. Stattdessen geht sie in einen vierten Zustand über, den man Plasma nennt. Es ist eine brodelnde, extrem heiße Teilchen-Suppe.

Die Aufgabe besteht nun darin, das Plasma in einem Reaktor lange genug zusammenzuhalten, um Energie daraus zu ziehen. Im Inneren der Sonne wird das Plasma durch Schwerkraft zusammengehalten. Auf der Erde müssen Physiker und Chemiker eine Reihe von Tricks einsetzen. In einem magnetbasierten Reaktor, einem sogenannten Tokamak, ist das Plasma in einem magnetischen Käfig gefangen. Dabei umschließen horizontale Leiterschleifen das Donut-förmige Reaktorgefäß, in dessen Mitte ein länglicher Solenoid-Magnet sitzt, der einen ringförmigen Strom im Reaktor induziert und das Plasma so weiter aufheizt. Durch die Kontrolle der Stromstärke in den Spulen lassen sich die umgebenden Magnetfelder formen. So wird verhindert, dass das Plasma die Wände des Reaktorgefäßes berührt, was es abkühlen und gleichzeitig den Reaktor schädigen könnte.

Doch die Kontrolle des Plasmas bedingt eine ständige Überwachung und Veränderung des Magnetfelds, die bisherige Regler mehr schlecht als recht schaffen. Das DeepMind-Team trainierte deshalb seinen Reinforcement-Learning-Algorithmus in einer Simulation genau darauf. Das Training mit Reinforcement Learning soll einen Software-Agenten in die Lage versetzten, sich in einer beliebigen Situation so zu verhalten, dass er sein Ziel möglichst stringent verfolgt – und zwar ohne alle möglichen Aktionen für alle möglichen Situationen explizit aufzuschreiben. Das funktioniert im Wesentlichen mit Trial und Error: Er probiert eine Aktion, ist sie zielführend, wird sie beim nächsten Mal mit einer höheren Wahrscheinlichkeit ausgewählt. Ist sie nicht zielführend, wird ihre Auswahlwahrscheinlichkeit verringert. Nach hinreichend vielen Versuchen lernt der Agent eine optimale "Policy".

Mehr ĂĽber Fusionsenergie

Nachdem die KI gelernt hatte, die Form des Plasmas über Magnetimpulse in dem virtuellen Reaktor zu kontrollieren und adäquat zu verändern, ging es an ein Experiment. Die EPFL-Forscher überließen in einem kleinen experimentellen Reaktor dem Algorithmus die Kontrolle, dem Variable Configuration Tokamak (TCV), der an der Hochschule steht. Das Ergebnis: Es war zu erkennen, dass die KI durchaus in der Lage war, den realen Reaktor ohne zusätzliche Feinabstimmung durch den Menschen zu kontrollieren. Der Versuch war allerdings systembedingt sehr kurz: Insgesamt steuerte die KI das Plasma zwei Sekunden lang – so lange kann der TCV laufen, bevor er überhitzt.

Damit die Steuerung funktioniert, erfasst das neuronale Netzwerk der DeepMind-KI 90 verschiedene Messwerte rund 10.000 Mal pro Sekunde. Diese zeigen unter anderem die aktuelle Form und Position des Plasmas. Passend dazu wird dann die Spannung der insgesamt 19 Magneten des TCV konfiguriert. Die so entstandene Rückkopplungsschleife arbeitet weitaus schneller, als die bisher verwendeten PID-Controller. Vor allem aber ist es sehr viel flexibler, denn es ermöglicht, mit nur einer Kontrollstruktur verschiedenste Plasma-Konfigurationen zu erzeugen und zu kontrollieren.

Um das System zu beschleunigen, wurde die KI gleich in zwei neuronale Netze aufgeteilt. Ein großes Netzwerk lernte in der Simulation zunächst, wie man den Reaktor steuert. Diese Fähigkeiten wurden dann in ein kleineres, schnelleres Netzwerk übertragen, das den Reaktor selbst steuert (das sogenannte "Critic/Actor"-Modell). Weil die Simulation, mit der die Software trainiert wurde, allerdings in bestimmten Parameter-Bereichen zu ungenau wird, klammert die Kontroll-Software solche "unsicheren Bereiche" vorsichtshalber aus.

Trotzdem ist der Erfolg beeindruckend. "Das ist eine unglaublich leistungsfähige Methode", meint Jonathan Citrin vom Dutch Institute for Fundamental Energy Research, der die Studie kennt. "Es ist ein wichtiger erster Schritt in eine sehr spannende Richtung." Das Forscherteam glaubt, dass der Einsatz von KI zur Plasma-Steuerung auch das Experimentieren mit verschiedenen Bedingungen in solchen Reaktoren erleichtern könnte. Das wiederum hilft, den Prozess besser zu verstehen und möglicherweise die Entwicklung kommerzieller Kernfusionsreaktoren zu beschleunigen.

Die Forschung daran kommt zwar voran – aber nur langsam. Erst kürzlich hatten Forschende am experimentellen Fusionsreaktor JET zwar gezeigt, dass sie eine sich selbst erhaltende Fusionsreaktion mit Deuterium und Tritium erzeugen können. Um in einem Tokamak eine Fusionsreaktion zu erzeugen, die mehr Energie abgibt, als in sie hineingesteckt wurde, ist jedoch ein großer Reaktor wie der ITER mit supraleitenden Magneten nötig. Der wird jedoch frühestens 2035 fertig. Ob private Unternehmen, die ebenfalls an kleineren Fusionsreaktoren arbeiten und dabei zum Teil ganz andere physikalische Konzepte verfolgen, wirklich schneller sind, bleibt abzuwarten. Bisher ist das Rennen noch völlig offen.

Die Experimentierfreude könnte jedoch steigen. "Mit dieser Art von Steuersystemen können wir ein Risiko eingehen, das sonst problematisch wäre", meint Ambrogio Fasoli, Direktor des Swiss Plasma Center und Vorsitzender des Eurofusion-Konsortiums. Menschliche Bediener seien oft nicht bereit, das Plasma über bestimmte Grenzen hinaus zu belasten. "Es gibt Ereignisse, die wir unbedingt vermeiden müssen, weil sie die Hardware beschädigen." Wenn man jedoch sicher sei, eine Steuerung zu haben, die trotz der Heranführung an die Grenzen der Technik diese nicht überlastet, käme auch eine Erkundung ganz neuer Möglichkeiten infrage. "Wir könnten die Forschung beschleunigen."

(jle)