AlphaZero: Der Computer wird kreativ

David Silver ist es gelungen, ein Computerprogramm zu schreiben, das sich selbst beigebracht hat, zum Schachgroßmeister zu werden.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen
AlphaGo: Der Computer wird kreativ

(Bild: Franck V. / Unsplash)

Lesezeit: 5 Min.
Von
  • Will Knight

Ein Computerwissenschaftler hat etwas erfunden, das erfindungsreicher als er selbst sein könnte. David Silver von der Google-Tochter DeepMind hatte bereits mit AlphaGo – einer Software, die das als extrem schwierig geltende Brettspiel Go auf Großmeisterstufe gemeistert hat – gezeigt, wo die Reise bei Künstlicher Intelligenz hingeht. Rechner analysieren Spiele menschlicher Meister und lernen daraus.

Silvers jüngste Kreation, die Software AlphaZero, geht noch darüber hinaus. Sie lernt Brettspiele wie Go, Schach oder Shogi indem sie übt – und zwar beim Spiel gegen sich selbst. Durch Millionen von Probespielen soll AlphaZero so in der Lage sein, Strategien zu erlernen, für deren Entwicklung die Menschheit Jahrtausende brauchte.

Könnte eine solche KI eines Tages auch Probleme lösen, die dem menschlichen Geist bislang verborgen waren? Im Gespräch mit Technology Review erläutert Silver, was da auf uns zukommt.

Technology Review: In einem berühmten Spiel gegen den womöglich besten Go-Spiele aller Zeiten verwendete Ihre Software AlphaGo einen brillanten Spielzug, den menschliche Beobachter zunächst als Fehler abtaten. War die Maschine in diesem Moment kreativ?

Silver: "Zug 37", wie er später bekannt wurde, hat alle überrascht, inklusive der Go-Gemeinschaft und uns, die Erschaffer von AlphaGo. Es lag so weit außerhalb dessen, was der gewohnte Weg ist, Go zu spielen, wie ihn die Menschen über Tausende von Jahren entwickelt haben. Für mich selbst ist das ein Beispiel für Kreativität, ja.

Da AlphaZero nicht mehr vom Menschen lernen muss: Ist die Software noch kreativer?

Wenn man etwas selbst lernen lässt, dann baut es sein eigenes Wissen ganz von vorne auf. Das wiederum ist fast schon die Essenz von Kreativität. AlphaZero muss alles für sich herausfinden. Jeder einzelne Schritt ist ein kreativer Sprung. Diese Erkenntnisse sind kreativ, weil sie ihm nicht von Menschen mitgegeben wurden. Und solche Sprünge setzen sich fort, bis man bei etwas angekommen ist, das der Mensch nicht könnte und das Potenzial hat, uns zu erstaunen.

Sie haben AlphaZero gegen die besten konventionelle Schach-Software namens Stockfish antreten lassen. Was haben Sie dabei gelernt?

Stockfish ist eine sehr fortschrittliche Suchmaschine, doch das Herz liegt in einem Modul, das sagt: "Laut den Menschen ist das hier eine gute oder eine schlechte Position." Entsprechend spielen Menschen hier eine sehr tiefe Rolle. Davon kann man sich nur schwer trennen und eine Position versehen, die so fundamental anders ist.

AlphaZero lernt, in dem es die Position für sich versteht. Es gab da ein sehr schönes Spiel, bei dem wir uns nur angesehen haben, wie es vier Bauern hintereinander aufgegeben hat und sogar einen fünften opfern wollte. Stockfish dachte, es gewinnt haushoch, doch AlphaZero war sehr mit sich zufrieden. Es fand einen Weg, die Position zu verstehen, die aus den Normen des Schachs heraus eigentlich undenkbar war. Es verstand, dass die Position wichtiger ist als vier Bauern zu behalten.

Legt AlphaZero nahe, dass KI künftig in der wissenschaftlichen Innovation eine Rolle spielen könnte?

Maschinelles Lernen wurde bislang von einem Ansatz namens überwachtem Lernen ("Supervised Learning") beherrscht, bei dem man mit all dem anfängt, was der Mensch weiß und daraus dann ein Computerprogramm destilliert, das genauso vorgeht. Das Schöne an unserem neuen Ansatz, dem bestärkenden Lernen ("Reinforcement Learning"), ist es nun, dass es sich um ein System handelt, das aus sich selbst heraus lernt, wie man die gesetzten Ziele erreicht, vom ersten Prinzip an. Es geht dabei um Millionen kleiner Erkenntnisse, eine nach der anderen, die zu einer kreativen Denkweise führt. Und wenn man das kann, führt das zu etwas mit immenser Kraft, immensen Fähigkeiten, Probleme zu lösen. Hieraus ergeben sich dann hoffentlich große Durchbrüche.

Gibt es Aspekte der menschlichen Kreativität, die sich nicht automatisieren lassen?

Wenn wir über die Fähigkeiten des menschlichen Geistes nachdenken, sind wir von diesem Punkt noch weit entfernt. Wir können Ergebnisse in spezialisierten Bereichen wie Schach oder Go erzielen, wenn wir eine massive Rechenleistung für eine Aufgabe einsetzen. Doch der menschliche Geist ist dazu fähig, radikal zu etwas anderem zu generalisieren. Man kann die Regeln des Spiels verändern und der Mensch braucht keine weiteren 2000 Jahre dafür, herauszufinden, wie er spielen sollte.

Ich würde sagen, dass die große Grenze der KI heute darin liegt, die Bandbreite und die Flexibilität unserer Algorithmen zu erhöhen, damit wir den vollen Bereich abdecken, den der menschliche Geist beherrscht. Da wollen wir hin, aber das wird noch lange dauern.

Wie könnte man soweit kommen?

Ich möchte die Idee eines Systems bewahren, das etwas schaffen kann, ohne von menschlichem Wissen beschränkt zu sein. Ein Baby interessiert sich nicht dafür, welche Karriere es haben wird oder wie viele Kinder es einmal bekommen möchte. Es spielt mit Spielzeugen und lernt dabei, wie man ihnen umzugehen ist. Man kann enorm viel über die Welt erfahren, wenn es kein endgültiges Lernziel gibt. Genauso könnten und sollten unsere Systeme arbeiten.

(bsc)