Künstliche Intelligenz: AlphaGo spielt Go gegen Top-Profi Ke Jie

Auf dem "The Future of Go Summit" trifft AlphaGo auf den Weltranglisten-Ersten im Go. Hier geht es nicht mehr um den letzten Showdown zwischen Mensch und Maschine, sondern darum, was Go-Profis von der künstlichen Intelligenz lernen können.

50

(Bild: Google)

23.05.2017, 08:07 Uhr

Lesezeit: 6 Min.

Von

Dr. Harald Bögeholz

Es ist keine wirkliche Frage mehr: Die Maschinen sind den Menschen nun auch im asiatischen Strategiespiel Go überlegen. Über ein Jahr ist es her, dass die Google-Tochter DeepMind mit ihrer künstlichen Intelligenz AlphaGo den koreanischen Spitzenspieler Lee Sedol 4:1 geschlagen hat. Mancher mag sich an die Hoffnung geklammert haben, dass der Mensch noch gewinnen kann, weil Lee Sedol ja "nur" Platz 7 auf der Weltrangliste belegt (Stand heute). Aber DeepMind hat AlphaGo weiterentwickelt und im Januar in Testspielen auf Go-Servern eine spektakuläre Siegesserie gegen Profis hingelegt.

Nun trifft das neue AlphaGo auf die Nummer eins der Weltrangliste: den Chinesen Ke Jie. Schon der Titel der Veranstaltung zeigt, dass es hier nicht um den letzten Showdown Mensch gegen Maschine geht. Auf dem "The Future of Go Summit" in Wuzhen, China wollen die Top-Profis von AlphaGo lernen. Neben dem drei Partien umfassenden Match Ke Jie gegen AlphaGo (die zweite Partie findet am Donnerstag, dem 25. Mai statt) gibt es am Freitag zwei besondere Partien: Paar-Go und ein Team-Turnier.

Zwei gegen zwei

Beim Paar-Go treten Teams aus je zwei Spielern gegeneinander an; menschliche Teams bestehen normalerweise aus einem Mann und einer Frau. Hier ist es jeweils ein Profi plus eine Instanz von AlphaGo: Gu Li (9p, Platz 35 der Weltrangliste) spielt im Team mit AlphaGo gegen AlphaGo plus Lian Xiao (8p, Platz 6). Das Spannende beim Paar-Go ist, dass die beiden Spieler eines Teams abwechselnd ziehen müssen und sich während des Spiels nicht miteinander verständigen dürfen.

Paar-Go-Partien zwischen Amateuren, vor allem wenn die Spielstärke im Team stark unterschiedlich ist, nehmen normalerweise jede Menge unerwarteter Wendungen, weil es eben nicht einfach ist, sich nur durch die Züge auf dem Brett auf eine gemeinsame Strategie zu verständigen. Auf jeden Fall sind solche Partien für den schwächeren Spieler im Team immer sehr lehrreich. Und so ist Paar-Go eine diplomatische Lösung, wie Profis von AlphaGo lernen können, ohne das Gesicht zu verlieren. Denn Partien mit Handicap (der schwächere Spieler bekommt einige Steine als Vorsprung) sind erst einmal noch undenkbar.

Fünf gegen einen

Die Paar-Go-Partie findet am Freitag, dem 26. Mai von 2.30 bis 6.30 Uhr MEZ statt. Anschließend, um ~~7:30~~ 6:30 Uhr tritt ein Team aus fünf Top-Profis gegen AlphaGo an, wobei diese ihre Strategie diskutieren dürfen. Es handelt sich um geballte Weltranglisten-Power: Mi Yuting, Chen Yaoye, Zhou Ruiyang, Shi Yue und Tang Weixing (Plätze 3, 8, 10, 11 und 18).

Ke Jie vs. AlphaGo, Spiel 1

Die erste Partie Ke Jie gegen AlphaGo hat am heutigen Dienstag um 4:30 mitteleuropäischer Zeit begonnen und wird auf YouTube live übertragen.

Bereits die ersten Züge von Ke Jie waren nach Meinung des Kommentators Michael Redmond von Master inspiriert, der Version von AlphaGo, die im Januar auf den Go-Servern abgeräumt hatte. Seitdem haben viele Profis begonnen, mit neuen Zügen zu experimentieren. Zhou Ruiyang (9p) hat gesagt: "AlphaGos Spiel lässt uns die Freiheit spüren, dass kein Zug unmöglich ist. Jetzt versucht jeder, einen Stil zu spielen, der noch nicht ausprobiert wurde."

Update: In der heutigen Partie gegen Ke Jie war AlphaGo nach dreieinhalb Stunden Spielzeit um etwa 7,5 Punkte im Vorteil. Es hatte dabei erst eine Stunde seiner Bedenkzeit verbraucht, während Ke Jie bereits zweieinhalb Stunden investiert hatte. Eine weitere halbe Stunde später sahen die Kommentatoren keine Chance mehr für Ke Jie, die Partie noch zu wenden: "Da müsste er schon den Computer kaputtmachen, aber wo ist der Computer eigentlich?"

AlphaGo gewinnt

Viele würden es als höflich erachten, eine solche Partie aufzugeben, doch Ke Jie spielte bis zum Ende und das Publikum durfte der für europäische Augen höchst merkwürdigen Auszählung der Partie nach chinesischen Regeln beiwohnen. Am Ende verlor der mit Schwarz spielende Ke Jie mit 0,5 Punkten. Ein solch knappes Ergebnis ist durchaus typisch für moderne Go-Programme, weil diese im Endspiel nicht die Punktedifferenz, sondern die Gewinnwahrscheinlichkeit optimieren. Sie geben also bereitwillig den ein oder anderen Punkt noch ab, um den ein Mensch vielleicht noch gekämpft hätte, um dann mit Sicherheit zu gewinnen.

Nie wieder gegen KI

2. Update: Auf der anschließenden Pressekonferenz lobte Ke Jie AlphaGo als hervorragenden Go-Spieler und bedankte sich für die Chance, gegen es spielen zu dürfen. Er kündigte aber auch an, dass dies seine letzten Spiele gegen Computer sein würden. Er glaubt fest daran, dass die KI weiterhin schnelle Fortschritte macht und dass Menchen bald absolut chancenlos sein werden. An solch übermächtigen Gegnern möchte er sich nicht aufreiben, sondern lieber gegen Menschen spielen, bei denen er eine Chance hat zu gewinnen.

In den verbleibenden zwei Spielen gegen AlphaGo wird er sein Bestes geben und hofft, einige exzellente Züge zu finden, sodass er mit sich zufrieden sein kann, auch wenn er verliert. Das soll es dann für ihn aber gewesen sein. Das schließt natürlich nicht aus, AlphaGo als Lehrmeister zu begreifen und weiterhin aus dessen Partien zu lernen.

Weniger Rechenleistung nötig

Auf die Frage nach der Hardware, auf der AlphaGo heute lief, antwortete David Silver aus dem Entwicklerteam, dass es sich um eine einzige Maschine in der Google-Cloud handle, in der die von Google entwickelten KI-Beschleuniger TPU stecken (Tensor Processing Unit). Erst im April hatte Google Details zu deren Architektur und Performance bekanntgegeben.

Durch Verbesserung der Algorithmen brauche die heutige AlphaGo-Version nur noch ein Zehntel der Rechenleistung im Vergleich zur Vorjahresversion, die gegen Lee Sedol gewonnen hatte. Auch sei der Einfluss des ursprünlich aus der Analyse menschlicher Profi-Partien gewonnenen Wissens geringer geworden: AlphaGo bezieht jetzt einen Großteil seiner Spielstärke aus dem Lernen aus Partien gegen sich selbst. DeepMind-Chef Demis Hassabis kündigte an, dass man in den kommenden Monaten Details zur Funktionsweise des neuen AlphaGo veröffentlichen werde. (bo)