Go-Weltmeisterschaft in Osaka: Korea gewinnt, Computer wird Dritter

Die dreitägige Weltmeisterschaft im Strategiespiel Go zwischen den drei Go-Nationen und einer künstlichen Intelligenz ist vorüber. Korea gewinnt vor China, Japan verliert und das Go-Programm DeepZenGo erringt mit dem dritten Platz einen Achtungserfolg.

40

(Bild: www.worldgochampionship.net)

23.03.2017, 09:22 Uhr

Lesezeit: 5 Min.

Von

Dr. Harald Bögeholz

Go-Weltmeisterschaft in Osaka: Korea gewinnt, Computer wird Dritter

Für die Computer-Go-Szene war es sicherlich eine Erleichterung, dass das japanische Go-Programm DeepZenGo von drei gespielten Partien immerhin eine für sich entscheiden konnte. Mehr war vielleicht nicht zu erwarten, wenn man gegen die Elite der starken Go-Nationen antritt – ohne das stärkste Go-Programm auf diesem Planeten zu sein.

Das dürfte nach allem, was man weiß, das Programm AlphaGo der Google-Tochter DeepMind sein, das im März 2016 4:1 gegen den Top-Profi Lee Sedol gespielt hatte und seitdem im stillen Kämmerchen weiterentwickelt wurde (siehe unten).

Auf der vom japanischen Go-Institut Nihon Kiin veranstalteten Weltmeisterschaft trat gegen die Vertreter der drei Go-Nationen China, Japan und Korea DeepZenGo als stärkstes japanisches Go-Programm an. Es verlor seine ersten beiden Partien nach dem gleichen Muster: Es kam extrem knapp an den Gegner heran, aber nicht ganz. Dann begann es, Verzweiflungszüge zu machen, die noch mehr Punkte verschenkten, und gab auf.

Bei Zens erster Niederlage am Dienstag wurde über eine Schwäche spekuliert, die mit der Punktegutschrift "Komi" für den weißen Spieler zusammenhängt. Das neuronale Netz für die Stellungsbewertung von Zen war nämlich auf einen Wert von 7,5 Punkten trainiert, gespielt wurde aber mit 6,5 Punkten.

Hinter dem Horizont

Um auf Nummer sicher zu gehen, hat das DeepZenGo-Team das Programm für seine zweite Partie am Mittwoch auf einen Komi-Wert von 5,5 Punkten eingestellt; es sollte als Weiß also idealerweise einen Punkt mehr anstreben als nötig. Dass es auch diese Partie verlor, hat laut Entwickler Hideki Kato andere Gründe als das Komi. Auf der Computer-Go-Mailingliste bestätigte er, was die Profi-Kommentatoren schon vermutet hatten: Zen hatte den Status einer Gruppe falsch eingeschätzt, sich im Vorteil gewähnt und Sicherheitszüge gemacht, die aber in der tatsächlichen Spielsituation nicht gut genug waren. Hideki Kato sprach von einem "horizon effect": Der wahre Status der Gruppe lag hinter dem Horizont der Suche.

Das kennt man eigentlich nur von Programmen, die mit normaler Baumsuche arbeiten und einfach nicht weit genug sehen können, aber auch bei Monte-Carlo-Suche kann so etwas auftreten, wenn die Wahrheit tief im Suchbaum an einer Stelle verborgen ist, die nur mit geringer Wahrscheinlichkeit aufgesucht wird (gesteuert von einem Value Network, das die Fehleinschätzung teilt).

Der Endstand der Go-Weltmeisterschaft in Osaka.

Spieltag 3

Am heutigen Donnerstag spielte Zen nun endlich einmal mit Schwarz, was hinsichtlich des ungünstig trainierten Value Network ein Vorteil sein müsste. Und so kam es dann auch: Nach sechs Stunden Spielzeit und einem für Weiß missglückten Ko-Gefecht sahen die Kommentatoren das Programm klar im Vorteil, den mit Weiß spielenden Yuta Iyama chancenlos. Eine Viertelstunde später gab der Japaner auf. Auch diese Begegnung wurde live auf YouTube übertragen und kann auch nachträglich noch angeschaut werden.

Die stärksten Programme

Wie eingangs erwähnt, dürfte Zen nicht das stärkste Go-Programm auf diesem Planeten sein, sonden eher das drittstärkste.

Im Januar hat DeepMind eine neue Version von AlphaGo auf koreanischen und chinesischen Servern getestet und reihenweise Spitzenspieler besiegt, darunter den Weltranglisten-Ersten, den Chinesen Ke Jie. Abgesehen von diesen inoffiziellen Tests hat sich AlphaGo jedoch nicht blicken lassen; weder sind im Moment Spiele gegen menschliche Spieler angesetzt, noch hat AlphaGo am UEC Cup teilgenommen.

Bei diesem jährlich an der University of Electro-Communications (UEC) in Tokio ausgetragenen Wettbewerb traten am vergangenen Wochenende 30 Go-Programme gegeneinander an. Überraschender Sieger war diesmal das Program JueYi (FineArt) der chinesischen Internet-Firma Tencent – vor DeepZenGo auf Platz 2. Auch JueYi hatte von sich reden gemacht, indem es auf Go-Servern reihenweise Profis besiegte. Gegen Ke Jie, die Nummer eins der Weltrangliste, hat es laut chinesischen Medienberichten seit Februar zehnmal in Folge gewonnen. Es scheint also ebenfalls in der AlphaGo-Liga zu spielen.

Schaukampf

Beim UEC Cup dürfen der Sieger und der Zweitplatzierte anschließend traditionell gegen einen Profi spielen. In den vergangenen Jahren waren diese Schaukämpfe Handicap-Partien, bei denen der Profi dem Computer einen Vorsprung gab. In diesem Jahr wird erstmals gleichauf gespielt.

Bereits am 26. März wird der japanische Profi Ichiriki Ryo (7p) gegen die beiden Programme antreten: Zunächst um 10.30 Uhr japanischer Zeit gegen den Zweitplatzierten DeepZenGo mit 30 Minuten Kernbedenkzeit und 30 Sekunden Byoyomi. Anschließend dann um 14.30 Uhr gegen JueYi (FineArt) mit einer Stunde und 60 Sekunden Byoyomi. Für Computer-Go-Enthusiasten bleibt es also eine spannende Woche. (bo)