Mensch gegen Maschine: AlphaGo verliert eine Partie

Die Go-Welt atmet auf: In dem auf fünf Partien angesetzten Turnier von Googles künstlicher Intelligenz AlphaGo gegen den Spitzenspieler Lee Sedol hat Lee Sedol heute gewonnen. Damit steht es 3:1 für den Computer.

In Pocket speichern vorlesen Druckansicht 342 Kommentare lesen
Mensch gegen Maschine: AlphaGo spielt die vierte Partie
Lesezeit: 8 Min.
Von
  • Dr. Harald Bögeholz

Nachdem es nach dem gestrigen Match 3:0 für den Computer stand und dieser damit als Gesamtsieger des auf fünf Partien angesetzten Turniers klar war, ging es für den koreanischen Spitzenspieler Lee Sedol (9p) heute eher darum, die Ehre des Menschen in diesem Kampf Mensch gegen Maschine zu verteidigen.

Lee Sedol (Weiß) beginnt die Partie wie die zweite und weicht erst in Zug 12 von dieser ab. Zug 12 und 13 waren in der zweiten Partie auf A und B.

In Interviews hatte er gesagt, dass er mit dem Fluss der Steine in seiner zweiten Partie zufrieden war, jedoch einige gute Gelegenheiten verpasst habe. Vielleicht deshalb eröffnete er seine heutige vierte Partie wie die zweite und wich erst in Zug 12 davon ab. Auch im weiteren Verlauf blieb er der Grundidee der zweiten Partie treu: Als Weiß sicherte er sich zunächst einiges Gebiet mit der Absicht, die schwarzen Einflusssphären (Moyos) später zu invadieren.

Der kommentierende Profispieler Michael Redmond (9p) zählte nach dem 40. Zug knapp 40 Punkte Gebiet für Weiß, aber nur etwa 15 für Schwarz.

Nach Zug 71 des Computers dachte Lee Sedol über zehn Minuten nach; Zug 78 könnte der entscheidende Trick für den Sieg gewesen sein.

Bereits Zug 71 kommentierte Redmond aber: "Wenn AlphaGo so etwas spielt, denkt es womöglich schon, dass es gewinnt. Es gibt an dieser Stelle viel aggressivere Züge." Für Zug 72 ließ sich Lee Sedol denn auch über zehn Minuten Zeit. Allgemein spielte er in dieser Partie wesentlich langsamer als AlphaGo und hatte zu diesem Zeitpunkt nur noch 25 Minuten seiner zwei Stunden Kernbedenkzeit übrig, während die Uhr von AlphaGo noch 1:18 Stunden zeigte. Doch die investierte Bedenkzeit in dieser Phase sollte sich lohnen. Zug 78 wird von Redmond im weiteren Verlauf mehrfach gelobt, es könnte ein entscheidender Zug für den Gewinn der Partie werden.

Nach dem 89. Zug hatte Lee Sedol seine Kernbedenkzeit verbraucht. Ab jetzt durfte er nur noch eine Minute pro Zug nachdenken und maximal drei Extraminuten verbrauchen.

Redmond kommentierte, dass es allmählich gut für Weiß aussehe. Die schwarze Gruppe rechts war verstorben, das schwarze Gebiet in der Mitte beschädigt. Die nächsten Züge von AlphaGo beschrieb er als fragwürdig – könnte es sein, dass AlphaGo sich jetzt verlieren sieht und einfach keine guten Ideen mehr hat? Ein Mensch mit einer Stunde Bedenkzeit auf der Uhr würde in so einer Situation vielleicht einfach eine Weile länger nachdenken.

Eine Minute pro Zug – und Lee Sedol nutzt sie oft bis zur letzten Sekunde aus.

Zug 110: Weiß hat nach Redmonds Zählung schon etwa 70 Punkte Gebiet und es beginnt allmählich danach auszusehen, dass Schwarz nicht genug Gebiet bekommt. Im Kommentar kommt die Frage auf, ob AlphaGo eigentlich aufgeben kann – rein hypothetisch, natürlich. Es kann: Wenn es seine Gewinnwahrscheinlichkeit unter einer gewissen Schwelle sieht (irgendwo war die Rede von 10 Prozent), gibt es auf. Aber noch ist viel zu spielen. Es ist kurz vor 9 Uhr, vier Stunden sind gespielt. Schwer vorstellbar für Amateure, wie der Profi Lee Sedol nach so langer Konzentration, einer Stunde davon bereits im Byoyomi, den Stress aushält, in jeder Minute einen fehlerfreien Zug machen zu müssen; zwei seiner drei Überziehungen hat er bereits verbraucht. Redmond sieht darin aber kein Problem und gibt zum ersten Mal offen die Prognose ab, dass Lee Sedol gewinnen wird – mindestens wird es ein knappes Spiel.

Als das Endspiel voranschreitet, gibt es hier und da einen Zug von AlphaGo (z.B. 163), den Redmond als sinnlos kommentiert – eine Antwort erzwingend zwar, aber nicht nützlich. Von wesentlich schwächeren Go-Programmen kennt man diesen Spielstil: Wenn sie verlieren, fangen sie an, Quatsch zu machen. Statt die offensichtliche Antwort sofort zu spielen, nutzt Lee Sedol seine ganze Minute, offensichtlich um über andere Teile des Brettes nachzudenken.

Endstand nach 184 Zügen: AlphaGo (Schwarz) gibt auf.

Nach 184 Zügen gibt AlphaGo auf. Die Go-Welt kann aufatmen – und vor allem Lee Sedol. Wie beschämend wäre es gewesen, hätte der Mensch der künstlichen Intelligenz so gar nichts mehr entgegenzusetzen gehabt. Das macht die letzte Partie wieder ein bisschen spannender. Sie findet am Dienstag, den 15. März statt, wieder ab 5 Uhr MEZ (13 Uhr koreanischer Ortszeit).

Übersicht der Partien:

Update: Auf der Pressekonferenz im Anschluss an die heutige Partie ist der Applaus groß, Lee Sedol sichtlich erleichtert und froh. "Es ist nur ein Sieg, und man hat mir noch nie so begeistert gratuliert, nur weil ich eine einzelne Partie gewonnen habe. Bevor ich heute angefangen habe, dachte ich darüber nach, dass ich vor Beginn des Turniers gesagt hatte, ich würde 5:0 oder vielleicht 4:1 gewinnen. Hätte ich heute schon mit drei Punkten geführt, wäre heute nicht so ein besonderer Tag. Aber so ist dieser eine Sieg so viel wertvoller, all die Anfeuerungen, die Begeisterung der Anwesenden … ich würde ihn für nichts in der Welt hergeben."

DeepMind-Geschäftsführer Demis Hassabis gratulierte Lee Sedol zu seinem Kampfgeist, der es ihm ermöglichte, nach drei verlorenen Partien so gut zu spielen. "Wir wissen noch nicht genau, was passiert ist, werden aber zurück in London sehr genau die Partie analysieren und versuchen, AlphaGo zu verbessern."

Ein Mitglied des AlphaGo-Teams erklärt: "AlphaGo verdankt seine Spielstärke in hohem Maße dem Selbstlernen in Spielen gegen sich selbst. Es braucht aber einen genialen Spieler wie Lee Sedol, um Lücken in diesem selbstgelernten Wissen aufzudecken und auszunutzen – wie die, die wir heute im Mittelspiel gesehen haben."

Michael Redmond (9p) sagt: "Zug 78 war ein brillanter Zug von Lee Sedol, der mich überrascht hat – und vermutlich auch AlphaGo. Er und die ganze folgende Sequenz haben Lee Sedols Spielstärke eindrucksvoll gezeigt."

Frage an Demis Hassabis: Es gibt verschiedene Versionen von AlphaGo, haben Sie in allen Spielen dieselbe benutzt? Und: Es gibt einige Züge, die menschliche Experten als krasse Fehler beurteilen. Was sagen Sie dazu?

Hassabis: Wir benutzen ein verteiltes AlphaGo (Version 18), und es ist dieselbe Version über das ganze Turnier. Was die Fehler betrifft: AlphaGo macht Züge, die einem menschlichen Experten nicht unmittelbar einleuchten. Das können Fehler sein oder auch nicht, schwer zu sagen. Ich denke, was zählt, ist das Endergebnis.

Endlich hat er wieder was zu lachen: Lee Sedol auf der Pressekonferenz im Anschluss an Partie 4.

Frage an Lee Sedol: Sie müssen heute Ihre Strategie vorgeplant haben. Ist die Partie heute so gelaufen, wie Sie sich das vorgestellt haben? Außerdem: Sie sind ja mit einem unfairen Vorteil in dieses Turnier gestartet: AlphaGo hatte Informationen über Ihr Spiel, aber Sie hatten noch nie gegen es gespielt. Haben Sie jetzt aus diesen vier Spielen schon etwas über AlphaGo gelernt?

Lee Sedol: Ich denke AlphaGo spielt schlechter als Schwarz. Es gab einige Züge, die wie Fehler aussahen, jedenfalls sah es ein bisschen schwächer aus, wenn es Schwarz spielte. Was meine Informationen über AlphaGo angeht, möchte ich sagen, dass es daran nicht lag. Dass ich verloren habe, lag allein an meinen Fähigkeiten; mehr Wissen über AlphaGo hätte nichts genützt.

Demis Hassabis kommentiert: Wir haben AlphaGo anhand einer großen Menge Partien aus dem Internet trainiert, überhaupt nicht speziell auf Lee Sedol. Insofern gab es auch auf der Seite von AlphaGo keinen Vorteil.

Als Letztes hatte Lee Sedol noch eine Bitte an Hassabis: "Ich habe jetzt mit Weiß gewonnen – dürfte ich in der nächsten Partie Schwarz spielen?" Er darf.

Lesen Sie dazu auch: