Drei Nationen und ein Computer spielen um die Weltmeisterschaft im Strategiespiel Go. Am heutigen zweiten Spieltag verlor das Go-Programm DeepZenGo ein weiteres Mal – den Sieg werden also die Menschen unter sich ausmachen.

Die Go-Welt schaut gespannt nach Osaka, wo zurzeit eine vom japanischen Go-Institut Nihon Kiin veranstaltete Weltmeisterschaft der drei großen Go-Nationen ausgetragen wird – und die IT-Welt schaut natürlich auf die daran teilnehmende künstliche Intelligenz, das japanische Go-Programm DeepZenGo.

In der Runde 2 vom Mittwoch spielt Zen mit Weiß gegen den Koreaner Park Jeong Hwan (wir übernehmen hier die japanische Schreibweise der Namen) und der Chinese Mi Yu Ting (Weiß) gegen den Japaner Yuta Iyama (Schwarz). Die Partien haben um 2:30 Uhr deutscher Zeit begonnen.

Am gestrigen ersten Spieltag hatte Zen gegen den Chinesen Mi Yu Ting verloren. Über weite Teile der Partie hinweg hatten die Profi-Kommentatoren einen Sieg des Computers nicht ausgeschlossen, waren sich dann gegen Ende aber einig, dass Zen wohl knapp hinten lag – vielleicht um 1,5 Punkte. Dann fing Zen an, "komische Züge" zu machen, verlor noch ein paar weitere Punkte und gab dann auf.

Verzweiflung in Software

"Komische Züge", also solche, die gegnerische Züge erzwingen, ohne einen Vorteil zu bringen oder die sogar von Nachteil sind, sind durchaus typisch für heutige Go-Programme, die auf der MCTS-Suchtechnik basieren. Denn die Programme versuchen, die Wahrscheinlichkeit des Gewinns zu optimieren und nicht die Höhe der Punktzahl. Was von menschlichen Beobachtern als Unsinn oder auch Verzweiflung ausgelegt wird, rührt wohl von solcher Wahrscheinlichkeitsrechnung: Eine verlorene Partie kann man allenfalls dann noch gewinnen, wenn man dem Gegner die Möglichkeit gibt, Fehler zu machen.

Vielleicht hat man in dieser ersten Partie aber eine Schwäche von Zen gesehen, die größer ist, als von den Entwicklern angenommen. Das neuronale Netz für die Stellungsbewertung, das "Value Network" von Zen, war nämlich nach einem anderen Regelwerk und vor allem mit einem anderen Komi-Wert trainiert worden. In der Computer-Go-Szene wird üblicherweise nach chinesischen Regeln gespielt, in diesem Turnier in Japan aber nach japanischen. Die Unterschiede sind sehr subtil und in der Praxis meist unbedeutend, aber das Komi könnte einen riesigen Unterschied machen. Hierbei handelt es sich um eine Gutschrift an Punkten, die Weiß dafür erhält, dass Schwarz anfangen darf.

Programmierte Schwäche

Hideki Kato, einer der Autoren von Zen, erklärte nach dem Verlust der Partie auf der Computer-Go-Mailingliste, dass das Netz tatsächlich mit chinesischen Regeln trainiert wurde. Kleine Fehler in engen Partien habe man erwartet. Die habe man aber für so unwahrscheinlich gehalten, das Korrekturen aufgeschoben wurden ("The value network has been trained with Chinese rules and 7.5 pts komi. Using this for Japanese and 6.5, there will be some error in close games. We knew this issue and thought such chances would be so small that postponed correcting (not so easy)."). Das rächt sich jetzt vielleicht, denn wenn Top-Profis Go spielen, ist ein sehr knapper Ausgang der Partien durchaus nicht selten.

Das klingt nun so, als wäre Zen darauf optimiert, mit 0,5 Punkten Rückstand zu verlieren, aber so einfach ist es nicht: Das Value Network hat nur eine unterstützende Funktion bei der Monte-Carlo-Baumsuche MCTS, und diese wird natürlich mit korrektem Komi durchgeführt.

Spieltag 2

In der Mittwochs-Partie von Zen gegen Park Jeong Hwan waren die Kommentatoren nach viereinhalb Stunden Spielzeit der Meinung, dass der Koreaner knapp führt und dass im folgenden Endspiel mit wenig Überraschungen zu rechnen sei. Erneut spielte Zen relativ zügig und hatte bis dahin erst die Hälfte seiner Bedenkzeit investiert. Nach sechs Stunden – der Koreaner hatte mittlerweile seine Kernbedenkzeit verbraucht und musste jeden Zug innerhalb einer Minute machen – sah es wieder so aus wie am Dienstag: Die Kommentatoren erwarteten den Sieg des Koreaners mit 0,5 Punkten.

Es folgten wie tags zuvor "Verzweiflungszüge" von Zen, dann unter Kopfschütteln der Kommentatoren Züge, die es einfach nur unsinnigerweise Punkte kosteten. Anscheinend hatte Zen den Status einer Gruppe in der oberen linken Ecke des Bretts falsch eingeschätzt und dachte noch, es würde gewinnen – doch dann gab es auf. Mit der Weltmeisterschaft für den Computer wird es also nichts – jedenfalls nicht auf dieser Veranstaltung.



Der Stand nach der zweiten Runde: China und Korea machen den Sieg unter sich aus.

Update: Mittlerweile ist auch die zweite Partie beendet: Der Chinese Mi Yu Ting (Weiß) hat gegen den Japaner Yuta Iyama (Schwarz) mit 2,5 Punkten gewonnen.

Die Begegnungen wurden live auf YouTube übertragen. Weiter geht es morgen um 2:30 deutscher Zeit. Dann werden China und Korea den Sieg unter sich ausmachen und unter den "beiden Japanern" Zen und Yuta Iyama gibt es noch einmal ein Mensch-Maschine-Duell um den dritten Platz.

