Interview: „Wir hacken nicht mehr so viel wie früher“

Wissen | Hintergrund

Ein Gespräch mit Oliver Obst über den Wettbewerb in der 2-D Simulation League beim RoboCup in Eindhoven. Er nahm 1999 zum ersten Mal teil, setzte mehrere Jahre aus und ist nun wieder erfolgreich dabei.

Oliver Obst nahm 1999 zum ersten Mal am RoboCup teil, damals noch als Student an der Universität Koblenz. Die Simulationsliga war zu dieser Zeit noch ausschließlich zweidimensional. Erst seit 2004 werden auch virtuelle Fußballspiele in drei Dimensionen ausgetragen -- dank eines von Obst maßgeblich mit entwickelten 3-D-Simulators. Nach einem Wechsel zur australischen CSIRO (Commonwealth Scientific and Industrial Research Organization), einer der deutschen Fraunhofergesellschaft vergleichbaren Forschungseinrichtung, war mit der Teilnahme am RoboCup erst einmal Schluss. Doch jetzt ist er mit dem Team Gliders wieder dabei.

Oliver Obst

c't: Oliver, was hat dich bewogen, nach mehrjähriger RoboCup-Pause und nachdem du den 3-D-Simulator mit entwickelt hast, nun ausgerechnet in der 2-D-Simulation wieder teilzunehmen?

Oliver Obst: Da es bei der CSIRO vorrangig um angewandte Forschung geht, war für meinen jetzigen Chef Mikhail Prokopenko, den ich 1999 beim RoboCup kennengelernt hatte, und mich erst mal eine Pause angesagt. Aber wenn wir die Wettbewerbe aus der Ferne verfolgten, dachten wir immer ein bisschen wehmütig an die schöne Zeit zurück. Die 2-D-Simulation schien uns die einzige Liga zu sein, an der wir uns beteiligen konnten, ohne unsere eigentliche Arbeit zu vernachlässigen. Viele Teams haben ja ihren Basiscode veröffentlicht, es geht vorrangig um Fragen der Taktik und Strategie, sodass wir auf einem hohen Niveau wieder neu einsteigen konnten. Wir haben uns mit unseren beschränkten Ressourcen auf minimale Veränderungen konzentriert, die wir aber sehr genau und pedantisch untersucht haben. Wir haben auch versucht, nicht so viel zu hacken wie früher. Das hat sich ausgezahlt: Bei der letzten WM kamen wir unter ungefähr 20 Teams auf Anhieb auf Platz 4.

c't: Was darf ich mir unter „nicht so viel hacken“ vorstellen?

Oliver Obst: Wenn irgend etwas nicht so klappt wie gewünscht, ist man immer in der Versuchung, sich mal eben hinzusetzen und genau an dieser Sache schnell etwas zu ändern. Das hilft dann vielleicht auch in dieser einen, konkreten Situation, zieht aber ein ganzes Bündel an Konsequenzen für das übrige Verhalten nach sich. Man muss immer das gesamte System im Auge behalten.

c't: Ich staune, dass ihr und auch andere Teams offenbar immer noch Raum für weitere Optimierungen findet. Mir schienen die Probleme des zweidimensionalen Fußballs eigentlich im Wesentlichen gelöst.

Oliver Obst: Ja und nein. Einige Jahre wurde viel mit maschinellem Lernen gearbeitet, jetzt ist es etwas stiller darum geworden. Man hat es ja gemacht, es hat auch funktioniert und damit scheint die Sache erledigt. Aber die Lernverfahren wurden immer nur isoliert eingesetzt für einzelne Verhalten wie etwa Dribbling oder Torschüsse. Da steckt immer noch viel menschliches Wissen drin, der Programmierer entscheidet, dass Dribbling wichtig ist und gelernt werden muss. Ich möchte, dass das System von selbst darauf kommt.

c't: Beim menschlichen Fußball besteht das Training aber auch aus einer Mischung von Trainerwissen, das weitergegeben wird, und eigenem Üben.

Oliver Obst: Ja, aber irgendwann ist dieses Wissen aus der Praxis heraus entstanden. Bei einem einfacheren Spiel wie Backgammon ist es schon gelungen. Da haben sich die Computerprogramme ohne explizites Vorwissen immer weiter verbessert, indem sie einfach immer wieder gegen einander gespielt haben. Beim Fußball ist das natürlich ungleich komplexer, müsste aber ebenso möglich sein.

c't: Du hast beim chinesischen Team Wright Eagle, das zusammen mit dem Team Helios aus Japan seit einigen Jahren auf die Finalteilnahme abonniert zu sein scheint, mal das Dribbling bewundert. Was bedeutet Dribbling für einen zweidimensionalen Spieler, der keine Füße hat?

Ein Spiel der Gliders (Bild: Hans-Arthur Marsiske)

Oliver Obst: Auch wenn die dritte Dimension wegfällt, kommt der Ball immer noch mit einer gewissen Geschwindigkeit an und muss vom Spieler, der durch einen Kreis dargestellt ist, erst einmal gestoppt werden. Dann kann der Spieler den Ball um sich herum bewegen, wird also versuchen, ihn auf einer vom Gegner abgewandten Seite zu halten. Es geht also zunächst einmal darum, die Geschwindigkeiten des Balls und des eigenen Körpers aufeinander abzustimmen. Hinzu kommt, dass die Informationen unvollständig sind. Die Geschwindigkeit des Balls ist nicht immer genau bekannt, das Sichtfeld des Spielers eingeschränkt. Da gilt es, Risiken zu beachten und zu minimieren. In einer bestimmten Situation mag etwa ein Schuss in eine Richtung als optimale Aktion erscheinen, könnte aber, wenn die Informationen falsch sind, auch zu eine Eigentor führen. Da wäre dann eine suboptimale Aktion, die aber das Eigentor-Risiko mindert, die bessere Aktion. So etwas müssen die Spielerprogramme abwägen können.

c't: Hat der Ball in der 2-D-Simulation eine Masse?

Oliver Obst: Die Physik ist sehr viel einfacher als in der 3-D-Simulation, aber der Ball bewegt sich nicht linear. Es gibt so etwas wie Beschleunigung, dennoch lassen sich seine Bewegungen relativ leicht vorhersagen.

c't: In erster Linie geht es beim 2-D-Dribbling demnach darum, die Körperbewegungen und die Bewegungen des Balls aufeinander abzustimmen?

Oliver Obst: Der Spieler muss sich entscheiden, ob er den Ball kickt oder sich selbst bewegt. Wenn er etwa einmal kickt und zwei Schritte läuft, kommt er schneller voran, kann den Ball aber nicht so sicher kontrollieren, als wenn er abwechselnd kickt und einen Schritt läuft. Zwischendurch muss er sich vielleicht auch mal drehen. All diese Aktionen schließen sich gegenseitig aus.

c't: Der Spieler muss selbst erkennen, welche Variante in welcher Situation am besten passt?

Oliver Obst: Am allerbesten wäre es, wenn ein Team während des Spiels erkennen könnte, wie zweikampfstark der Gegner ist, um das eigene Dribbling entsprechend anzupassen. Ich weiß nicht, ob beim RoboCup jemand mit so einer adaptiven Strategie arbeitet, aber da gibt es auf jeden Fall noch Spielraum. Im Moment spielen wir jetzt noch die erste Turnierrunde, während der nichts verändert werden darf. Danach wäre es aber schön, wenn ein automatischer Trainer die Spiele analysieren und Empfehlungen für die nächste Runde geben würde, etwa bei welchem Gegner mehr Risiken eingegangen werden können oder wo der Ball enger am Körper gehalten werden muss. Am liebsten würde ich nach diesem Turnier mit all den aufgezeichneten Spielen nach Hause fahren, meinen Rechner ein Jahr laufen lassen und beim nächsten RoboCup mit einer besseren Strategie wieder antreten. Das wäre toll, selbst wenn es nicht zum Titelgewinn reichen würde. Entscheidend wäre, dass ich als Mensch kein Wissen eingespeist habe, sondern das System sich allein verbessert hat.

c't: Erforscht die 2-D-Simulation die Geometrie des Fußballs?

Oliver Obst: Viele Zuschauer sagen, dass die 2-D-Spiele dem menschlichen Fußball schon sehr ähnlich seien. Das hat aber wohl weniger mit Geometrie zu tun als mit Strategien, die hier gut erkennbar sind und intensiver erforscht werden als in anderen Ligen. Vielleicht kann sogar der menschliche Fußball hieraus neue Ideen beziehen. Immerhin können wir in der 2-D-Simulation den Informationsfluss auf dem Spielfeld und die Auswirkungen auf das Spiel nachvollziehen. Beim Profifußball werden die Bewegungen von Spielern und Ball ja auch mithilfe von Sensoren immer genauer aufgezeichnet. Da bewegen sich realer Fußball und Simulation deutlich aufeinander zu.

Anzeige
Anzeige