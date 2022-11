"Diplomacy" ist ein komplexes Brettspiel aus den Fünfzigerjahren. Es ahmt die Geschehnisse vor dem 1. Weltkrieg in Europa nach, die Spieler können smarte Bündnisse schließen und versuchen, bestehende Koalitionen zu brechen. Das Spielprinzip beruht aus mehreren Spieljahren mit jeweils eigenen Spielphasen. Das Regelwerk ist nicht einfach. Schon in den Achtzigerjahren gab es Computervarianten von Diplomacy, das auch in Form von Fernpartien gespielt wird – per Web-Oberfläche oder gar per E-Mail. Es gibt sogar Europa- und Weltmeisterschaften in "Diplomacy" und aktive Verbände in vielen Ländern.

Diplomacy: Mischung aus Wettbewerb und Zusammenarbeit

Die feine Kunst der Diplomatie auf dem Spielbrett hat nun auch die Abteilung für Künstliche Intelligenz der Facebook-Mutter Meta Platforms angelockt. Dort entstanden in mehreren Jahren gleich zwei KI-Systeme, die mittlerweile auch menschliche Expertenspieler schlagen. Das ist auch deshalb erstaunlich, weil Diplomacy eine Mischung aus Wettbewerb und Zusammenarbeit voraussetzt. Und genau hier gelten Algorithmen, die auf maschinellem Lernen basieren, eigentlich noch als minderbemittelt. Doch genau das können die beiden Meta-KIs: Sie arbeiten sogar mit menschlichen Spielern zusammen.

"Frühere Durchbrüche in der KI bei komplexen Spielen konzentrierten sich entweder auf rein gegnerische oder rein kooperative Situationen. Im Gegensatz dazu ist Diplomacy ein Spiel mit wechselnden Allianzen, das sowohl Kooperation als auch Wettbewerb beinhaltet", schreiben die Forscher um Jonathan Gray, Adam Lerer, Anton Bakhtin und Noam Brown. "Aus diesem Grund hat sich [das Spiel] als eine gewaltige Herausforderung für die Forschung erwiesen."

Gemeinsam stärker

Schon 2021 konnten Gray & Co. erste Ergebnisse präsentieren. Damals gelang es ihnen, bestehende Diplomacy-"Bots" zu schlagen und auf einer populären Diplomacy-Website in der sogenannten No-Press-Variante Rang 17 von 1128 menschlichen Spielern zu erreichen. "Wir beschreiben einen Agenten, der überwachtes Lernen auf Basis menschlicher Daten mit einer Ein-Schritt-Vorausschau mittels externer Regret-Minimierung kombiniert." Externe Regret-Minimierungstechniken waren die Grundlage für frühere KI-Erfolge in Spielen, vor allem beim Poker. "Aber es wurde bisher nicht gezeigt, dass sie in groß angelegten Spielen mit Kooperation erfolgreich sind."

Spannenderweise können auch die zwei neuen Meta-KIs kooperieren und anschließend menschliche Spieler für sich einnehmen und sie dann aus dem Spiel kegeln. Dass KIs künftig verstärkt mit Menschen kooperieren müssen, ist seit langem klar. Das gilt für Software ebenso wie für Roboter, die im Arbeitsleben eingesetzt werden. Damit das funktioniert, muss auch das Training der KI leichter und vor allem billiger werden. Der Meta-Algorithmus könnte hier ein erster Schritt sein.

Lesen Sie auch Gran Turismo: Wie eine Software die besten Gamer beim Autorennen schlägt MIT Technology Review

(bsc)