Aufregung in der Szene der Künstlichen Intelligenz (KI): Seitdem sich Google mit einem Ingenieur zerstritten hat, der dem Chatbot-System LaMDA ein Bewusstsein attestierte, scheint einiges aus den Fugen geraten zu sein. Die Software, deren vollständiger Name "Language Model for Dialogue Applications" lautet, kann sehr realistisch wirkende Texte erzeugen, verschiedene Persönlichkeiten (Personas) annehmen und über weite Strecken echt klingende Unterhaltungen erzeugen.

Streit um das Bewusstsein

Während Google-Forscher Blake Lemoine behauptet, man habe es hier mit einem echten Wesen mit Persönlichkeit zu tun, lehnen Google und zahlreiche kritische Denker aus der KI-Szene und dem maschinellen Lernen (ML) diese – von Lemoine gar unter anderem auch aus religiösen Motiven begründete – Idee rundweg ab.

Doch was immer man zu der hitzig geführten Debatte meint: Sie zeigt, dass aktuelle Methoden, KI-Systeme zu bewerten, nicht mehr ausreichen – insbesondere der sogenannte Turing-Test nicht. Dieser wurde von Informatiklegende Alan Turing entworfen und soll feststellen, ob ein Rechner ein dem Menschen ebenbürtiges Denkvermögen hat. Das Problem: Texterstellungssysteme wie LaMDA könnten die Hürde bald überwinden, weil sie einfach über enorme Datenmengen verfügen, die ihre Texte mittlerweile äußerst realistisch machen – womit wir wieder bei Lemoine wären.

400 Forscher für 204 KI-Aufgaben

Bei Google wurde die Thematik längst erkannt. Dort soll der Turing-Test aus dem Jahr 1950 nun durch eine ganze Batterie von Tests ersetzt werden, die aus zahlreichen Wissensgebieten stammen. Insgesamt 204 Aufgaben müssen bewältigt werden, so der Konzern, dessen KI-Forscher sich für das Projekt mit über 400 Kollegen aus 132 Institutionen weltweit zusammengetan haben. Bearbeitet wird die Fragestellung bereits seit gut zwei Jahren – und sie könnte nicht zu einem besseren Zeitpunkt kommen.

Statt dem Turing-Test in mehreren Abwandlungen soll künftig der "Beyond the Imitation Game"-Benchmark, kurz BIG-bench, zum Einsatz kommen. ("Imitationsspiel" nannte Turing ursprünglich seinen Test.) Mit dem neuen Verfahren könnte auch eine allgemeine künstliche Intelligenz (Artificial general intelligence, AGI) festgestellt werden – zumindest theoretisch.

Turing bleibt – angepasst

Zwar sei der Turing-Test nicht einzumotten, so Adrian Hilton von der University of Surrey in Großbritannien gegenüber dem "New Scientist". Doch sei dieser nicht breit genug und passend für moderne KI-Systeme. Ob BIG-bench jedoch wirklich AGIs feststellen kann, wird von ihm skeptisch aufgenommen. Immerhin biete der Ansatz nun eine Möglichkeit, Systeme besser zu vergleichen.

BIG-bench tut dies, indem alle möglichen Fachgebiete abgefragt werden. Darunter ist Klassisches wie Schach ebenso wie Sprachverständnis, Mathematik und Logik. Erste Untersuchungen mit dem Test zeigten, dass die 204 Aufgaben in ihrer Gesamtheit noch immer zu schwer sind für aktuelle KI-Systeme, die zumeist spezialisiert sind. Der Mensch sei hier noch nicht eingeholt.

Lesen Sie auch Kommentar: Google unterdrückt beim Chatbot LaMDA eine wichtige Debatte

(bsc)