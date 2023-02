Microsoft-Chef Satya Nadella verkündete Anfang Februar nicht weniger als ein "neues Paradigma für die Suche". In seiner Präsentation zeigte er die ersten Ergebnisse der Zusammenarbeit mit OpenAI, dem Entwickler von ChatGPT. Microsoft hatte sich nach dem rasanten Erfolg von ChatGPT mit einer Summe von zehn Milliarden US-Dollar an dem Unternehmen beteiligt. Der Softwarekonzern will die ChatGPT zugrunde liegende KI in eigene Software integrieren.

Als erste bekommen der Edge-Browser und die Suchmaschine Bing ihr KI-Update, eine Beta-Version kann man bereits online testen. Statt einzelne Begriffe in den Suchschlitz zu tippen, stellt man dem frisch eingebauten Chatbot natürlich formulierte Fragen auf Deutsch: "Was ist am 11. Februar in der Oper in Hannover passiert?" oder "Wie stirbt Vincent Vega im Film Pulp Fiction?".

Das Sprachmodell filtert aus solchen maximal 2000 Zeichen langen Fragen die relevanten Begriffe heraus, füttert damit die klassische Bing-Suchmaschine und fasst die aktuellen Ergebnisse aus dem Netz in einer flüssig formulierten Antwort zusammen. Zu den wichtigsten Aussagen verlinkt der integrierte Chatbot Links die Quellen.

Um die Suche mit natürlich formulierten Fragen und Antworten zu erweitern, hat Microsoft die Bing-Suche über eine proprietäre Technik namens Prometheus mit einer Weiterentwicklung von ChatGPT verknüpft. Die KI soll das Ranking der Suchergebnisse verbessern und wie bereits ChatGPT "schädliche Inhalte" ausfiltern.

Spaß statt Faktentreue

Microsoft verspricht mehr Spaß und einen einfacheren Zugang zu den Treffern der Suchmaschine. In den ersten Tagen der geschlossenen Testphase antwortete Bing auf Fragen ähnlich flüssig wie ChatGPT und versuchte, mit zusätzlichen Smileys am Ende jeder zweiten Antwort gute Stimmung zu verbreiten. Die Antworten und Zusammenfassungen offenbarten jedoch ein großes Problem: Sie waren oft falsch und sinnentstellend.

Bing-Vizechef Yusuf Mehdi will Microsofts Internetsuche durch einen Nachfolger des KI-Sprachmodells ChatGPT auf ein neues Level heben. (Bild: Stephen Brashear/AP/dpa)

Relativ gut funktionierte Bing, wenn wir nach weit verbreiteten Nachrichten fragten, die in ähnlicher Form auf Hunderten von Webseiten auftauchen. Diese fasste das Sprachmodell durchaus treffend zusammen. Völlig überfordert war Bing jedoch, wenn es darum ging, einen bestimmten Artikel zu erklären – vor allem dann, wenn dieser Artikel im Widerspruch zu weit verbreiteten Aussagen im Internet stand. Dann verdrehte Bing manchmal die Worte und legte Autoren Aussagen anderer Websites zum gleichen Thema in den Mund.

So kannte Bing zwar einen Testartikel der c’t, war aber weder in der Lage, die Testkandidaten korrekt aufzulisten noch die Ergebnisse sowie die Vor- und Nachteile wiederzugeben. Ohne weitere Quellenangaben dichtete Bing den Produkten Eigenschaften an, die es anderswo aufgeschnappt hatte und die völliger Humbug waren.

Solche sinnentstellenden Zusammenfassungen sind vor allem dann ein Problem, wenn die Originalartikel hinter Bezahlschranken stehen. Bing fasste sie bei heise+ wie auch bei Spiegel+ zusammen – nur eben teilweise falsch. Das merkt aber nur, wer Zugang zur Quelle hinter der Bezahlschranke hat.

Andere, kleinere Seiten wie die der Tageszeitung Junge Welt tauchten in den Ergebnissen gar nicht auf. Bing war auch auf konkrete Nachfrage nicht in der Lage, dort veröffentlichte Artikel zu finden oder zusammenzufassen – egal, ob sie sich vor oder hinter der Paywall befanden.

Kein Minority Report

Diese Probleme hängen eng mit der Verknüpfung eines Faktensammlers mit einem Sprachmodell zusammen. Letzteres wählt seine Formulierungen nach statistischen Wahrscheinlichkeiten aus, kann aber mangels Weltverständnis nicht zwischen richtig und falsch unterscheiden. Es scheint mit dem Input aus den Suchergebnissen überfordert zu sein, sodass am Ende oft Unsinn herauskommt.

Insbesondere scheint es vereinzelte Minderheitsberichte mit abweichenden Aussagen zu unterdrücken oder sogar ins Gegenteil zu verkehren. Es besteht die Gefahr, dass Bing Lügen übernimmt und automatisiert weiterverbreitet, wenn sie nur oft genug im Netz wiederholt werden. Dazu müssten SEO-Spezialisten ihre Webseiten unter die ersten Treffer der Suchmaschine schmuggeln, damit diese sie in ihre Zusammenfassung einwebt.

Microsoft scheint sich dessen bewusst zu sein. Es filtert sensible Themen aus, auf die der Chatbot von Bing grundsätzlich nicht antwortet. Während ChatGPT noch eine Laudatio auf Joe Biden verfasste, sich aber bei Donald Trump weigerte, äußert sich Bing überhaupt nicht zu Personen aus der Politik.

In seinen Zusammenfassungen dichtete Bing falsche Aussagen, die dem Originalartikel diametral widersprachen.

Auch bei "anstößigen Inhalten" sind die Filter streng: Bing gab zwar im Wikipedia-Stil eine oberflächliche Beschreibung des Romans "Die 120 Tage von Sodom" des Marquis de Sade, weigerte sich aber, die Handlung nachzuerzählen. So wie OpenAI bestimmte Themen und Begriffe in ChatGPT mit einer Blacklist ausblendet, filtert Microsoft die Ergebnisse von Bing. Was und wie genau die Unternehmen filtern, verraten sie nicht.

Angriff auf Google

Mit der Kopplung von ChatGPT und Bing bläst Microsoft zum Angriff auf Google. Auch der chinesische Anbieter Baidu erklärte, seine Suchmaschine mit einem KI-gesteuerten Chatbot ausstatten zu wollen. Hinzu kommen einige kleinere Anbieter wie Neeva und You.com, die ihre Suchmaschinen bereits um KI-Funktionen erweitert haben und ebenfalls Morgenluft wittern. Details erfahren Sie im Podcast der Technology Review mit Richard Socher, dem CEO von You.com.

Anleger reagierten nervös auf das laute Getrommel: Anfang Februar brach der Börsenwert der Google-Mutter Alphabet um rund zehn Prozent ein. Google hatte dem Rummel um Bing und ChatGPT wenig entgegenzusetzen und beschränkte sich auf vage Beschreibungen von zwei neuen KIs: Der Sprachbot Bard stützt sich auf Googles Sprachmodell LaMDA und generiert seine Antworten wie Bing anhand aktueller Informationen aus dem Internet. Wenn Bard keine eindeutige Antwort geben kann, soll NORA (No One Right Answer) einspringen und mehrere Antwortmöglichkeiten und Links anzeigen. Wie die Probleme von Bing zeigen, ist die Kopplung solcher Chatbots mit einer Suchmaschine keineswegs trivial. Google hat deshalb wohlweislich noch keinen Starttermin für Bard und NORA genannt.

Streit ums Geld

Die zentrale Frage ist, ob es sich bei den gravierenden Problemen nur um Kinderkrankheiten handelt, die die Suchmaschinen bald überwinden können. Sollte dies der Fall sein, drohen den ursprünglichen Websites und Autoren massive Einbußen bei Werbe- und Abonnement-Einnahmen. Nach dem neuen § 44b UrhG dürfen KI-Firmen das gesamte Internet ungefragt nach Trainingsmaterial für ihre Algorithmen durchforsten. Wer das nicht will, muss maschinenlesbare Verbote auf seiner Webseite platzieren. Wenn die KI-Crawler aber in den Suchmaschinen von Microsoft und demnächst auch von Google sitzen, bedeutet ein solches Stoppschild auf einer Website, dass diese für die Suchmaschinen unsichtbar wird und einen Großteil ihres Traffics verliert.

Deutsche Medienverbände wie der Bundesverband der Digitalverleger und Zeitungsverleger (BDZV) und der Medienverband der freien Presse (MVFP) haben sich bereits in Stellung gebracht: Wer mithilfe von KI-Sprachmodulen die Angebote von Verlagen für eigene Zwecke verwerte und damit konkurrierende, eigene Inhalte schaffe, dürfe dies nur mit einer Lizenz des jeweiligen Verlags tun, teilten sie dem Tagesspiegel in einer gemeinsamen Erklärung mit.

Es geht also um viel Geld und eine komplette Umwälzung des Internet-Werbemarktes. Der kleine Suchmaschinenbetreiber Neeva hat bereits erkannt, dass man Autoren für ihren Input zum Trainingsmaterial der KI bezahlen muss. Neeva will Medienschaffenden und Verlagen 20 Prozent des Umsatzes zukommen lassen, wenn die Suchmaschine deren Inhalte nutzt, um eine direkte Antwort auf eine Nutzeranfrage zu geben. Fraglich ist allerdings, ob Verlage und Autoren auf Neevas Angebot eingehen oder eher Forderungen in ganz anderer Größenordnung an Google und Microsoft stellen.

Weitere Konkurrenz droht von Diensten, die Websites automatisiert durchsuchen und von einer KI umformuliert verbreiten. In Zukunft wird es schwierig sein, den Betreibern nachzuweisen, dass sie abgeschrieben haben. Google will solche automatisch generierten Inhalte wie bisher nicht bestrafen, also keinesfalls niedriger ranken. Die Suchmaschine will laut ihren SEO-Richtlinien schlicht hilfreiche, vertrauenswürdige und nutzerorientierte Inhalte bevorzugen. Dabei spielt es keine Rolle, ob sie von Menschen oder Maschinen verfasst wurden.

Nicht zuletzt verschlingen die KI-gesteuerten Chatbots erhebliche Rechenleistung. In unseren Tests präsentierte Google seine Trefferliste deutlich schneller, als Bing seine Antworten formulieren konnte. Und OpenAI lässt sich die Rechenzeit von ChatGPT neuerdings bezahlen. Für einen Premium-Zugang zahlen Kunden 23,80 US-Dollar (gut 22 Euro) im Monat. Abonnenten sichern sich damit schnellere Antworten vom sonst oft überlasteten Chatbot und früheren Zugriff auf neue Funktionen.

(jo)