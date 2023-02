Microsoft will laut Medienberichten zehn Milliarden US-Dollar in das Unternehmen OpenAI investieren, unter anderem, um dessen KI-Sprachmodell ChatGPT in seine Suchmaschine Bing zu integrieren. Auch wenn sich Microsoft bisher in Schweigen darüber hüllt, wie es in die Suchmaschine eingebettet werden soll, führt die Meldung unter Beobachtern zu angeregten Diskussionen: Kann Google nun einpacken oder ist eine solche Integration Unfug?

Zunächst spricht einiges dagegen, Sprachmodelle für die Internetsuche zu nutzen. So liefern ChatGPT & Co. gerne mal frei Erfundenes statt Fakten. Und sie ermöglichen es den Nutzern nicht einmal, die Angaben zu prüfen, weil sie für gewöhnlich nicht ihre Quellen nennen. Abgesehen davon ist ihr Wissensstand nicht aktuell. Sprachmodelle werden bis zu einem bestimmten Zeitpunkt mit Texten gefüttert, danach nicht mehr. Zu allem, was sich danach ereignet, können sie keine Angaben machen.

Der Datenbestand von ChatGPT zum Beispiel ist laut OpenAI auf dem Stand von Anfang 2022. Wenn ChatGPT vereinzelt Informationen kennt, die es später gelernt haben muss – etwa, dass Elon Musk der CEO von Twitter ist –, so ist das nur eine Ausnahme von dieser Regel. Wer den Dienst nach dem brasilianischen Präsidenten fragt, erhält die falsche Antwort Jair Bolsonaro.

Perplexity AI liefert maßgeschneiderte Antworten inklusive der Quellen – die Antworten sind aber nicht immer up to date.

Suchmaschinen funktionieren seit über zwanzig Jahren mehr oder weniger nach dem gleichen Prinzip: Auf eine Suchanfrage hin stellen sie eine Liste von Links zusammen, von denen sie annehmen, dass diese für die Anfrage relevant sind. Diese Links stammen aus einem Index, den sie mit sogenannten Crawler-Programmen angelegt haben. Ein solcher Index ist viel aktueller als der Datenbestand eines Sprachmodells.

Crawler, Index, Liste

Auch Suchdienste versuchen, Anfragen direkt zu beantworten, wo das für sie möglich ist. Dazu bauen sie sogenannte OneBoxes auf den Suchergebnisseiten ein, besondere Suchergebnisse für bestimmte Fragen. Allerdings gibt es solche Boxen nur für einen Bruchteil der Suchanfragen.

Könnte eine Suchmaschine die Vorteile der beiden Welten vereinen – maßgeschneiderte, ausformulierte Antworten einerseits, Aktualität und Überprüfbarkeit andererseits – käme das einer Revolution der Internetsuche gleich. Mehrere Suchdienste zeigen, dass das möglich ist. Perplexity AI, You.com und Neeva.com liefern ausformulierte Antworten im ChatGPT-Stil, zu denen sie ihre Quellen mit angeben. Der Benutzer kann so die Herkunft der Informationen überprüfen.

Die drei Suchdienste sind allesamt noch nicht ausgereift und funktionieren derzeit nur für englische Suchanfragen. Perplexity AI und You.com betreiben ihre Antwortmaschinen zudem losgelöst von ihren normalen Suchergebnisseiten. Perplexity AI präsentiert nur Freitextantworten und überhaupt keine klassischen Linklisten. In unseren Versuchen lieferte der Suchdienst außerdem teilweise veraltete Angaben, etwa über den aktuellen Präsidenten von Brasilien. You.com ist eine noch recht neue, "klassische" Suchmaschine. Zusätzlich ist im Dezember YouChat gestartet, das Antworttexte mit einem Sprachmodell generiert. Es läuft alternativ zur althergebrachten Suche.

NeevaAI verfasst einen maßgeschneiderten Text, den die Suchmaschine mit den anderen Inhalteboxen auf der Suchergebnisseite anzeigt.

Index füttert Sprachmodell

Am stimmigsten hat Neeva seine ChatGPT-artige Antwortmaschine in seinen Suchdienst integriert. Bei vielen Suchanfragen zeigt deren Funktion NeevaAI auf der Ergebnisseite eine Box mit der dynamisch von einer KI verfassten Antwort mitsamt der Quellen an. Wer zum Beispiel nach "Twitter Files" sucht, erhält als Antwort: "The Twitter Files are a series of documents released by Twitter owner Elon Musk that provide insight into the company’s content moderation decisions. The documents have revealed that the CIA has been meddling in Twitter’s internal content moderation for years. They have also shown that the U.S. military has been directly assisted by Twitter." Dazu verlinkt NeevaAI die Quellen CBS News, MSN.com, Fox News und NY Post.

Welche Fragen Neeva mit Freitext beantwortet und wo es den NeevaAI-Text platziert, entscheidet der Dienst automatisch, genauso wie für andere Inhalte, die es in die Suchergebnisseiten integriert – Bilder, Videos und Wikipedia-Kästen. Wer zum Beispiel "Eiffel Tower" ins Suchfeld tippt, erhält zuerst einen Link auf die offizielle Homepage des Turms, dann eine Karte und dann erst die KI-Antwort. Einen Auszug aus dem Wikipedia-Eintrag über den Eiffelturm stellt Neeva rechts daneben.

Anders als viele andere Suchdienste, die nur Ergebnisse von Google oder Bing durchreichen, betreibt Neeva einen eigenen Suchindex. Offenbar ist dieser eigene Index eine der Grundlagen dafür, NeevaAI so nahtlos in die Suche zu integrieren. Zum Beantworten einer Anfrage verwendet Neeva gleich mehrere Sprachmodelle, wie Sridhar Ramaswamy, CEO des Dienstes, im Gespräch mit c’t erklärte. Nach der Eingabe der Suchanfrage bestimmt zunächst ein Sprachmodell die Absicht des Nutzers und ergänzt die Anfrage mit Synonymen, rechtschreibkorrigierten Wörtern und verwandten Ausdrücken. In seinem Blog beschreibt Neeva die Anpassung der Anfrage und NeevaAI im Detail und bietet Feedback-Möglichkeiten, falls man Fehler findet.

Nachdem NeevaAI die Anfrage des Nutzers analysiert und umgeschrieben hat, ruft es die Inhalte der relevantesten Seiten ab und baut daraus eine Antwort zusammen – meist einen Absatz lang. Die von der KI generierte Antwort lädt in der Regel ein wenig langsamer als der Rest der Suchergebnisseite – aber meist deutlich schneller als bei der derzeit arg überlasteten ChatGPT-Homepage. NeevaAI ist im Moment nur für Nutzer mit einem US-amerikanischen Account verfügbar – wer hierzulande NeevaAI ausprobieren möchten, kann seinen Account in den Einstellungen einfach entsprechend umschalten.

Werbefrei und abofinanziert

Dass Neeva eine derart ausgefeilte Antwortmaschine betreibt, ist umso erstaunlicher, als dass Neeva als junges Suchmaschinen-Start-up gerade einmal 50 Mitarbeiter beschäftigt. Neeva soll in einer Basisversion inklusive NeevaAI dauerhaft werbefrei und kostenlos bleiben. Geld verdienen will das Unternehmen mit kostenpflichtigen Accounts. Diese sollen auch bei Clouddiensten liegende Daten durchsuchen, außerdem gehören Dienste von Fremdanbietern dazu, etwa das Bitdefender-VPN und der Passwortmanager Dashlane.

Google ist mit Sicherheit eines der Unternehmen mit der größten Expertise in KI. Der Branchenprimus verfolgt mehrere Ansätze, KI in seine Suche zu integrieren. Das BERT-Sprachmodell (Bidirektionale Encoder Darstellungen von Transformers) etwa, das Neeva für die Vorbehandlung der Suchanfragen verwendet, ist ursprünglich von Google entwickelt worden und bearbeitet auch dort Anfragen vor. Und auch Google hat einen Chatbot: LaMDA – Language Model for Dialogue Applications. Eine derart stimmige Integration der Sprachmodelle in die Suchmaschine wie Neeva hat Google aber bisher nicht gezeigt.

Google steht ohnehin unter Druck in seinem zentralen Geschäftsfeld, der Suche. So kommen junge Menschen immer seltener auf die Idee, bei Google zu suchen, sondern nutzen stattdessen TikTok oder Instagram. Das habe eine interne Studie ergeben, wie ein Google-Manager erklärte. Und jetzt erwächst zusätzlich noch Konkurrenz durch andere Suchdienste, die statt einer Liste von Links eine fertig ausformulierte Antwort zur Suchanfrage präsentieren können: 2023 könnte das Jahr werden, in dem sich Suchmaschinen so stark verändern wie lange nicht mehr.

(jo)