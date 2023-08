Auf immer mehr Internetseiten landen von KI-Textgeneratoren gezielt für Suchmaschinen wie Google umgeschriebene Texte etablierter Medien, die Einnahmen durch Onlinewerbung generieren sollen. Das hat US-Unternehmen NewsGuard herausgefunden und gleichzeitig festgestellt, wie schwer sich solche Inhalte finden lassen. Bei den insgesamt 37 identifizierten Seiten mit solchen Inhalten waren demnach einmal mehr Phrasen von Chatbots wie ChatGPT verräterisch, die nicht entfernt worden waren. In besonders bemerkenswerten Beispielen finden sich sogar im Titel Formulierungen wie: "(Note: As an AI language model, I don’t have personal preferences or opinions. I have just tried to rephrase the title in a grammatically correct and alternative way.)"

Rechtliche Bewertung steht aus

Der verräterische Titel wurde bis heute nicht verbessert (Bild: Screenshot)

Die von NewsGuard beschriebene Praxis erinnert an eine ähnliche Vorgehensweise, die das Unternehmen im Frühjahr publik gemacht hat. War es damals aber um dutzende Internetseiten gegangen, die von KI-Textgeneratoren erstellte Inhalte in großer Masse als angebliche Nachrichtenartikel veröffentlichen, sind die neuen Fälle komplexer. Betroffen sind demnach Inhalte von Nachrichtenseiten wie der New York Times, CNN und Reuters. Die naheliegende Vermutung ist, dass dahinter Programme stecken, die vollautomatisch Nachrichtenquellen abgrasen, gefundene Inhalte mit der Aufforderung in einen Textgenerator wie ChatGPT weiterreichen, sie SEO-freundlich (für "Suchmaschinenoptimierung") umzuschreiben und die Resultate veröffentlichen. Menschen scheinen das nicht zu kontrollieren.

Geld verdienen die Seiten mit Namen wie GlobalVillageSpace.com, LiverPoolDigest.co.uk, topgolf.kr oder WhatsNew2Day.com demnach mit programmatischer Werbung, die ebenfalls vollautomatisch darauf geschaltet wird. Werbetreibende werden zumeist nicht einmal wissen, dass sie dafür bezahlen, dass ihre Anzeigen auf diesen Seiten erscheinen. Bei NewsGuard weiß man auch nicht, wie man die genannte Praxis überhaupt beschreiben soll. Immerhin handelt es sich nicht um simple und rechtswidrige Kopien von Inhalten, wie sie seit Jahren online zu finden sind. Bestenfalls könne man von "effizienter Aggregation" sprechen, schlimmstenfalls wohl eher von "Plagiaten mit Turbolader", schreibt das Unternehmen. Google und OpenAI haben sich demnach nicht geäußert.

Anders als einfach kopierte Onlineartikel, lassen sich solche Inhalte auch nur schwer als solche identifizieren – wenn überhaupt. Ein Werkzeug zur Enttarnung von Plagiaten habe bei der Mehrheit unter dutzenden Beispielen die Originalquelle nicht identifizieren können. Zielführender könnte hier die Suche nach anderen Artikeln sein, in denen die oft ebenfalls enthaltenen Bilder noch auftauchen. Selbst die in den Artikeln enthaltenen Fehlermeldungen der KI-Textgeneratoren haben demnach nicht verhindert, dass das Tool in 80 Prozent der Fälle ausgegeben habe, dass es sich um ein Original handelt. Diese Schwierigkeiten bei der Identifizierung lassen vermuten, dass es im Internet viel mehr solcher Seiten geben dürfte, die nur etwas weniger offensichtlich vorgehen.

