Tencent Cloud, der Arm des chinesischen Tech-Giganten für Online-Dienste in den Rechnerwolken, hat eine Plattform für die Produktion "digitaler Menschen" in Form vergleichsweise natürlich wirkender Bots eingeführt. Der Service ermöglicht es Nutzern, auf der Basis eines dreiminütigen Bewegtbilds und 100 Sätzen Sprachmaterial für eine Gebühr von umgerechnet rund 130 Euro Videos von beliebigen Personen zu erstellen, die als Deepfakes durchgehen dürften. Der Bot-Generator nutzt dabei ein hauseigenes System für Künstliche Intelligenz (KI) von Tencent, um die Videos zu generieren.

Deepfake-Videos von "digitalen Menschen" in 24 Stunden

Chinesische Medien berichten, der Cloud-Dienst könne innerhalb von 24 Stunden anhand der bereitgestellten Aufnahmen so trainiert werden, dass er ein mehr oder weniger überzeugendes Deepfake-Video produziert. Das britische Online-Magazin The Register erhielt nach eigenen Angaben von Tencent eine Bestätigung, dass der Service auf Chinesisch und Englisch verfügbar sei. Die Erstellung digitaler Menschen werde in fünf Varianten angeboten: 3D realistisch, 3D semi-realistisch, 3D-Cartoon, 2D reale Person und 2D-Cartoon. Die digitalen Figuren sind demnach als Halb- oder Ganzkörper erhältlich. Einige Aspekte wie Hintergrund und Farbton sollen anpassbar sein.

Die kreierten Videos vermeiden nach ersten Einschätzungen die flache Intonation und den einheitlichen Sprachrhythmus, mit denen herkömmliche akustische Modelle zu kämpfen haben. Dabei soll ein Tencent-Verfahren zur Anpassung der Klangfarbe bei kleinen Samples eingesetzt werden, die auf akustischen Modellen mit Deep Learning und neuronalen Netzwerk für Stimmaufnahmen basieren. Chen Lei, General Manager von Tencent Cloud Intelligent Digital Human Products, erklärte gegenüber The Register, man wolle eine automatisierte, KI-gesteuerte "Fabrik für intelligente digitale Menschen" aufbauen und sich auf eine Selbstbedienungsplattform für Produktion, Verkauf und Service stützen.

Markt für Werbespots – beliebte Form des E-Commerce

Tencent sieht den Berichten zufolge einen großen Markt darin, die Kreationen für live gestreamte Werbespots zu nutzen. Dabei handelt es sich um eine beliebte Form des E-Commerce in China. Es gehe auch darum, "Ärzte, Anwälte und andere Fachleute" digital zu erschaffen. Für die Schöpfungen können maßgeschneiderte Fragen und Antworten erstellt werden, die sie in eine Art Chatbot verwandeln. Doch die Missbrauchsgefahr ist groß: Als Deepfakes gelten zunehmend realistisch wirkende Fotos, Audios oder Videos, in denen Personen mit Hilfe von KI in neue Kontexte gestellt werden. Oft werden so Dritten etwa Worte in den Mund gelegt, die sie so niemals gesagt haben.

KI-erstellte Bilder sind immer schwerer von echten zu unterscheiden. Prägnante Beispiele dafür sind die aufmerksamkeitsstarken angeblichen Darstellungen der Verhaftung des früheren US-Präsidenten Donald Trump und des Papstes, der eine weiße Designer-Polsterjacke trägt. Das Büro für Technikfolgen-Abschätzung des Bundestags (TAB) verweist in einer aktuellen Studie zu ChatGPT & Co. auf Risiken rund um multimodale KI-Modelle: Gepaart mit der Möglichkeit der Erzeugung von Bildern sowie Videos oder Stimmen ließen sich damit ganz neue zukünftige Anwendungsmöglichkeiten vorstellen, etwa bei der Erzeugung von Deepfakes. Twitter-Chef Elon Musk warnte vor Kurzem vor der zunehmenden Zahl von Fälschungen, die sich für ihn ausgeben, um für Betrug mit Kryptowährungen zu werben. Europol befürchtet, Deepfakes könnten zum Standardwerkzeug Krimineller werden. Chinesische Vorschriften sollen solche Szenarien verhindern.

