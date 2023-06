Die unheimliche, beunruhigende Atmosphäre von "The Frost" wird schon in den ersten Einstellungen deutlich. Man sieht eisige Berge, ein behelfsmäßiges Militärzeltlager, Menschen, die um ein Feuer kauern, bellende Hunde, die ein wachsendes Gefühl des Grauens zu erzeugen: Irgendetwas stimmt hier nicht.

"Reich mir den Schwanz", sagt eine Stimme. Eine Nahaufnahme zeigt einen Mann am Feuer, der an einem Stück Dörrfleisch nagt. Die Art, wie sich seine Lippen bewegen, ist nicht ganz richtig. Für einen Moment sieht es so aus, als würde er auf seiner eigenen gefrorenen Zunge kauen.

Willkommen in der grotesken Welt der KI-Filme. "Irgendwann haben wir aufgehört, auf fotografische Genauigkeit zu pochen und begannen, uns auf die Verrücktheit von DALL-E einzulassen", sagt Stephen Parker von Waymark, der in Detroit ansässigen Videoproduktionsfirma, die hinter "The Frost" steht. Herausgekommen ist ein 12-minütiger Film (exklusiv auf der Website der amerikanischen MIT Technology Review zu sehen), in dem jede Aufnahme von einer KI generiert wird. Er ist eines der bis dato beeindruckendsten – und bizarrsten – Beispiele für dieses seltsame neue Genre.

Für die Produktion von "The Frost" nahm Waymark ein Skript von Josh Rubin, einem ausführenden Produzenten des Unternehmens, und fütterte damit den KI-Bildgenerator DALL-E 2. Nach einigen Versuchen, das Modell dazu zu bringen, Bilder in einem Stil zu erzeugen, mit dem sie zufrieden waren, verwendeten die Filmemacher DALL-E, um jede weitere Einstellung zu "drehen". Dann setzten sie D-ID ein, ein Tool, mit dem Standbilder animiert werden können. So können die Zelte im Wind flattern und sich die Lippen beim Sprechen bewegen.

KI-Filme auf dem Vormarsch

"Dies ist sicherlich der erste generative KI-Film, den ich gesehen habe, bei dem sich der Stil konsistent anfühlt", sagt Souki Mehdaoui, eine unabhängige Filmemacherin und Mitbegründerin von Bell & Whistle, einer auf kreative Technologien spezialisierten Beratungsfirma. "Die Generierung von Standbildern und dem späteren Puppenspiel verleiht dem Film den Vibe einer besonderen Collage."

"The Frost" ist nicht der einzige Kurzfilm, der in den vergangenen Monaten mithilfe generativer künstlicher Intelligenz erstellt wurde. Selbst die besten Modelle sind derzeit noch auf wenige Sekunden Video beschränkt. Daher weisen viele Filme eine breite Palette von Stilen und Techniken auf, die von storyboardartigen Sequenzen wie in "The Frost" hin zu wilden Zusammenschnitten vieler verschiedener Videoclips reichen.

Im Februar und März veranstaltete Runway, ein US-Unternehmen, das KI-Tools für die Videoproduktion herstellt, ein KI-Filmfestival in New York. Zu den Höhepunkten gehörten "PLSTC" von Laen Sanches, eine schwindelerregende Sequenz von seltsamen, in Plastik eingewickelten Meeresbewohnern, die mithilfe des Bildgenerators Midjourney generiert wurden. "Given Again" von Jake Oleson, der eine Technologie namens NeRF (neural radiance fields) verwendet, die 2D-Fotos in virtuelle 3D-Objekte verwandelt. Und die surreale Nostalgie von Sam Lawtons "Expanded Childhood", einer Diashow von alten Familienfotos, die Lawton mithilfe von DALL-E 2 über ihre Grenzen hinaus erweitern ließ, sodass er mit den halb erinnerten Details der alten Bilder spielen konnte.

Schnell und billig

Künstlerinnen und Künstler sind oft die ersten, die mit neuen Technologien experimentieren. Aber auch die Werbeindustrie ist häufig ganz vorne mit dabei. So hat Waymark "The Frost" auch deshalb entwickelt, um herauszufinden, wie das Unternehmen generative KI in seine Produkte integrieren kann. Waymark stellt nämlich Software für die Videoproduktion her, mit denen Unternehmen schnell und kostengünstig Werbespots erstellen können.

Die aktuelle Technologie von Waymark, die Anfang des Jahres auf den Markt kam, kombiniert verschiedene KI-Techniken, darunter Sprachmodelle, Bilderkennung und Sprachsynthese, um in wenigen Schritten eine Werbeanzeige zu erstellen. Waymark stützt sich dabei auch auf seinen großen Datensatz von traditionellen Werbespots, die für frühere Kunden erstellt wurden. "Wir haben Hunderttausende von Videos", sagt CEO Alex Persky-Stern. "Wir haben die besten davon ausgewählt und die KI damit trainiert, um ihr zu zeigen, wie ein gutes Video aussieht."

Um das Waymark-Tool zu nutzen, das als Teil eines gestaffelten Abonnements ab 25 US-Dollar pro Monat angeboten wird, geben die Nutzenden die Website oder die Social-Media-Konten ihres Unternehmens an. Die Software sammelt anschließend alle Texte und Bilder, die es finden kann. Anhand dieser Daten wird dann ein Werbespot erstellt, wobei GPT-3 ein passendes Skript schreibt, das von einer synthetischen Stimme über ausgewählte Bilder, die das Unternehmen hervorheben, vorgelesen wird. In Sekundenschnelle entsteht so ein einminütiger Werbespot. Die Kunden können das Ergebnis nach Belieben bearbeiten, indem sie das Skript optimieren, die Bilder bearbeiten oder eine andere Stimme wählen. Waymark sagt, dass bisher mehr als 100.000 Menschen das Tool genutzt haben.