KI-Bildgeneratoren: Diese Technik steckt dahinter

Kunstwerke von KI-Bildgeneratoren sind kreativ und überraschend. Ein Ausflug in die mathematische Welt der Transformer, Diffusion-Models und Autoencoder.

Lesezeit: 20 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 1 Beitrag
, Albert Hulm

(Bild: Albert Hulm)

Von
  • Pina Merkert
Inhaltsverzeichnis

Ein Maler, ein Dichter und ein Mathematiker stehen vor einem alten Röhrenfernseher ohne Antenne. Der Fernseher zeigt ein wildes Rauschbild aus schwarzen und weißen Pixeln und die drei diskutieren darüber, was auf dem Bildschirm zu sehen ist.

Der Dichter behauptet ständig, Dinge aus einem seiner Gedichte zu erkennen. Der Maler widerspricht und verweist fortwährend auf die Bedeutung von Bildkomposition und Farbe und dass des Dichters Versatzstücke nicht dazu passten. Der Mathematiker schreit immer wieder dazwischen, dass die erwähnten Dinge nun mal gar nichts miteinander zu tun haben.

Mehr zu Künstlicher Intelligenz

Diese Szene beschreibt den kreativen Prozess von KI-Bildgeneratoren. Denn die Generatoren bestehen aus mehreren neuronalen Netzen, die gegeneinander arbeiten. Besonders erfolgreich ist eine Kombination aus drei Komponenten: Ein Diffusion-Model (Maler), das keine Ahnung hat, was es darstellen soll, bringt das Wissen um Farbe und Bildkomposition mit und erzeugt Vorschläge für Bilder.