Ende 2021 spielte ein kleines Team von Forschern in den Büros von OpenAI in San Francisco mit einer Idee herum. Sie hatten eine neue Version eines Text-Bild-Modells entwickelt. DALL-E ist eine KI, die kurze schriftliche Beschreibungen in Bilder umwandelt: einen von Van Gogh gemalten Fuchs vielleicht oder einen Corgi aus Pizza. Jetzt mussten sie nur noch herausfinden, was sie damit anfangen könnten.

Als sie an dem Modell tüftelten, wurde allen Beteiligten schnell klar, dass dies etwas Besonderes war. Aber niemand konnte vorhersehen, wie viel Aufsehen dieses Produkt erregen würde. "Dies ist die erste KI-Technologie, bei der normale Menschen Feuer und Flamme sind", sagt Sam Altman, Mitbegründer und CEO von OpenAI.

Dall-E 2 wurde im April 2022 veröffentlicht. Im Mai kündigte Google zwei eigene Text-zu-Bild-Modelle an (ohne sie jedoch zu veröffentlichen): Imagen und Parti. Dann kam Midjourney, ein Text-zu-Bild-Modell für Künstler. Und im August machte das britische Start-up Stability AI das Open-Source-Modell Stable Diffusion kostenlos der Öffentlichkeit zugänglich.