Bei generativer KI zeigen auch kleine Schritte große Wirkung. Das Update 5.2 für den KI-Bildgenerator Midjourney bringt ein neues Werkzeug, mit dem man aus Bildern herauszoomen kann. Außerdem ändert sich die standardmäßige Bildästhetik.

Leinwand vergrößern

Einen neuen Befehl führt Midjourney 5.2 nicht ein. Am Anfang steht nach wie vor der Prompt über den Befehl /imagine. Midjourney präsentiert im Anschluss vier Varianten und darunter einen Satz Befehle: U1 bis U4 stellen jeweils eine Variante in höherer Auflösung bereit ("Upscaling"). V1 bis V4 erzeugen weitere Varianten.

Nach dem Upscaling erscheinen neue Menüpunkte unter dem Bild. Zum einen kann man das Bild variieren lassen. Über den Befehl „Zoom out“ lässt sich außerdem die Leinwand vergrößern. Dafür stehen zwei Schaltflächen mit den Werten 1.5 und 2 zur Verfügung. Der Parameter --zoom akzeptiert über die Kommandozeile Werte zwischen 1 und 2.

Unterhalb fertig generierter Bilder zeigt Midjourney 5.2 Schaltfläche für den Parameter "zoom out".

Im Resultat präsentiert Midjourney jeweils vier neue Varianten gewissermaßen aus größerem Betrachtungsabstand: Das vorige Motiv erscheint kleiner in der Bildmitte, an den Rändern erzeugt die KI mehr Details. Den Prozess kann man so oft wiederholen, wie man möchte.

Das Bild links hat Midjourney aus einem Prompt generiert. Die Variante rechts entstand mit Zoom-out-Faktor 2.0.

Adobes aktuelle Betaversion von Photoshop enthält ein vergleichbares Werkzeug. Über „generatives Füllen“ kann die Bildbearbeitung den KI-Bildgenerator Adobe Firefly nutzen, um ebenfalls die Leinwand eines geladenen Bildes zu vergrößern. Im Unterschied zu Photoshop bearbeitet Midjourney nur selbst generierte KI-Bilder.

Das Spiel kann man bis ins Unendliche weitertreiben. Im dritten Zoom-out-Schritt erschien ein neuer Reiter auf der Bildfläche.

Midjourneys neuer Stil

Abgesehen davon ändert sich bei Midjourney mit Version 5.2 auch der Stil. Das aktuelle Modell verspricht laut Hersteller schärfere, detailreichere Bilder mit besseren Farben und Kontrasten.

Außerdem soll der Bildgenerator sensibler auf die Parameter --style und --stylize reagieren. Über „--style raw“ erzeugt Midjourney fotografisch anmutende Bilder. Weitere Varianten heißen „--style cute“, „--style scenic”, “--style original” und “--style expressive”.

Der Parameter --stylize oder --s beeinflusst, wie künstlerisch Midjourney Farben, Formen und Komposition gestaltet. Der Standardwert ist 100. Mit dem Wert Null bleibt Midjourney trocken und humorlos beim Prompt. Beim maximalen Wert 1000 löst sich der Bot vom Prompt und produziert künstlerische Ergebnisse.

Der Stylize-Parameter steuert, wie eng Midjourney sich an die Vorlage hält: links zwei Poker spielende Enten buchstabentreu mit "--stylize 0", rechts freier mit "--stylize 1000".

Die Midjourney-Version 5.2 ist ab sofort bei dem KI-Bildgenerator voreingestellt. Über den Parameter --version oder --v kann man jedoch weiterhin ältere Versionen nutzen. Der Parameter akzeptiert derzeit die Werte 1, 2, 3, 4, 5, 5.1 und 5.2 (zu allen Midjourney-Befehlen und weiteren Prompt-Tipps siehe Praxisartikel in c’t 17/2023).

Preise und Verfügbarkeit

Midjourney 5.2 ist ab sofort verfügbar. Ein Abo kostet monatlich 11,90 US-Dollar und berechtigt zu 3,3 Stunden schneller GPU-Berechnung. Für 35,70 US-Dollar gibts 15 Stunden pro Monat. Sind sie aufgebraucht, kann man weitere für 4 US-Dollar pro Stunde hinzukaufen oder muss Geduld aufbringen. (akr)