Künstliche Intelligenz: Bilder gestalten statt nur beschreiben

In den Forschungsabteilungen von Adobe, Google, Facebook und Co. entstehen KI-Techniken, die intuitive Bildbearbeitung ermöglichen. Langfristig sollen sie Computern ein tieferes Verständnis von unserer Umgebung vermitteln.

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 39 Beiträge
Künstliche Intelligenz: Bilder gestalten statt nur beschreiben
Von
  • Andrea Trinkwalder

Neuronale Netze erkennen Objekte in Fotos, beschreiben Szenen und generieren psychedelische Traumbilder. Für KI-Forscher waren das allerdings nur Etappensiege.

Während die Welt noch staunt, reift in ihren Köpfen und Laboren bereits die nächste Generation künstlicher Intelligenz heran, die Bilder nicht nur beschreiben, sondern auch gestalten kann – und sie scheinen tatsächlich den richtigen Dreh gefunden zu haben, um intuitive Bildbearbeitung zu realisieren. In der aktuellen c't können Sie lesen, was jetzt schon funktioniert und was sich in den Laboren von Google, Adobe, Facebook und Co. zusammenbraut.

Adobe-Research-Forscher beispielsweise zeigen in ihrer jüngsten Technik-Demo, wie die App Photoshop Fix ein Porträt nahezu automatisch optimiert. Mit wenigen Fingertips ist der Kopf freigestellt, der Hintergrund weichgezeichnet und ein professioneller Look erzeugt.

Adobe ist damit nicht allein. Im vergangenen Jahr haben Forscher aus aller Welt beeindruckende KI-Techniken präsentiert, die Foto-Optimierung und -retusche auf wenige intuitive Handgriffe oder gar Sprachbefehle reduzieren könnten: Neuronale Netze lösen knifflige Maskierungs-Fälle, beherrschen szenenspezifische Autokorrektur und borgen sich den angesagten Look kurzerhand von beliebigen Bildern, die andere aufwendig gestaltet haben. Welche Korrektur in welcher Situation angemessen ist, haben sich die Netze durch intensives Training selbstständig erschlossen, meist indem sie tausende Bildpaare verglichen haben: das Original sowie eine professionell gestaltete Variante.

Deep Image Matting stellt sogar tautropfenbesetzte Spinnennetze frei. Der Anwender muss nur grob markieren, die Feinarbeit übernimmt die KI.

(Bild: Ning Xu et al.)

Ausgestattet mit solchen Techniken, sieht die Bildbearbeitung ein Foto nicht länger nur als Ansammlung von Farb- und Helligkeitswerten. Stattdessen scheint sie eine Art Gespür für den individuellen Charakter jedes Motivs entwickelt zu haben.

Deep Photo Style Transfer trennt den Stil vom Motiv. So lassen sich fade Fotos (links) mit einem schickeren Look (Mitte) aufpeppen.

(Bild: Fujun Luan et al.)

Eine mit hochwertigem Material trainierte Autokorrektur ist beispielsweise in der Lage, optimale Einstellungen zu finden, die der abgelichteten Szene gerecht werden und nicht – wie bisher – nur fürs durchschnittliche Tageslichtfoto passen. So kann sie stimmungsvolles Licht von der Fehlbelichtung unterscheiden, interpretiert Hochzeitsbilder weicher als Action-Aufnahmen und weiß, dass man Winter- oder Herbstbilder beim Entfernen des Farbstichs nicht komplett neutralisieren sollte.

Besonders heiß werden so genannte generative Verfahren gehandelt, die gezielte Retusche erlauben und automatisch dafür sorgen, dass Änderungen realistisch wirken. Sie passen zum Beispiel die gesamte Mimik an, wenn aus einem ernsten Gesichtsausdruck ein Lächeln werden soll. Man kann sie auch darauf trainieren, ein Gesicht älter, männlicher oder weiblicher wirken zu lassen.

In der aktuellen c't stellen wir die spannendsten KI-Techniken für Bildbearbeiter vor und erklären, was dahinter steckt. Für Experimentierfreudige haben wir ein Tutorial samt Trainingsmaterial zusammengestellt, um mit TensorFlow ein eigenes Superresolution-Netz zu trainieren.

Der Schwerpunkt in c't zur Bildbearbeitung mit Künstlicher Intelligenz:

(atr)