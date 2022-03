Bild: Rudolf A. Blaha Maschinelle Bilderrätsel Fotoauflösung erhöhen mithilfe künstlicher Intelligenz Bildskalierung ist geradezu prädestiniert für maschinelles Lernen. Wo traditionelle Algorithmen nie vollends überzeugen konnten, verspricht künstliche Intelligenz, Detailinformationen glaubhaft zu rekonstruieren. Wir haben getestet, wie gut die Skalieralgorithmen in Web-Apps und Bildbearbeitungsprogrammen dieses Versprechen einlösen. Von André Kramer

Die meisten Kameras lösen 24 Megapixel auf; Smartphonekameras meist nur 8 Megapixel. Was tun, wenn die Bildauflösung für großformatigen Druck nicht ausreicht und neu fotografieren keine Option ist? In US-Krimiserien mag es genügen, wenn jemand „Enhance“ kommandiert, damit aus der verschwommenen Reflexion eines Hinterkopfs ein gestochen scharfes Verbrecherporträt entsteht. In der Realität konnten auch komplexe Skalieralgorithmen nie vollends überzeugen.

Der Einsatz von künstlicher Intelligenz verspricht blühende Pixellandschaften. Etliche Anbieter verkaufen Upscaling auf Grundlage maschinellen Lernens. Im Test treten zunächst eine gute Handvoll Webdienste gegeneinander an. Alle bieten zwei-, drei- oder vierfache Skalierung. Bezahlt wird pro Bild.

Einige Desktop-Programme enthalten bereits KI-Skalierer. Aufgrund unterschiedlicher Ansätze sind sie aber nur bedingt mit den Webdiensten vergleichbar. Topaz Gigapixel AI ist der einzige Stand-alone-Skalierer. Für die übrigen Kandidaten wird sich kaum ein Kunde nur wegen dieser Funktion allein entscheiden; was sie leisten, ist dennoch interessant: das Grafikpaket CorelDraw Graphics Suite 2021, die Mac-Bildbearbeitung Pixelmator Pro und das Zweiergespann Photoshop und Lightroom.

Die richtige Portion Pixel

Für die Druckausgabe in 60 × 40 Zentimeter mit 300 ppi (Pixel pro Zoll) muss ein Foto eine native Auflösung von etwa 34 Megapixeln haben (7086 × 4724 plus etwas Schnitttoleranz). Die Kantenlänge eines 12-Megapixel Fotos (4032 × 3024) muss dafür nahezu verdoppelt werden.

Auflösung in 300 ppi nimmt man am besten bei einem Betrachtungsabstand von etwa 25 Zentimetern wahr, also in Büchern und Zeitschriften. Für größere Entfernungen bräuchte man die Stäbchen-und-Zapfen-Dichte eines Adlerauges, um die Details noch erfassen zu können. Großformatige Bilder kann man also auch geringer aufgelöst drucken, wenn diese nur aus einiger Entfernung zu sehen sind, beispielsweise aus dem Auto. Besucher von Museen und Galerien unterschreiten gerne den Betrachtungsabstand, bei dem man das vollständige Bild im Blickfeld hat. Beim Studieren von Details aus nächster Nähe ist wiederum eine Auflösung von 300 ppi wünschenswert.

Upscaling für Video und Spiele Im Kino machte im Jahr 2019 Peter Jacksons Dokumentarfilm „They shall not grow old“ Furore. Er zeigt Filmaufnahmen aus dem Ersten Weltkrieg aus den Archiven des britischen Imperial War Museum in bis dato ungeahnter Detailfülle. Videospezialisten von Stereo D aus den USA und Park Road Post Production in Neuseeland erhöhten die Auflösung, ergänzten Zwischenbilder, vertonten und kolorierten die Aufnahmen mithilfe von künstlicher Intelligenz [2]. Upscaling hat mit dem Einzug von Smart-TVs eine neue Dimension bekommen. 4K- oder gar 8K-TVs bekommen selten Material zu futtern, das ihre Auflösung voll ausreizt. Damit auch Video-DVDs und SD-Fernsehen gut aussehen, blasen Topgeräte von LG, Panasonic, Samsung und Sony die Pixel auf. Bei Samsung ist dafür beispielsweise die Reihe der Quantum-Prozessoren zuständig, bei Sony heißt die Technik X-Reality Pro. Auch die Grafik von Videospielen lässt sich über KI-gestützte Bildskalierung verbessern. Mit der Nvidia-Technik DLSS (Deep-Learning Super-Sampling) erhöhen Grafikkarten der Serien RTX 20 und RTX 30 die Auflösung von Spielen, um aus 1080p- 4K-Auflösung zu machen. Das ist durchaus sinnvoll: Statt Spielegrafik gleich in hoher Auflösung und Bildrate zu rendern, wählt man weniger Pixel und nutzt die Rechenleistung stattdessen für komplexere Shader. Das Desktopprogramm Topaz Labs Video Enhance AI nutzt dieselbe Technik wie das für Fotos entwickelte Plug-in Topaz Labs Gigapixel AI. Beim Video-Upscaling kommen gegenüber Foto noch andere Aspekte hinzu, beispielsweise Block- und Bandingartefakte sowie Flimmern. Topaz Video Enhance AI soll nicht nur die Auflösung erhöhen, sondern auch Kompressionsartefakte entfernen können und Rauschen minimieren. Es verspricht außerdem Deinterlacing, bei dem es durch das Zeilensprungverfahren verursachtes Bildflimmern minimiert. Letztlich kann es die Bildrate von 24 oder 30 auf 60 Bilder pro Sekunde erhöhen. Auch der Webdienst pixop.com bietet an, Videomaterial mit künstlicher Intelligenz bis hin zu 8K-Auflösung zu skalieren. Die Technik dahinter ist von Googles 2016 vorgestellter RAISR-Technik inspiriert (Rapid and Accurate Image Super Resolution). Pixops Ansatz heißt PABSR1 (PAtch-Based Super Resolution 1). Er wurde mit 44 Millionen gering und hoch aufgelösten Bildkacheln trainiert und berücksichtigt laut Hersteller vor allem den Winkel, die Schärfe und die „Kohärenz“ von Kanten, also wie sehr sie die Richtung wechseln. Verschiedene Videoprogramme enthalten KI-Skalierer. Adobe After Effects enthält eine Option namens „Details erhalten“, die eng mit dem Detail-verbessern-Algorithmus in Photoshop verwandt ist. „Davinci Resolve Super Scale“ erhöht ab Version 15 die Auflösung wahlweise 2-fach, 4-fach oder 8-fach, also von Full-HD-Videos bis zu 8K. Außerdem kann man das Bild in je drei Schritten nachschärfen und Rauschen reduzieren.

Bikubisch, Lanczos & Co.

Bildbearbeitungsprogramme bieten seit Jahrzehnten mehrere Methoden an, um Bilder zu skalieren, beispielsweise Pixelwiederholung, bilineare und bikubische Interpolation oder Verfahren mit Namen wie Lanczos. Letzteres geht auf den ungarischen Mathematiker Kornél Lánczos zurück (sprich: Lantsosch).

Für Pixelgrafiken wie in klassischen Videospielen wählt man Pixelwiederholung (nächster Nachbar, nearest neighbor). Dieses einfachste aller Verfahren wiederholt lediglich Nachbarpixel. Die Pixel werden dadurch schlicht größer, behalten ihre Farben, scharfen Kanten und Blockstruktur, bilden aber Treppchen.

Bilineare oder bikubische Berechnung eignet sich eher für Fotos und Videos. Bei bilinearer Berechnung interpoliert der Algorithmus die Farbwerte des gesuchten Pixels aus den vier in horizontaler und vertikaler Richtung nächstgelegenen Punkten, berücksichtigt also 2 × 2 Pixel. Die bikubische Interpolation agiert auf einem 4 × 4-Raster, interpoliert dazwischen aber nicht linear, sondern mittels einer kubischen Funktion. Bikubische Berechnung führt zu weniger Artefakten als bilineare. Bei beiden zahlt man den Preis, dass scharfe Kanten verloren gehen und Farben an Übergängen verfälschen; beide vermeiden aber auch Pixeltreppchen.

Das Lanczos-Verfahren ist aufgrund seiner Effizienz recht beliebt und daher in vielen Programmen zu finden von Gimp über IrfanView bis hin zu XnView. Gegenüber bilinearer Berechnung erzielt es sichtbar bessere Ergebnisse. Daneben gibt es weitere Verfahren, die nach Mathematikern benannt sind, beispielsweise Hermite, Bell oder Mitchell. Allen gemeinsam ist, dass sie mehr oder weniger gut Strukturen reproduzieren, allerdings keine Details erkennen und nur begrenzt rekonstruieren können und somit in der Regel auch JPEG-Artefakte mitvergrößern.