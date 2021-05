In einem aktuellen Paper beschreiben Forscher von Intel, wie sie synthetische Bilder mit einem KI-Modell verbessern können. Das am 10. Mai erschienene Paper beschreibt das Vorgehen am Beispiel des Videospiels "GTA 5": Ein KI-Filter verleiht der Grafik des Open-World-Spiels ein fotorealistisches Aussehen, wie ein zu dem Paper veröffentlichtes Video demonstriert.

In dem Video vergleichen die Forscher von Intel ihr Vorgehen mit anderen Methoden zur Bild-zu-Bild-Übersetzung wie TSIT, CUT und MUNIT. Dabei ist deutlich zu erkennen, dass das Intel-Modell bessere Ergebnisse erzielt als die anderen Methoden: Es behält die Struktur einer Szene auch bei Fortbewegung bei, Flimmern und falsch platzierte Objekte (die Forscher bezeichnen das als "Halluzinationen") treten nicht auf.

Deutsche Städte im Datenset

Wie andere KI-Modelle analysiert der Intel-Filter die Spiele-Grafik und vergleicht sie mit einer Datenbank aus inhaltlich gekennzeichneten, realen Fotos. Für das Demo-Video mit "GTA 5" hat sich Intel am Cityscapes Dataset bedient, das 25.000 Fotos aus 50 vorrangig deutschen Städten umfasst. Entsprechend ändert sich der Look von "GTA 5" durch den KI-Filter deutlich: Die hübschen Sonnenuntergänge der fiktionalen Westküstenstadt Los Santos weichen einem fotorealistischen, aber doch recht trostlosen Stadtambiente.

Neben der gerendeten Spielegrafik bezieht Intels KI-Modell auch die Geometrie-Informationen aus dem G-Buffer in die Bildübersetzung ein. (Bild: Intel)

Intels KI-Modell erfasst dafür die Spiel-Umgebung aus "GTA 5" und zeichnet sie mit Elementen nach, die es aus dem Cityscapes-Datenset erlernt hat. Laut Intel funktioniert das Vorgehen unter anderem deswegen besser als andere Methoden, weil es auch den G-Buffer mit Geometrie-Informationen berücksichtigt. Details erklären die Forscher in ihrem Paper.

Der Haken: Die gesamte Rekonstruktion der Ingame-Grafik dauert laut Intel selbst auf der aktuellen Top-Grafikkarte RTX 3090 eine halbe Sekunde. Für den Praxis-Einsatz bei Videospielen ist das Grafik-Modell daher in seiner aktuellen Form nicht geeignet – die Latenz ist fürs Spielen zu hoch. Intel schreibt aber, man könne den Ansatz noch weiter optimieren und sogar mit Raytracing kompatibel gestalten. Die Methode könne außerdem direkt in Spiele-Engines integriert werden, wodurch die Latenz weiter sinken könnte.

