Weitblick

Nvidia-Konferenz: Die Zukunft von GeForce, Tegra und CUDA

Trends & News | News

In San Jose kündigte Nvidia die Grafik- und Smartphone-Prozessoren der kommenden Jahre an. Außerdem stellten die Kalifornier Serversysteme für 3D-Virtualisierung vor und gaben einen Ausblick auf die Spielegrafik der Zukunft.

S onne, blauer Himmel und über 20 °C – so empfing die GPU Technology Conference im kalifornischen San Jose dieses Jahr mehr als 3100 Fachbesucher. Nvidias GPU-Computing-Messe wächst Jahr für Jahr beträchtlich. Eigentlich als reine Entwicklerkonferenz ausgerichtet, rückt Nvidia die Veranstaltung durch eigene Ankündigungen in den Mittelpunkt der Technik-Berichterstattung. Heuer gewährte Nvidia-Boss Jen-Hsun Huang einen Ausblick auf die zukünftigen Grafik- und Mobil-Prozessoren und zeigte mit zwei Techdemos, wohin die Reise in der Echtzeit-Computergrafik geht.

CUDA erobert Smartphones

Besonders viel Aufsehen erregte jedoch die Roadmap zu den zukünftigen Tegra-Chips für Smartphones und Tablets. Der aktuelle Tegra 4 ist zwar schnell, allerdings hinkt seine GPU technisch hinterher. Dies soll sich mit Tegra 5 ändern, der unter dem Codenamen Logan läuft. Dessen Grafikeinheit nutzt die Kepler-Architektur mit Unified Shadern und bringt CUDA-Berechnungen aufs Handy. Nvidia zufolge soll Logan sogar die derzeit neueste CUDA-Version 5.0 unterstützen. Anwendungsbeispiele nannte Nvidia aber noch nicht. Entwickler müssen ihre Programme trotzdem noch anpassen, da sie ja nicht im Zusammenspiel mit x86-, sondern mit ARM-CPUs funktionieren müssen. Bis zum Erscheinen von Logan im Jahr 2014 sollen aber schon fleißig CUDA-on-ARM-Programme geschrieben sein – dafür stellte Nvidia das Kayla-Entwicklungssystem vor, das sich am Logan-SoC orientiert. Neben CUDA beherrscht Logan auch OpenGL 4.3 – nicht nur die derzeit aktuelle, abgespeckte ES-Version – und dadurch auch Tessellation.

Für 2015 steht „Parker“ an – der erste Nvidia-Chip aus dem „Project Denver“ mit selbst entwickelten 64-bittigen ARM-Kernen und einer GPU mit Maxwell-Architektur. Letztere debütiert laut Nvidia ab 2014 auf Desktop-Grafikkarten. Im Vergleich zum Tegra 2 soll die Rechenleistung des Parker-SoC um den Faktor 100 höher liegen – ob mit oder ohne Nvidia-Rechentricks, ist unklar. Zur Fertigung des SoC will Nvidia 3D-FinFet-Transistoren verwenden.

Ein Terabyte pro Sekunde

Im Bereich der Desktop-GPUs überraschte Nvidia mit der Ankündigung seiner übernächsten GPU-Generation „Volta“. Erstmals will Nvidia ihren Grafikspeicher direkt auf den GPU-Silizium-Träger setzen (Stacked DRAM). Dadurch soll die Transferrate auf 1 TByte/s ansteigen – also im Vergleich zum jetzigen Spitzenmodell GeForce GTX Titan auf ungefähr das Vierfache. Stacked DRAM ist notwendig, um die Jahr für Jahr wachsende Zahl von Recheneinheiten mit den gleichfalls steigenden Datenmengen schnell genug zu versorgen. Das gilt nicht nur fürs 4K-Rendering mit hochaufgelösten Texturen, sondern auch für den GPU-Computing-Sektor, den Nvidia mit großem Abstand vor AMD anführt.

Sogar mit heutigen Kepler-GPUs könnten einige Anwendungen die vierfache Leistung zeigen, wenn ihnen eine Transferrate von 1 TByte/s zur Verfügung stünde, erklärte Nvidias General Manager Sumit Gupta und unterstrich damit die Bedeutung einer schnellen Speicheranbindung. Doch die sei nicht der einzige Vorteil von Stacked DRAM, vielmehr ließen sich durch die Integrationsmethode auch wesentlich höhere Speicherkapazitäten erreichen. „Es wird viel mehr sein, als sich Leute heute vorstellen können“, so Gupta, der allerdings keine genauen Werte nennen wollte. Zur Wahrheit gehört aber auch, dass Stacked DRAM die Kühlung von High-End-GPUs erschwert.

Volta soll aber nicht nur Stacked DRAM und eine höhere Zahl an Ausführungseinheiten bieten, sondern auch Nvidias erste Desktop-GPU mit integrierten ARM-Kernen werden, die GPUs noch autonomer als bisher machen sollen. Bislang ging man davon aus, dass dies schon beim 2014 erwarteten Kepler-Nachfolger Maxwell der Fall sein soll, der Unified Virtual Memory mitbringt und eine Effizienz von 16 GFlops pro Watt bei doppelter Genauigkeit bietet. Volta schafft laut Nvidia bis zu 32 GFlops pro Watt.

Vom Dann ins Jetzt

Video: Nvidia präsentierte die Technikdemo Face Works als weiteren Schritt hin zur Echtzeitdarstellung des menschlichen Gesichts. (Quelle: Nvidia)

Anhand der Techdemos Wave Works und Face Works zeigte Nvidia, was auf aktueller Hardware bereits möglich ist und gab gleichfalls einen Vorgeschmack darauf, mit welcher grafischen Qualität PC-Spiele in den kommenden Jahren aufwarten. Die Kinnladenklapper liefen auf der seit Februar für 950 Euro erhältlichen High-End-Grafikkarte GeForce GTX Titan – die bis dato schnellste Single-GPU-Karte. Auf ihr steckt ein GK110-Grafikchip, der aus 7,1 Milliarden Transistoren besteht und 2688 Shader-Kerne bietet.

Video: Echtzeit-Ozeansimulation Wave Works (Quelle: Nvidia)

Wave Works simuliert Wellenbewegungen in Abhängigkeit von der Beaufortskala, die Winde nach ihrer Geschwindigkeit einteilt. Mit zunehmender Windstärke schaukelt das in der Techdemo dargestellte Schiff mehr und mehr. 20 000 Abtastpunkte umgeben dessen Hülle und ermitteln den Wasserdruck an den jeweiligen Stellen. Dieser wird vom Physiksimulator verarbeitet, der neben den Schiffs- auch die Wellenbewegungen und unter anderem den entstehenden Schaum berechnet.

Eine der schwierigsten Aufgaben in der Computergrafik ist die realistische Echtzeitsimulation eines menschlichen Gesichts. Hier sei man mit Face Works einen bedeutenden Schritt weiter gekommen, erklärte Jen-Hsun Huang. Der in Zusammenarbeit mit dem Institute of Creative Technologies der University of Southern California entstandenen Techdemo liegen 32 GByte Daten zugrunde, die durch effiziente Komprimier- und Rechenverfahren auf 400 MByte eingedampft wurden und damit in Echtzeit visualisierbar sind. Allein zur Berechnung eines Pixels sind 40 000 Rechenoperationen nötig; bei einer Bildrate von 60 fps komme man laut Huang insgesamt auf eine geforderte GPU-Leistung von über zwei Billionen Berechnungen pro Sekunde (2 TFlops) bei 1280 × 720 Bildpunkten. Das dargestellte Gesicht reagiert sogar auf Sprachbefehle – laut Huang ließe sich eine solche Technik etwa für individualisierte Avatare bei Videokonferenzen einsetzen. Videos zu den beeindruckenden Techdemos finden Sie über den c’t-Link am Ende des Artikels.

Virtuell und schnell

Für die 3D-Remote-Virtualisierung, etwa gestreamtes Rendering, hat Nvidia zwei 4U-Serversysteme unter der Bezeichnung GRID VCA für Mai zunächst für den US-Markt angekündigt. Die Server übertragen mit Hilfe spezieller Software ihre Framebuffer-Inhalte pixelgenau an virtuelle Maschinen. Die Basis-Version kostet 25 000 US-Dollar und bietet 8 Kepler-GPUs mit jeweils 4 GByte Grafikspeicher sowie 192 GByte RAM. Sie bedient bis zu acht Nutzer gleichzeitig, die Max-Version sechzehn. Letztere kostet knapp 40 000 US-Dollar und hat 16 GPUs und 384 GByte Arbeitsspeicher.

Für die erforderlichen Software-Lizenzen verlangt Nvidia eine Jahresgebühr von 2400 US-Dollar beziehungsweise 4800 US-Dollar (Max-Variante). Nvidia hat mit den Systemen vor allem die Bereiche Automobildesign und Konstruktion im Blick und zeigte während der GTC auch einige Beispiele, etwa hochdetaillierte Automodelle, die auf Tablets ohne sichtbare Verzögerung interaktiv dargestellt wurden.

Schöne Aussichten

Doch nicht nur Nvidia konnte während der Hausmesse mit spannenden Informationen aufwarten, sondern auch Valve. Die Firma aus Bellevue bei Seattle hat zwar mit GPUs selbst nicht viel am Hut, gilt aber mit seinen populären Source-Engine-Spielen und der Distributionsplattform Steam als eine der wichtigsten Kräfte der Spieleindustrie. Derzeit sind die Entwickler unter anderem damit beschäftigt, einige ihrer Source-Engine-Spiele auf Linux zu portieren. Schließlich wollen die US-Amerikaner noch in diesem Jahr einen Linux-PC als Spielekonsole (Steam Box) herausbringen. Doch Valve erklärte auf der GTC, dass man die Portierung auf Linux als einen Zwischenschritt hin zum Smartphone- und Tablet-Betriebssystem Android sehe – und damit als Sprungbrett zur Erschließung des Smartphone- und Tablet-Marktes. Läuft ein Spiel erst einmal unter Linux, sei die Anpassung auf Android relativ einfach.

Dabei plauderte die Firma auch aus dem Nähkästchen: So sei unter Linux – vorausgesetzt die Grafiktreiber stimmen – sogar eine höhere Performance als unter Windows erreichbar. Dabei kommt es der Firma auf die proprietären Herstellertreiber an. Hier knirscht es aber laut Valve noch gewaltig, besonders hinsichtlich der AMD-Treiber. Deren Performance habe sich zwar innerhalb der letzten drei Monate verbessert, sei aber noch nicht auf dem Niveau von Nvidia angekommen. Überdies nerven Bugs, die zu plötzlichen Abstürzen führen, selbst die HDMI-Sound-Ausgabe laufe mit den AMD-Treibern noch nicht fehlerfrei, wie Valve im Gespräch mit c’t erklärte. Daher empfiehlt die Firma derzeit für den Linux-Betrieb von Steam und Source-Engine-Spielen noch Nvidia-Hardware – dies könnte sich aber im Laufe des Jahres ändern.

Doch nicht nur Linux an sich steht für Valve im Vordergrund, sondern auch die offene 3D-Schnittstelle OpenGL. Sie unterstützt in der neuesten Version 4.3 ebenfalls alle unter DirectX gebotenen Schmankerl wie Tessellation oder GPU Compute, funktioniert aber plattformunabhängig. Das ist laut Valve besonders im Hinblick auf den chinesischen Markt wichtig, wo viele Nutzer trotz moderner GPUs noch das Uralt-Betriebssystem Windows XP im Einsatz hätten, das keine DirectX-10- oder DirectX-11-Effekte zulässt. (mfi)

Artikel kostenlos herunterladen

weiterführende Links

Anzeige