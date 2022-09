Nvidia bringt seine neue Generation Spielergrafikkarten in Stellung. Am 12. Oktober kommt die zunächst schnellste Variante GeForce RTX 4090 auf den Markt. In Deutschland möchte Nvidia dafür 1949 Euro haben, verspricht für die 450-Watt-Karte im Gegenzug aber die doppelte bis vierfache Spieleleistung mit DLSS im Vergleich zur RTX 3090 Ti.

Von der GeForce RTX 4080 kommen im November zwei Versionen: Die mit 12 GByte GDDR6X-Grafikspeicher ausgestattete Version soll 1099 Euro kosten und bis zu 285 Watt schlucken, die schnellere 16-GByte-Variante kostet 1469 Euro und braucht 320 Watt. Die RTX 4080 soll laut Nvidia - je nach Version und Spieleinstellung - mit DLSS 50 bis 200 Prozent schneller als die RTX 3080 Ti sein.

Konkurrent AMD gibt passenderweise bekannt, am 3. November den Startschuss für seine kommende Radeon-Reihe zu geben. Sie basiert auf der als besonders effizient angepriesenen RDNA3-Architektur.

GeForce RTX 4090 und 4080 (16 GB) Founders Edition

Wie üblich sollen die Karten wieder von bekannten Boardpartner angeboten werden - von den Nvidia-Exklusivpartnern ist allerding EVGA kürzlich wegefallen. Von der RTX 4090 und der 4080 mit 16 GByte wird es auch die sogenannten Founders-Edition-Referenzkarten mit dicken 3-Slot-Kühlern direkt von Nvidia geben.

Der Motor hinter der hohen versprochenen Leistung heißt Ada Lovelace und ist der Codename der neuen Grafikchip-Generation. Seine 76 Milliarden Transistoren werden in TSMCs fortschrittlichem 4-Nanometer-Prozess hergestellt (TMSC N4) und arbeiten energieeffizienter als ihre Kollegen aus den RTX-3000-GPUs mit Samsungs 8-Nanometer-Technik. Außerdem erreichen sie rund 25 Prozent höhere Schaltgeschwindigkeiten; Nvidia gibt an, im Labor bereits die 3-GHz-Marke geknackt zu haben.

AD102 mit starker Rechenleistung

Die AD102-GPU schafft in der Maximalkonfiguration 90 Tera-Flops, also 90 Billionen 32-Bit-gleitkommagenaue Rechenschritte pro Sekunde. Doch bereits die fast 2000 Euro teure RTX 4090 ist abgespeckt und verfügt nicht über die maximal mögliche Anzahl Recheneinheiten, Raytracing- und Tensorkerne.

Allerdings sind ihre Eckdaten dennoch beeindruckend. Während das vorherige Flaggschiff RTX 3090 je nach Modell an der 40-TFlops-Marke knabberte, soll die RTX 4090 83 TFlops (rechnerisch 82,575) schaffen, die RTX 4080 noch knapp 49 und die RTX 4080 12 GB noch rund 40.

Dazu takten die RTX-4090-Karten ihre bis zu 16384 Shader-Rechenkernchen mit bis zu 2,52 GHz im Boost (Basistakt: 2,23 GHz) und verheizen dabei satte 450 Watt. Die kommen zum großen Teil über den neuen ATX-3.0-kompatiblen 12VHPWR-Anschluss. Wer die PCI-Express-4.0-Karten mit herkömmlichen Netzteilen betreiben will, muss auf das beiliegende Adapterkabel für zwei bis vier PCIe-8-Pin-Stecker zurückgreifen. Die vier 8-Pin-Anschlüsse bleiben optional für besseres Overclocking-Verhalten, die Regel sind drei. Die RTX 4080 12GB kommt mit zweien aus.

Technische Daten GeForceRTX 4090 GeForceRTX 4080 (16GB) GeForceRTX 4080 (12GB) Shader-Rechenkerne 16384 9728 7680 Boost-Taktung 2,52 GHz 2,51 GHz 2,61 GHz Basistaktung 2,23 GHz 2,21 GHz 2,31 GHz Rechenleistung (Boost) 82,6 TFlops 48,8 TFlops 40,1 TFlops Standard-Speicherkonfiguration 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X Breite der Speicherschnittstelle 384 Bit 256 Bit 192 Bit TDP 450 Watt 320 Watt 285 Watt Preis 1949 Euro 1469 Euro 1099 Euro

Viele Details, wie die genaue Aufteilung der Rechenkernchen, die Ausstattung mit Textureinheiten oder die Konfiguration der Raster-Endstufen blieb Nvidia einstweilen schuldig. Doch neben der gesteigerten Rohleistung hat Nvidia auch einige Technik-Tricks verraten, die die Leistung steigern sollen.

Schlaue Tricks in Hard- und Software

In der Hardware, genauer den Shader-Rechenkernen, gibt es eine neue Funktion, die die Reihenfolge der Rechenbefehle umsortieren kann, um die SIMD-Einheiten besser auszulasten und mehr Nutzen aus dem Cache zu ziehen. Der Durchsatz bei reinen Raytracing-Operationen soll durch dieses Shader Execution Reordering genannte Verfahren um 100 bis 200 Prozent steigen, Spiele-Bildraten insgesamt um rund 25 Prozent.

Die neuen Raytracing-Kerne können pro Takt doppelt soviele Strahlen auf Schnittpunkte mit dem Dreiecksgitter prüfen; dazu gibt es mit der Opacity Micromap Engine (OMM) und der Display Micro-Mesh-Engine (DMM) zwei Helferlein, um die aufwendige Bearbeitung semi-transparenter Oberflächen wie Vegetation oder Zäune zu beschleunigen. Die DMM-Engine hilft bei der Erstellung der Beschleunigungsstruktur (Bounding Volume Hierarchy, BVM) im nativen Format der RT-Kerne und kann diese dadurch deutlich kompakter gestalten, sodass weniger Speicher nötig ist.

Eine weitere wichtige Neuerung, die Nvidia der RTX-4000-Generation exklusiv gönnt, setzt zum Teil auf Software. Es handelt sich um eine Erweiterung des KI-gestützten Upscalers DLSS. Dieses kann in der dann neuen Version DLSS 3 nicht nur fehlende Pixel sondern auch komplette fehlende Bilder ersetzen. Genaue Details verrät Nvidia zurzeit nicht. Somit klingt DLSS 3 wie eine Frame-Interpolation, die zwar Szenen durch höhere Bildraten visuell beruhigen kann. Unklar bleibt wie die Eingabegenauigkeit bei schnellen Steuermanövern etwa in Rennspielen oder akuratem Zielen in Shootern davon profiiert.

Die zusätzlichen Bilder entstehen unter Zuhilfenahme des Optical Flow Accelerators, einer Funktion der neuen Tensorkerne, die zudem auch das FP8-Format des Rechenzentrumsbeschleunigers H100 Hopper beherrschen. Das erfolgt komplett auf der GPU und erlaubt so auch in CPU-limitierten Spielen höhere Bildraten. Jedoch kann auf Befehle des Nutzers weiterhin nur bei den echten, durch die Spiele-Engine erzeugten Bildern reagiert werden.

Ein Doppelherz für Content-Creators

Auch an Content-Schaffende denkt Nvidia und baut in die RTX-4000-Grafikchips gleich zwei neue Video-Encoding-Einheiten (drei bei den Nvidia RTX 6000). Diese sorgen für potenziell verdoppelten Durchsatz, doch viel wichtiger ist, dass sie nach Intels Arc-A380-GPUs die zweiten Chips auf Gamer-Grafikkarten sind, die das platz- respektive Bitraten-schonende AV1-Format beherrschen. Dieses ist zudem frei von Lizenzgebühren, was besonders Nutzer von Streaming-Diensten freut, die Ihre Videos nun mit besserer Qualität hochladen oder live streamen können.

(csp)