Vor allem die Eckpunkte zum riesigen TU102-Chip aus der Turing-Generation hatte Nvidia schon preisgegeben, erst bei der Vorstellung der Quadro-RTX-Karten auf der Siggraph, später beim GeForce-RTX-Event auf der Gamescom. So besteht die GPU aus 18,6 Milliarden Transistoren und enthält im Vollausbau, der in der Quadro RTX 8000 und 6000 zum Einsatz kommt, 4608 Shader-Einheiten.

Was sich seit der Pascal-Generation unter der Haube getan hat, das verrät eine Präsentation. Demnach hat Nvidia unter anderem den Streaming Multiprocessor (SM) umgebaut. Bei der Pascal-Generation besaß ein SM 128 Shader Cores, die sich um alle Arten von Berechnung kümmerten. Waren sie etwa mit einer Ganzzahlberechnung (integer, INT) ausgelastet, mussten Fließkommabefehle (floating point, FP) warten, bis wieder Ressourcen frei wurden. Um dem vorzubeugen, steckt Nvidia nun 64 INT32- und 64 FP32-Cores in jeden SM. Damit können Turing-GPUs Aufgaben mit gemischten Befehlstypen abarbeiten, ohne ins Stocken zu kommen. Nvidia spricht von concurrent execution.

Doppelt so hoher L1-Durchsatz

Die Größe des L2-Cache verdoppelt sich von 3 auf 6 MByte, und anstelle von 24 KByte L1-Cache plus 96 KByte gemeinsamem Speicher pro Load/Store-Unit werden die beiden kombiniert: entweder als 32 + 64 KByte oder umgekehrt. Das Ergebnis seien ein doppelt so hoher L1-Durchsatz sowie eine geringere Latenz bei Zugriffen auf den L1-Cache. Durch bessere Kompression in Kombination mit dem höheren Speichertakt des GDDR6-Speichers erziele eine GeForce RTX 2080 Ti gegenüber einer GTX 1080 Ti 50 Prozent mehr effektiven Speicherdurchsatz.

Interessant: Außerdem halbiert Nvidia die Anzahl der Textureinheiten pro SM auf vier. Unter dem Strich bleibt das Verhältnis von Shadern zur Textureinheiten mit 16:1 gleich. Weil zudem die Anzahl der SMs insgesamt steigt, sinkt die Texturleistung zumindest auf dem Papier nicht.

Neues vom Shading

Die Präsentation spricht auch von neuen Shading-Ansätzen. Variable Rate Shading etwa konzentriert sich speziell auf die Bereiche, die im direkten Blickfeld sind und betreibt im peripheren Sichtfeld weniger starken Aufwand, etwa bei der vorbeifliegenden Szenerie im Autorennspiel.

Texture Space Sharing hält Shading-Ergebnisse im Speicher vor, sodass sie schnell und ohne zusätzliche Arbeit erneut angewendet werden können. Multi View Rendering erweitert das von Pascal bekannte stereoskopische Rendern in einem Durchgang; nun können in einem Rutsch mehrere Blickwinkel gerendert werden.

Weitere Informationen sowie einen Test von Nvidias neuen Turing-Karten lesen Sie in einer zukünftigen Ausgabe von c't.

GeForce RTX 2070 GeForce RTX 2080 GeForce RTX 2080 Ti GeForce GTX 1080 Ti GeForce GTX 1080 GPU Turing Turing Turing GP102 GP104 Shader-Rechenkerne 2304 2944 4352 3584 2560 GPU-/Turbo-Takt 1410 / 1710 MHz 1515 / 1800 MHz 1350 / 1635 MHz 1481 / 1582 MHz 1607 / 1733 MHz Rechenleistung (SP) 7,9 TFlops 10,6 TFlops 14,2 TFlops 11,47 TFlops 8,23 TFlops Speicher 8 GByte GDDR6 8 GByte GDDR6 11 GByte GDDR6 11 GByte GDDR5X 8 GByte GDDR5X Speicher-Anbindung 256 Bit 256 Bit 352 Bit 352 Bit 256 Bit Datentransferrate 448 GByte/s 448 GByte/s 616 GByte/s 484 GByte/s 320 GByte/s TDP 175 Watt 225 Watt 260 Watt 250 Watt 180 Watt Preis ab 640 Euro 850 Euro 1260 Euro ca. 700 Euro 460 Euro

(bkr)