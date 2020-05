Lange hat AMD sich Zeit gelassen, um seinen rechenstärksten Grafikchip Vega 20 nach ML-Beschleunigern und Gaming-Grafikkarten auch auf einer Workstation-Grafikkarte anzubieten. Ab Mitte Juni 2020 soll es dann soweit sein: Die Radeon Pro VII kommt in den Handel und konkurriert preislich mit Nvidias Quadro RTX 5000, kann in manchen Belangen aber auch mit nochmals wesentlich teureren Quadro-Karten mithalten. Auf der anderen Seite lässt sie aber Spezialschaltkreise für Machine Learning (Tensor Cores) oder Raytracing vermissen, die schon in der halb so teuren Quadro RTX 4000 vorhanden sind.

AMD gibt eine Preisempfehlung von 1899 US-Dollar, wie üblich ohne Mehrwertsteuer - umgerechnet in versteuerte Euro dürften es mindestens 2100 Euro werden und damit auf dem Niveau von Nvidias Quadro RTX 5000 liegen. Je nach Anwendungsgebiet ist das ein echter Kampfpreis.

Vega 20 mit schnellem FP64

Das Rechenherz, der Grafikchip Vega 20, ist in moderner 7-Nanometer-Technik hergestellt und verfügt über 60 Compute-Units mit zusammen 3840 Shader-Rechenkernen. Mit einem Takt von rund 1700 MHz erreicht der Chip dabei einen Durchsatz von 13,5 Billionen Rechenschritten pro Sekunde in üblicher FP32-Gleitkommagenauigkeit. Damit ist sie ein wenig flotter unterwegs als Nvidias Quadro RTX 5000. Die für viele ML-Rechnungen ausreichende FP16-Genauigkeit verdoppelt den Durchsatz durch Register-Packing.

Das wahre Schmankerl aber ist die Leistung bei doppelt genauen Berechnungen (FP64). Hier fährt AMD die volle Kraft des Vega 20 aus, der bei doppelter Genauigkeit noch 6,5 FP64-TFlops schafft und hier in einer Liga mit Nvidias viermal so teurer Quadro GV100 spielt. Nvidias Quadro-RTX-Karten tragen nur alibihalber ein paar Recheneinheiten für diesen Zweck und sind bei Double-Precision-Berechnungen mit maximal 0,5 FP64-TFlops weit abgeschlagen.

Sechs Mini-DisplayPorts hat die Radeon Pro VII an der Slotblende. (Bild: AMD)

Schneller Speicher

Der lokale Grafikspeicher der Radeon Pro VII fasst 16 GByte, ist per ECC abgesichert und besteht aus vier HBM2-Stapelchips. Zusammen übertragen sie die enorme Menge von 1 TByte pro Sekunde - doppelt so schnell wie Nvidias Quadro RTX 5000. Mit der Speichermenge ist man in derselben Klasse wie die Quadro RTX 5000 und bereits für viele professionelle Anwendungen gut gerüstet. Wesentlich mehr RAM gibt es bei den Workstation- und Datacenter-Beschleunigern erst für deutlich mehr Geld. Anders als Nvidia mit den Quadro RTX 6000 und 8000 bietet AMD allerdings keine Variante seiner Radeon Pro VII mit mehr Grafikspeicher an.

Zur flotten Datenversorgung gehört auch der Anschluss ans Hostsystem mit PCI-Express 4.0. Darüber fließen pro Richtung bis zu 2 GByte pro Leitung (Lane) und damit doppelt soviel wie bei PCIe 3.0. Das kann beim 8K-Videoschnitt mit mehreren Spuren hochauflösenden Quellmaterials die Verarbeitung beschleunigen.

Infinity Fabric, Virtualisierung und mehr

Mittels Infinity Fabric (IF) lassen sich zwei Karten koppeln, sodass sie mit aggregierten 168 GByte/s auf den gemeinsamen Speicherpool zugreifen können. Das ist zwar für ein Multi-GPU-Gespann sehr flott, verblasst aber etwas gegenüber der enormen lokalen Transferrate des HBM2. Für die passende Datenbrücke verlangt AMD vergleichsweise moderate 199 US-Dollar. Viele Profi-Anwendungen nutzen schon von Haus aus mehrere Beschleunigerkarten via OpenCL: Altairs EDEM (Discrete Elemente Modelling) etwa nutzt seit der 2018er-Version FP64 und steuert vier GPUs an, Blackmagics DaVinci Resolve nutzt für die Videobearbeitung bis zu acht Grafikchips.

Speziell auf gekoppelte IF-Verbünde optimierte Programme, die auch den vereinheitlichen Speicherpool nutzen, sind derzeit aber noch extrem selten. AMDs hauseigener Radeon Pro Renderer in der 2.0-Beta macht hier den Anfang. Passend dazu veröffentlicht AMD heute auch die neue Version 20.Q2 der Radeon Pro Software.

Gegenüber den Quadro-Karten will AMD außerdem mit den sechs Displays pro Karte punkten. In Verbindung mit einer Synchronisierungskarte wie der FirePro S400 ermöglicht das Vielschirminstallationen, sogenannte Display-Walls, die im Vergleich zu Nvidias Quadro, die vier Displays anbinden, mit weniger Karten auskommen. Zudem gibt AMD auch auf den kleinsten Radeon-Pro-Modellen die Virtualisierungsfunktionen frei, sodass gemeinsam genutzte Grafikressourcen auch für Remote-Arbeitsplätze verfügbar sind.

(csp)