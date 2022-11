Nvidia hat nach der Einführung neuer US-Exporteinschränkungen gegen chinesische Firmen den GPU-Beschleuniger A800 speziell für China aufgelegt. Drei verschiedene Ausführungen entsprechen beinahe eins zu eins der bisherigen A100, lediglich den Nvlink-Interconnect bremst Nvidia um 33 Prozent: Mehrere A800-Karten kommunizieren mit einer Übertragungsrate von 400 GByte/s untereinander und nicht wie bisher mit 600 GByte/s. Diese Einschränkung erfordert keine neuen Chips.

Die A800-Karten listete vorübergehend der chinesische Serveranbieter Omnisky – archiviert ist die Seite noch aufrufbar. Gegenüber der Nachrichtenagentur Reuters bestätigte Nvidia die Neuauflage: "Die Nvidia-A800-GPU, die im dritten Quartal in Produktion gegangen ist, ist ein weiteres Alternativprodukt zur Nvidia-A100-GPU für Kunden in China. Die A800 erfüllt den Freigabetest der US-Regierung für eine reduzierte Exportkontrolle und kann nicht so programmiert werden, dass sie [die Limitierung] überschreitet", sagte ein Nvidia-Sprecher.

Spezifikationen der A800-Beschleuniger, die es wie die A100 in mehreren Ausführungen gibt: als PCIe-Steckkarte mit 40 oder 80 GByte HBM2-Speicher oder als SXM-Modul mit 80 GByte RAM. Lediglich die Nvlink-Geschwindigkeit ist von 600 auf 400 GByte/s gedrosselt. (Bild: Nvidia / Omnisky)

Blick auf die genauen Bestimmungen

Nvidia (und auch AMD im Falle von Instinct-Beschleunigern) betrifft insbesondere der Punkt 3A090.a der neuen Exportbeschränkungen, die das US-Wirtschaftsministerium (Department of Commerce) in einem juristischen Dokument definiert:

"Integrierte Schaltungen, die eine aggregierte bidirektionale Übertragungsrate über alle Ein- und Ausgänge von 600 GByte/s oder mehr zu oder von integrierten Schaltungen – ausgenommen flüchtige Speicher – haben oder programmierbar sind, und eine der folgenden Eigenschaften aufweisen", dürfen nicht nach China verkauft werden.

Zu den angeführten Eigenschäften zählt: Das Produkt aus der Bit-Länge eines beliebigen Datenformats multipliziert mit der Rechenleistung (in Tera-Operationen pro Sekunde, TOPS) darf den Wert 4800 nicht überschreiten. Im Falle von GPUs ist das für KI-Formate wie 8-bittige Integer-Operationen (INT8) relevant, bei denen die A100 bis zu 1248 INT8-TOPS schafft – das entspräche einem Wert von 9984. Die Nachfolgerin H100 ist nochmals deutlich schneller und verwendet einen Nvlink mit bis zu 900 statt 600 GByte/s.

Übliches Vorgehen bei Exporteinschränkungen

Wahlweise mit einer Reduzierung der Taktfrequenz beim Nvlink oder mit einer Teildeaktivierung der Links ist die hohe Rechenleistung für den Export nicht mehr relevant. Alternativ dürfte Nvidia nur noch Beschleuniger mit stark reduzierter Rechenleistung nach China verkaufen. Ein langsamerer Interconnect ist für Server und Rechenzentren jedoch das kleinere Übel – insbesondere Berechnungen großer 3D- oder KI-Modelle in GPU-Clustern dürften somit nicht mehr ganz so schnell laufen.

Eine derartige Umgehung von Exporteinschränkungen ist derweil branchen- und länderübergreifend ein völlig übliches Vorgehen. Sollte die US-Regierung etwas dagegen haben, müssen die Vorgaben weiter angepasst werden.

