"Big Island": China testet ersten eigenen GPU-Beschleuniger mit 7-nm-Technik

Shanghai Tianshu Zhixin Semiconductor will eine Alternative zu AMDs und Nvidias GPU-Beschleunigern fürs Machine Learning anbieten.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 15 Beiträge

(Bild: Shanghai Tianshu Zhixin Semiconductor)

Von
  • Mark Mantel

Auf dem Weg zu einer unabhängigen Halbleiterindustrie ist China ein weiterer Schritt gelungen: Shanghai Tianshu Zhixin Semiconductor hat laut eigenen Angaben einen vollständig heimisch entwickelten GPU-Beschleuniger entworfen, von dem erste Testchips in den Laboren laufen. Gedacht ist er ähnlich wie Nvidias Ampere-GPU A100 für Rechenzentren mit einem Fokus auf Machine Learning, und zwar zum Training von KI-Algorithmen.

Der eigentliche GPU-Beschleuniger von Shanghai Tianshu Zhixin Semiconductor gehört zur Familie "Big Island" und umfasst 24 Milliarden Transistoren, gepaart mit vier Speicherstapeln High-Bandwidth Memory (HBM, vermutlich HBM2 oder HBM2e). Das Unternehmen setzt auf einen Fertigungsprozess mit Strukturbreiten von 7 Nanometern – das Packaging-Verfahren "2,5D-CoWoS" spricht für Auftragsarbeit von TSMC.

China kann offenbar eigene GPUs mit KI-Fokus entwerfen, diese aber noch nicht mit moderner Belichtungstechnik selbst produzieren. Der chinesische Chipauftragsfertiger SMIC fertigt derzeit kleine Mengen mit 14-nm-Strukturen.

Auf dem Papier kann sich der vorgestellte GPU-Beschleuniger mit 147 FP16-TeraFlops für ein Erstlingswerk durchaus sehen lassen. "Big Island" kann zudem mit den Integer-Formaten INT8, INT16 und INT32 sowie Bfloat16 und FP32 umgehen. Zum Vergleich: Nvidias A100-Karte schafft 78 FP16-TFlops über die Shader-Kerne und 312 FP16-TFlops mithilfe der integrierten Tensor-Cores (624 mit Sparsity, das Nullen aus den Matrizen entfernt). AMDs Instinct MI100 erreicht rund 185 FP16-TFlops.

Lesen Sie auch

Die Hardware ist allerdings nur die halbe Miete – viel Arbeit beanspruchen auch die Treiber, insbesondere bei GPUs. Im Falle von Machine Learning ist zudem der Software-Stack wichtig, wo Nvidia und Co. jahrelange Erfahrung aufweisen.

Huawei hat mit dem Ascend 910 bereits einen eigenen KI-Beschleuniger vorgestellt, allerdings in Form eines Prozessors ohne Grafikeinheit, was die Entwicklung vereinfacht. Vor dem Handelskrieg zwischen China und USA hat Huawei den Chip bei TSMC mit 7-nm-Technik fertigen lassen; inzwischen musste der Hersteller die Produktion einstellen. Alibaba wiederum hat den eigenen 12-Nanometer-KI-Chip Huanguang 800 für die Alibaba-Cloud vorgestellt; dabei handelt es sich aber um einen KI-Inferencing-Prozessor.

(mma)