AMD präsentiert drei neue Rechenbeschleuniger, die für die Verarbeitung von besonders großen Datenmengen gedacht sind. Auf der Radeon Instinct MI25 sitzt sogar schon eine Vega-GPU.

AMD will in den lukrativen Markt für Machine Learning (Deep Learning/Machine Intelligence) einsteigen und stellt dafür drei neue Rechenbeschleuniger sowie die Open-Source-Library MIOpen vor. Die Rechenbeschleuniger laufen unter der Bezeichnung Radeon Instinct und sind gebaut, um große Datenmengen zu verarbeiten und auszuwerten. Sie werden ausschließlich von AMD hergestellt und sollen im ersten Halbjahr 2017 erscheinen. Eine der drei Karten nutzt bereits einen Grafikchip der kommenden Vega-Generation.

AMD bezeichnet die drei Modelle als Radeon Instinct MI6, Radeon Instinct MI8 und Radeon Instinct MI25 Vega with NCU. Die Zahlen hinter "MI" sind (ungefähr) gleichbedeutend mit der Rechenleistung in TeraFlops. MI6 und MI8 sind fürs Inferencing gedacht, MI25 dagegen fürs Trainieren neuronaler Netze.



Die Radeon Instinct MI6 (Polaris-GPU), MI8 (Fiji) und MI25 (Vega).

MI6 und MI8: Polaris und Fiji

Die passiv gekühlte Radeon MI6 setzt auf einen Polaris-10-Grafikchip, der theoretisch 5,7 TFlops bei einfacher (fp32) und halber Genauigkeit (fp16) erreicht. Die Transferrate des 16 GByte großen GDDR5-Speichers liegt bei 224 GByte/s und die Leistungsaufnahme bei maximal 150 Watt – die Karte braucht also einen Luftzug zur Kühlung, hat bloß keinen eigenen Ventilator.

Die MI8 ist besonders kompakt und nutzt einen Grafikchip der Fiji-Generation, der theroetisch bis zu 8,2 TFlops erreicht (fp16/fp32). Der HBM1-Speicher limitiert die Speichergröße auf 4 GByte, dafür liegt die Transferrate bei 512 GByte/s bei einer Leistungsaufnahme von höchstens 175 Watt. MI6 und MI8 ähneln den Consumer-Grafikkarten Radeon RX 480 und Radeon R9 Nano.



Die ROCm-Software-Plattform.

MI25: Vega-GPU und 16 GByte HBM2

Die MI25 ist die erste AMD-Rechenkarte mit Vega-Grafikchip. Im Unterschied zu den Polaris-/Fiji-Chips auf MI6 und MI8 kann die Vega-GPU doppelt so viele FP16-Operationen pro Sekunde ausführen. Daher schafft die Vega-Rechenkarte 25 Teraflops bei halber Genauigkeit (fp16) und entsprechend 12,5 TFlops bei einfacher Genauigkeit (fp32).

Durch den High-Bandwidth-Cache und -Controller inklusive Speicher soll die Datentransferrate besonders hoch ausfallen, genaue Angaben hat AMD dazu aber noch nicht gemacht. Immerhin: Der HBM2-Speicher soll 16 GByte Daten fassen. Die Leistungsaufnahme gibt AMD mit bis zu 300 Watt an. Erste Consumer-Grafikkarten mit Vega-GPU sollen im ersten Halbjahr 2017 erscheinen und mit der GeForce GTX 1080 konkurrieren.

Hardware-Virtualisierung inklusive

Alle Radeon-Instinct-Karten sollen sich für die Hardware-Virtualisierung eignen. Auf einer Karte können jeweils mehrere Sessions laufen, jede mit eigenem Speicherbereich. Die von AMD als "Multiuser GPU" ("MxGPU") bezeichnete Technik verwendet den PCI-Express-Standard SR-IOV (Single Root I/O Virtualization).

Noch im ersten Quartal 2017 will AMD seine Open-Source-Library MIOpen fertig stellen, die GPU-optimierte Implementierungen für Standard-Routinen bieten soll. AMD macht aber schon jetzt auf Folien große Performance-Versprechungen: So soll sogar eine Radeon Instinct M8 schneller rechnen als Nvidias Titan X mit Pascal-GPU – und zwar im DeepBench bei den für Deep Learning wichtigen GEMM-Berechnungen (GEneral Matrix to Matrix Multiplication). Doch diese Behauptung ist mit Vorsicht zu genießen, denn die genauen Angaben zu den Testparametern und Ergebnissen fehlen.

AMD hat bereits mehrere Server-Systeme mit Radeon-Instinct-Rechenkarten in Aussicht gestellt, etwa Supermicro SuperServer 1028GQ-TRT, Inventec K888, Falconwitch PS1816 und ein Rack von Inventec. (mfi)