AMD bläst zum Angriff auf die letzte Intel-/Nvidia-Bastion, den rund 29 Milliarden US-Dollar schweren Datacenter-Markt. Kritisch dafür ist die 7-Nanometer-Fertigung der Chipschmiede TSMC, die sowohl für die kommenden Zen-2-CPU-Kerne als auch für die Radeon-GPUs zum Einsatz kommt.

Die Zen2-Architektur hat AMD deutlich aufgebohrt und will bei Einsatz der Vektoreinheiten nun den doppelten Durchsatz pro Takt gegenüber Zen/Zen+ erreichen. Dazu verfügen die auch für AVX/AVX2-Berechnungen genutzten Vektor-Einheiten nun über 256 Bit breite Datenpfade und entsprechend erweiterte Rechenwerke. Auch an anderen Teilen der Pipeline hat AMD Feintuning vorgenommen und verspricht, dass der hohe Durchsatz für alle Betriebsarten erhalten bleibt. Instruction-Cache sowie der Mikro-Op-Cache wurden ebenfalls verbessert, sprich vergrößert. Und natürlich darf auch die immer wieder gern zitierte und verbesserte Sprungvorhersage nicht fehlen.

7-nm-Chiplets und I/O-Chips

Für Epyc setzt AMD auf ein asymmetrisches Design mit dediziertem I/O-Chip und Chiplets genannten Satelliten-Dies. Dadurch wird sowohl eine Optimierung des Designprozesses möglich als auch eine Risikominimierung. Denn nur die Chiplets, welche die eigentlichen Zen2-Rechenwerke enthalten, werden in 7 nm gefertigt und via Infinity Fabric an den zentralen I/O-Chip angebunden. Der wird weiterhin im 14-nm-Prozess gefertigt. In ihn werden auch die analogen Treiberstufen ausgelagert, die nur schlecht mit kleineren Fertigungsprozessen skalieren. Zugleich kann der I/O-Chip auch dazu beitragen, das Wafer-Agreement mit den aus der 7-nm-Fertigung ausgestiegenen Global Foundries zu erfüllen.

AMDs Chiplet-Design im Blockschema (Bild: heise/Carsten Spille)

Für einen 64-Kern-Epyc müssen also acht Chiplets mit jeweils acht Kernen verbunden werden.

Wie viele und welche I/O-Fähigkeiten in den Chiplets verbleiben, ist unklar. Am besten ließen sich diese optimieren, wenn ganz auf I/O-Schaltkreise verzichtet würde und die Chiplets als reine Compute-Module ausgelegt würden. Allerdings müssten dann auch einfache und vor allem preissensitive Desktop-Prozessoren als Multi-Chip-Träger mit einem (möglicherweise einfacheren) I/O-Chip hergestellt werden.

[Update 07.11.2018 08:05: Außerdem wird die kommende Zen-2-Architektur als erste x86-CPU Beschleuniger-, Grafik- und Storage-Karten per PCI-Express 4.0 anbinden, welches die Transferrate gegenüber PCI-Express 3.0 verdoppelt.]

Rome: auf- und abwärtskompatible Plattform

AMD kündigte überdies an, dass Rome-basierte Epyc-Prozessoren Drop-in-kompatibel mit bestehenden Naples-Plattformen aus der ersten Epyc-Generation sind und zudem auch der Nachfolger Milan in derselben Plattform laufen wird. BIOS-Updates dürften allerdings nötig sein. [Update: In einer der auf die Vorstellung folgenden Sessions präzisierte AMD die Angaben. Epyc-CPUs der Zen-2-Generation seien prinzipiell in bestehenden Naples-Systemen lauffähig, einige der Neuerungen würden spezielle Unterstützung benötigen und daher nicht in Altsystemen laufen. Wahrscheinlich bezog man sich dabei unter anderem auf PCI-Express 4.0]

Der Schlüssel: 7-nm-Fertigung

Die 7-nm-Fertigung der Chipschmiede TSMC ermöglicht neben einer doppelt so hohen Transistordichte im Vergleich zum vorigen 12/14-nm-FinFET-Prozess auch ein Viertel mehr Leistung, sprich Takt bei gleicher Leistungsaufnahme oder eine halbierte Leistungsaufnahme bei gleicher Performance. Je nach Produktanforderungen lassen sich diese Eckpfeiler kombinieren – alle drei auf einmal sind nicht möglich, speziell die höhere Taktrate und die gesenkte Leistungsaufnahme. Wohl aber die verdoppelte Transistordichte, was zu kleineren Chips führt, die sich dann auf dem Trägersubstrat kombinieren lassen.

7-nm-Fertigung im Vergleich (Bild: heise/Carsten Spille)

AMD bekräftigte auf der Next-Horizon-Veranstaltung, auf der auch Analysten vor Ort waren, mehrfach, dass man voll im Plan mit der Fertigung liege und erste Zen2-Prozessoren bereits als Muster zur Verfügung stelle. Auch die ebenfalls angekündigte 7-nm-Radeon-GPU auf der Machine-Learning-Karte MI60 sei bereits fertig und die MI60 soll sogar noch im vierten Quartal 2018 auf den Markt kommen.

[Update 07.11.2018 08:05]:

Performance im Vergleich

Einige Stunden nach der Vorstellung gab es in einer eigenen Session noch ein paar genauere Leistungswerte. AMD ließ ein Zen-2-System mit einem 64-Core-Epyc gegen je ein Zwei-Sockel-System von Intel und eines aus der ersten Epyc-Generation antreteten. Aufgabe war der unter Linux laufende Rendering-Benchmark C-Ray. Das System mit "Rome"-Epyc kam dabei nach 27,7 Sekunden als erstes ins Ziel, gefolgt von den beiden Epyc 7601 mit 28,5 Sekunden. Schlusslicht bildeten die beiden Xeon Platinum 8180M, die mit ihren insgesamt 56 Kernen 30,5 Sekunden brauchten.

AMD Zen 2 im C-Ray-Benchmark gegen Zweisockel-System von Intel und aus der Vorgängergeneration. (Bild: heise/Carsten Spille)

(csp)