Mit dem neuen Server-Prozessor Epyc mit Zen-Architektur will AMD dem nahezu alleinigen Marktbeherrscher Intel etliche Marktanteile abknapsen: Erste Benchmark-Werte, etwa CPU2006, lassen aufhorchen.

Zwar zur, aber nicht auf der Internationalen Supercomputer Conference (ISC 2017) in Frankfurt, sondern in Austin/Texas hat AMD heute mit einem großen Festakt den Wiedereinstieg in den Servermarkt gefeiert.

Mit Epyc hat man nun einen Prozessor, der bis zu viermal so leistungsfähig ist wie der letzte Opteron 6386 SE vor fünf Jahren. Vor allem soll Epyc bei den allermeisten Server-Workloads mindestens konkurrenzfähig zum Xeon des absoluten Marktbeherrschers Intel sein.

So sehen das auch die zahlreichen erstrangigen Partner, die sich dringend eine Alternative zu Intel wünschen: Server-Hersteller wie HPE, Dell/EMC, Microsoft, Supermicro, Asus, Tyan …

Epyc-Palette

Epyc kommt mit 8, 16, 24 und 32 Kernen und Multi-Threading. Alle besitzen vier Dies mit maximal acht freigeschalteten Kernen, die auf einem Multichip-Modul (MCM) sitzen. Somit stellen alle Epycs immer die volle Anzahl von acht Speicherkanälen und 128 PCIe-Lanes zur Verfügung – und zwar auch mit voller Performance und nicht bei kleineren Chips herabgestuft wie bei Intel.

Die Prozessoren laufen in Zwei- und Einsockelsystemen; für letztere gibt es auch drei etwas billigere "P"-Varianten. Single-Socket-Server kommen bei Cloud-Dienstleistern und Web-Hostern immer mehr in Mode. Insbesondere für Storage bietet sich die 1P-Ausführungen mit ihren 128 PCIe-Lanes an.

Auch als Gastsystem für bis zu acht GPU-Karten mit je 16 PCIe-3.0-Lanes ist Epyc geeignete Wahl. Es ist ohnehin die Idee von AMD, dass für rechenintensive Aufgaben eine oder mehrere GPU-Karten wie Radeon Instinct (oder andere (FPGA-)Beschleuniger) besser geeignet sind als aufwendiges AVX512 im Prozessorkern. Stattdessen verwendet man den kostbaren Die-Platz lieber für mehr Kerne.

Mit nur 128-bittigen AVX-Einheiten, die paarweise auch AVX2-Code bewältigen, ist daher die nackte Linpack-Leistung im Vergleich zu Intel-Prozessoren um einiges niedriger. Bei den meisten üblichen Workloads aber hängt man Intels aktuelles 2P-Flaggschiff Xeon E5-2699Av4 (Broadwell-EP) locker ab.

Dieser bislang leistungsfähigste 2P-Xeon hatt 22 Kerne (44 Threads) und vier Speicherkanäle, als Paar also 44 Kerne/88 Threads, acht DDR4-Kanäle und 88 PCIe-Lanes. Ein Epyc-Tandem hat bis zu 64 Kerne, 128 Threads, 16 DDR4-Kanäle und 128 PCIe-Lanes.

Linpack, Stream ...

Von der hohen Epyc-Performance konnte sich heise online bei einem Besuch im texanischen AMD-Hauptquartier in Austin überzeugen und dort im Labor auch eigene Programme und Benchmarks laufen lassen.



Unser Testsystem mit zweimal Epyc-7601

Bild: Andreas Stiller Beim Speicherbenchmark Stream auf einem 2P-System mit Epyc 7601 liegt die Transferrate mit gemessenen 247 GByte/s (Triad) bei gut dem doppelten Wert des Systems mit zwei Xeon E5 2699Av4. Beim Linpack erzielte Epyc erwartungsgemäß weniger als der Konkurrent, mit 1050 zu 1520 GFlops kommt er auf etwa zwei Drittel. Das Testgerät lief dabei unter Ubuntu Server 16.04.

Für Cinebench R15 wurde auf Windows Server 2016 gewechselt [–] läuft auch. Der Cinebech-Wert schwankte zunächst zwischen durchaus ordentlichen 5400 bis 6000, aber AMD-Techniker werkelten noch etwas an der Konfiguration und letztlich kamen dann Werte bis 6879 heraus, etwa 1300 mehr als beim Xeon E5-2699Av4.

... und SPEC CPU2006

Mit der Rückkehr zum Servermark kümmert sich AMD auch wieder intensiv um die System Evaluation Performance Corporation (SPEC). Besonders spannend waren somit die SPEC CPU2006-Ergebnisse, die ein Sammelsurium realer Workloads abbilden, insbesondere bei SPECint.

Für einen 1:1-Vergleich mit Intel ist ein Basic Run mit gcc 6.3 nur mit -O2 ohne Architektur- oder Tuning-Flags und ohne spezielle Bibliotheken wie Smartheap sinnvoll. Da liegt Epyc 7601 um etwa 40 Prozent (SPECint) oder 60 Prozent (SPECfp) gegenüber dem Xeon E5 2699Av4 in Front.

Ähnlich sieht das beim (deutlich schnelleren) Code der speziell optimierten Compiler von Intel (icc) und AMD (Open64) aus, wobei der alte Open64-Compiler nur Bulldozer kennt, aber keinen Zen. Dennoch bleibt der Vorsprung auch in der optimierten Form mit weit schnellerem Code in etwa in gleicher Größenordnung. Die mit Open64 4.5.1 gemessenen Werte hat AMD auch bei SPEC offiziell eingereicht.



AMD Epyc SPEC CPU2006: SPECint, SPECfp

Open64 wird aber nicht mehr gepflegt. Für die Zukunft setzt AMD vor allem auf den neuen AMD Optimizing C/C++ Compiler (AOCC), der auf LLVM beruht. Die neue, heute nach elf Jahren mühsamer Arbeit auf der ISC herausgekommene Suite SPEC CPU2017 soll damit gut performen, da kann man gespannt sein.

Konter

Intel wird allerdings mit der Scalable Xeon Family Skylake-SP in Kürze kontern und zumindest das Flaggschiff mit 28 Kernen und sechs Speicherkanälen dürfte in vielen Benchmarks wieder vorbeiziehen.

Aber der bei weitem größte Markt dürfte etwa beim Xeon Gold 6148 mit 20 Kernen liegen, so wie er jetzt schon bei zwei Großsystemen in der Top500-Liste zu finden ist. Und dieser wird sich mit etwa gleichwertigen Epyc-Prozessoren messen müssen. Es ist dann nicht zuletzt eine Frage des Preises und aus HPE- und Dell-Kreisen hört man von 10 bis 20 Prozent Preisvorteil bei gleicher Performance für Epyc.

AMD hat bereits die zweite Epyc-Generation "Rome" mit verbesserter Zen-2-Architektur in der Mache; sie soll mit 7-nm-Transistoren produziert werden. Rome soll in dieselben LGA4094-Fassungen (Socket SP3) passen wie der erste Epyc "Naples".

AMD Epyc (Naples) für Server mit 1 oder 2 CPU-Fassungen (LGA4094/SP3) Prozessor Kerne/

Threads Taktfrequenz

Basis/Boost TDP

(Watt) Preisregion

(US-$) Epyc 7601 32/64 2,2 / 3,2 GHz 180 W > 4000 US-$ Epyc 7551 32/64 2,0 / 3,0 GHz 180 W > 3200 US-$ Epyc 7551P 32/64 2,0 / 3,0 GHz 180 W k.A. Epyc 7501 32/64 2,0 / 3,0 GHz 180 W k.A. Epyc 7451 24/48 2,3 / 3,2 GHz 180 W > 2400 US-$ Epyc 7401 24/48 2,0 / 3,0 GHz 155 / 170 W > 1700 US-$ Epyc 7401P 24/48 2,0 / 3,0 GHz 155 / 170 W k.A. Epyc 7351 16/32 2,4 / 2,9 GHz 155 / 170 W > 1100 US-$ Epyc 7351P 16/32 2,4 / 2,9 GHz 155 / 170 W k.A. Epyc 7301 16/32 2,2 / 2,7 GHz 155 / 170 W > 800 US-$ Epyc 7281 16/32 2,2 / 2,7 GHz 155 / 170 W > 600 US-$ Epyc 7251 8/16 2,1 / 2,9 GHz 120 W > 400 US-$

(as)