c't 25/2022
S. 102
Test & Beratung
Serverprozessoren

Kern-Kraftwerk

Der AMD-Serverprozessor Epyc 9004 „Genoa“ mit 96 Zen-4-Kernen

CPU-Kerne sind durch nichts zu ersetzen, außer durch noch mehr Kerne: Nach diesem Motto hat AMD seine 400-Watt-Prozessorboliden für Server konstruiert. Sie brechen Rekorde bei Rechenleistung und Effizienz.

Von Christof Windeck

Beeindruckende 384 Threads in 192 Rechenkernen, 128 PCI-Express-5.0-Kanäle und 12 TByte DDR5-RAM, erweiterbar mit neuartigem CXL-RAM: Das sind die imposanten Eckdaten des Titanite-Servers mit zwei Epyc-9654-Prozessoren, den AMD zum Test ins c’t-Labor schickte. Und obwohl jede der beiden Epyc-CPUs der Genoa-Generation bis zu 400 Watt verheizt, machen sie einen großen Sprung bei der Energieeffizienz: Die Rechenleistung pro Watt Leistungsaufnahme steigt deutlich. Damit ist AMD gut gerüstet, um den Intel-Xeons noch größere Anteile am Servermarkt zu entreißen.

Der AMD Epyc 9004 Genoa passt in die neue Prozessorfassung SP5, die 6096 Kontaktfedern hat, um zwölf RAM-Kanäle und 128 PCIe-Lanes anzubinden.
Der AMD Epyc 9004 Genoa passt in die neue Prozessorfassung SP5, die 6096 Kontaktfedern hat, um zwölf RAM-Kanäle und 128 PCIe-Lanes anzubinden.

Eigentlich wollte Intel die Xeon Scalable Processors der vierten Generation (Xeon-SP Gen4, Sapphire Rapids) schon seit einem Jahr verkaufen, doch nun kommen sie wohl erst Anfang 2023. Daher tritt notgedrungen der Xeon Platinum 8380 (Xeon-SP Gen3, Ice Lake) mit nur 40 CPU-Kernen und veralteter 14-Nanometer-Technik gegen den brandneuen Epyc aus der 5-Nanometer-Fertigung an. AMD hat also auch Glück, dass der Neuling seinen Konkurrenten geradezu pulverisiert. Doch vor allem haben die AMD-Ingenieure ganze Arbeit geleistet: Der neue Epyc lässt Benchmark-Rekorde nur so purzeln.

Epyc-Technik

AMD wechselt mit Genoa von DDR4- auf DDR5-RAM und die neue Prozessorfassung SP5, ähnlich wie der Ryzen 7000 für Desktop-PCs nun in die AM5- statt die AM4-Fassung passt. Die bisherigen drei Epyc-Generationen 7001 (Naples), 7002 (Rome) und 7003 (Milan) waren für die Fassung SP4 mit acht DDR4-Speicherkanälen ausgelegt.

Ebenso wie im Ryzen 7000 stecken auch im Epyc 9004 CPU-Kerne aus der im Vergleich zu Zen 3 verbesserten Generation Zen 4. Aufgrund der feineren Fertigungstechnik – wie erwähnt TSMC N5 statt N7 – gibt es doppelt so große L2-Caches: 1 MByte pro Kern statt bisher 0,5 MByte. Der L3-Cache blieb bei 32 MByte pro acht Kerne, die gemeinsam in einem Core Complex Die (CCD) sitzen. An den Kernen hat AMD zahlreiche Details verbessert. Besonders wichtig für den Servereinsatz: Genau wie Intels Xeons verarbeiten Zen-4-Kerne nun sowohl AVX-512-Befehle als auch die Vector Neural Network Instructions (VNNI) und das Datenformat BFloat16 (BF16) für KI-Algorithmen.

Während die stärksten Xeons (aber nicht alle) je zwei AVX-512-Rechenwerke pro CPU-Kern haben, schaltet AMD für AVX-512 zwei AVX2-Einheiten zusammen. Bei gleicher Taktfrequenz kann ein Xeon-Kern also doppelt so viele AVX-512-Instruktionen verarbeiten wie ein Epyc-Kern. Weil die Xeons allerdings beim Verarbeiten von AVX-512-Code niedriger takten als bei sonstigem Code, ist der Vorteil nicht sonderlich groß. Außerdem haben die Epycs viel mehr Kerne.

Kommentieren