Menü

AMDs Serverprozessoren mit Bulldozer-Architektur legen los

Von
vorlesen Drucken Kommentare lesen 154 Beiträge

Die großen Interlagos-Prozessoren sind sockelkompatibel zum Vorgänger Magny-Cours,

Nach den FX-Desktop-Prozessoren hat AMD nun auch die Serverprozessoren mit Bulldozer-Architektur herausgebracht. Das Flaggschiff Interlagos (Opteron 6200) besteht wie Vorgänger Magny-Cours gleich aus zwei Dice, ein jedes mit vier Modulen oder acht Kernen. So bietet ein Zweisockelsystem dann 32 Kerne und passt in die alte Magny-Cours-Infrastruktur. Eine Besonderheit des neuen AMD-Prozessors ist, dass er mit der von Intel entwickelten AVX-Erweiterung aufwartet, bevor Intel selbst mit den passenden, damit bestückten Prozessoren (Sandy Bridge EP) offiziell herauskommt. Darüber hinaus bieten die Bulldozer-Prozessoren zusätzliche eigene Erweiterungen an, wobei insbesondere die Fused-Multiply-Add-Befehle mit vier Operanden (FMA4) herausragen.

In einem Zweisockelsystem von Supermicro (815-7) erreichte im c't-Labor die Matrix-Multiplikation (DGEMM) mit FMA4 in der Bibliothek ACML 5.0.0 auf zwei Mal Opteron 6276 (2,3 GHz) 222 GFlops und der Linpack 205 GFlops, beide bei Matrixgrößen von 30.000. AMD schaffte mit mehr Speicher und größeren Matrizen sogar 239 GFlops. Intels aktuelle Zweisockelserver mit Westmere-EP (Xeon 5680, 6 physische Kerne, 3,33 GHz) kommt mit der aktuellen Mathebibliothek MKL auf 144 GFlops. Auch bei SPECInt_rate2006_base und SPECfp_rate2006_base, gemessen nach dem c't-Messszenario (64-Bit-Code, keine Smartheap-Spezialbibliothek, keine großen Speicherseiten), konnte der AMD-Prozessor die Westmere-Konkurrenz um 20 bis 30 Prozent abhängen: unter Linux (Betaversion von Red Hat Enterprise Linux 6.2 mit eingespieltem L1-Alias-Patch) mit dem neuen AMD-Compiler open64 4.2.5.2 contra Intel Composer2011SP1 (Icc/Fortran 12.1) steht es im Integervergleich 454 zu 349 und bei Gleitkomma 337 zu 246.

Die Energieaufnahme des Interlagos ist zudem unter Linpack-Vollast um 60 Watt geringer als die der Intel-CPUs. Mit 502 MFlops/Watt gegenüber 311 MFlops/Watt spricht dann die Linpack-Effizienz für sich. Dank C6-Schlafzustands kann sich das Interlagos-System auch im SPECPower-Benchmark (mit IBM J9-VM unter Windows) deutlich mit 1736 zu 1203 ssj_ops/Watt an die Spitze setzen.

Anders als die Desktop-Version, die überwiegend Enttäuschung hervorrief, vermochte sich also der Serverprozessor mit Bulldozer-Architektur mit den in der Serverwelt typischen Workloads gegenüber Intels Westmere-Generation gut in Szene zu setzen, was Performance, Energieeffizienz oder Preis angeht. Wenn Intel allerdings den Sandy Bridge EP mit acht Kernen, vier Speicherkanälen und AVX-Unterstützung vom Stapel lässt, werden die Karten wieder neu gemischt.

Opteron-Versionen (Preise)
Prozessor Kerne Kerntakt L3-Cache ACP TDP Preis
6204 4 3,3 GHz 16 MByte 80 W 115 W 455 US-$
6212 8 2,6 GHz 16 MByte 80 W 115 W 266 US-$
6220 8 3,0 GHz 16 MByte 80 W 115 W 523 US-$
6234 12 2,4 GHz 16 MByte 80 W 115 W 377 US-$
6238 12 2,6 GHz 16 MByte 80 W 115 W 455 US-$
6262HE 16 1,6 GHz 16 MByte 65 W 85 W 523 US-$
6272 16 2,1 GHz 16 MByte 80 W 115 W 523 US-$
6274 16 2,2 GHz 16 MByte 80 W 115 W 639 US-$
6276 16 2,3 GHz 16 MByte 80 W 115 W 788 US-$
6282SE 16 2,6 GHz 16 MByte 105 W 140 W 1019 US-$
4226 6 2,7 GHz 8 MByte 75 W 95 W 125 US-$
4228HE 6 2,8 GHz 8 MByte 50 W 65 W 255 US-$
4234 6 3,1 GHz 8 MByte 75 W 95 W 174 US-$
4238 6 3,3 GHz 8 MByte 75 W 95 W 255 US-$
4256EE 8 1,6 GHz 8 MByte 32 W 35 W 377 US-$
4274HE 8 2,5 GHz 8 MByte 50 W 65 W 377 US-$
4280 8 2,8 GHz 8 MByte 75 W 95 W 255 US-$
4284 8 3,0 GHz 8 MByte 75 W 95 W 316 US-$

(as)