Prozessorgeflüster

Von großen Brüdern und starken Kindern

Trends & News | Prozessorgeflüster

Intel bringt neue Xeon-Prozessoren, Nvidia stellt Kepler 2 vor und AMD lässt Trinity vom Stapel – und verliert seinen Bulldozer-Chefentwickler.

Die neuen Xeon-E5-Familien (mehr zu den ersten Systemen auf S. 22) sollen insbesondere preiswerte Server mit AVX und PCI Express 3.0 ermöglichen. Das gilt insbesondere für die E5-2400-Linie, die technisch allerdings nicht so spannend ist, sondern nur eine Sparversion der bereits im März erschienenen E5-2600-Linie darstellt. Sie beschränkt sich auf drei statt vier Speicherkanäle sowie einen statt zwei QPI-Links. So vereinfacht und verbilligt sie das Systemdesign durch einen kleineren Sockel (LGA1356).

Arg viel günstiger als die großen Brüder sind die 2400er allerdings nicht. Der preiswerteste Vertreter, der E5-2403 mit 4 Kernen, 1,8 GHz Nominalfrequenz und QPI mit 6,4 GT/s kostet 188 US-Dollar, sein E5-2603-Bruder gerade mal 10 Dollar mehr. Immerhin ist der E5-2403 um einen Dollar billiger als der preiswerteste der ebenfalls neu vorgestellten E3-V1200v2-Familie. Bei der handelt es sich um Single-Prozessor-Xeons in der kürzlich eingeführten Ivy-Bridge-Architektur. Diese sollte dank 22-nm-Prozess auch etwas weniger Energie verbrauchen. Ein abgespeckter Server mit Xeon E3-1265Lv2 kommt laut Intel auf einen SPECPower-Wert von 4291 ssj_ops/Watt, was nach Intels internen Tests um 39 Prozent besser sein soll als beim Vorgänger Xeon E3-1260L. Aber da hätte Intel wohl mal bei den Spezialisten von Fujitsu in die Lehre gehen sollen – die zauberten bereits 4697 ssj_ops/Watt aus ihrem E3-1260L-Server.

Die deutlich verbesserte Prozessorgrafik des Ivy Bridge ist nur bei einer der sechs neuen Versionen freigeschaltet, dem E3-1265v2, gedacht für Einstiegsworkstations. Hoffentlich funktioniert überhaupt der schnelle Zufallsgenerator mit Codenamen Bull Mountain auch bei abgeschalteter Prozessorgrafik. Er befindet sich nämlich außerhalb der Kerne im sogenannten Uncore-Bereich – ähnlich wie der Quick-Sync-Encoder, und der arbeitet eben nur bei aktiver Prozessorgrafik.

Hier und da wird für einen Server auch eine der anderen Architektur-Neuerungen nützlich sein, etwa das Float16-Datenformat, die schnelleren Stringbefehle und der erhöhte Schutz durch Supervisory Mode Execution Protection (SMEP).

Noch größeres Interesse dürfte jedoch die E5-4600-Familie für Viersockel-Server wecken, auch wenn sie noch auf dem Sandy Bridge-EP beruht und mit Preisen bis hin zu 3616 US-Dollar recht kräftig zulangt. Da ist wohl ein Stück weit Schutzgeld eingerechnet, damit sie der edlen EX-Serverklasse nicht zu sehr ins Gehege kommt. Die EX-Prozessoren der E7-Linien brillieren allerdings mit zwei Kernen mehr, sowie mit vier QPI-Links pro Prozessor. Die Neulinge besitzen derer nur zwei, sodass bei vier Sockeln manche Prozessoren nicht direkt miteinander verbunden werden können, sondern über einen dazwischenliegenden Prozessor als zusätzlichen „Hop“ kommunizieren müssen. Andererseits ist bei den EX-Versionen der maximale Takt etwas niedriger, QPI- und Speichertransfer langsamer und AVX sowie PCI Express 3.0 kennen sie ohnehin nicht.

Dank nämlichem AVX kann ein E5-4650-System mit 602 GFlops im Linpack-Benchmark unser EX-Test-System mit viermal E7-4870 recht alt aussehen lassen, das lediglich auf 352 GFlops kommt. Bei SPECjbb2005 jedoch liegt letzteres gemäß den von Cisco gemessenen Werten in Höhe von 2,77 Millionen bops weiterhin in Front, wenn auch nur knapp: Die neue Viersockel-Konkurrenz schafft 2,66 Millionen bops. Sandy-Bridge-Prozessoren mit vier QPI-Links sind nicht geplant, das soll dem Ivy Brigde vorbehalten bleiben – aber es dürfte wohl noch ein geraumes Weilchen dauern, bis Ivy Bridge-EX auftaucht.

Mit 7 Milliarden Transistoren

Bis dahin dürfte Nvidia den heiß erwarteten Kepler-2-Chip wohl längst herausgebracht haben, jenen gigantischen Chip mit 7 Milliarden Transistoren und geschätzt irgendwo zwischen 2500 und 3000 Rechenkernen. Bevor ihn Nvidia-Chef Jen-Hsun Huang auf der hauseigenen Entwickler-Konferenz GTC Mitte Mai in San José vorstellen konnte, musste er zunächst einmal die nicht so tollen Quartalszahlen begründen. Der Umsatz ging gegenüber dem Vorjahresquartal um 38 Millionen US-Dollar auf 924 Millionen zurück, der Gewinn brach von 135 Millionen auf 60 Millionen Dollar ein.

Das spannende Kepler-Seminar begann leider erst kurz nach unserem Redaktionsschluss. Hierin berichtet Senior Architect Lars Nyland zusammen mit dem CUDA-Spezialisten Stephen Jones über die architektonischen Feinheiten von Kepler 2, etwa über die neuen Instruktionen und Rechenfähigkeiten sowie über das komplett überarbeitete Speichersystem, das eine Linpack-Effizienz von über 90 Prozent gewährleisten leisten soll.

Ein anderes Topic ist die Verschmelzung von Tegra mit CUDA-tauglichem Grafikkern unter dem Projektnamen Denver. Die Entwicklerplattform Carma mit Tegra 3 und (noch) externer Quadro-1000M-GPU soll nun versandfertig sein. Dafür will Nvidia vor allem auch auf der ISC12 in Hamburg kräftig die Werbetrommel schlagen.

Prozessor und GPU unter einem (APU-)Hut, das hat AMD schon lange. Nun ließ die Firma endlich den Trinity vom Stapel (S. 90). Seine Grafikleistung ist ganz ordentlich („outstanding“ in AMD-Marketing-Sprache), aber die Rechenperformance der gelifteten Bulldozer-Kerne reißt uns nicht so vom Sockel – da liegt Konkurrent Ivy Bridge doch in anderen Regionen. Okay, bei entsprechenden Preisen unterhalb der recht teuren Intel-Ultrabooks dürfte Trinity seinen Markt bei den Notebooks finden. Ob er allerdings das große Zugpferd schlechthin wird, wie es AMDs eloquente Produktchefin Lisa Su voraussagt, sei dahingestellt.

Daneben musste AMD einen weiteren großen Verlust beklagen. AMD Fellow und Chefarchitekt Chuck Moore ist Ende April im Alter von nur 51 Jahren gestorben – an Bauchspeicheldrüsenkrebs, so wie Steve Jobs auch. Chuck Moore – nicht zu verwechseln mit dem gleichnamigen Forth-Erfinder – war in der Prozessorszene bekannt und beliebt. Viele Jahre lang wurden bei IBM unter seiner Mitwirkung beziehungsweise Leitung diverse PowerPC- (ab PPC601) und Power-Prozessoren (Power 1, 2 und 4) designt. Im Jahre 2000 stellte er den Power 4 auf dem Microprocessor Forum in San José vor – da haben wir uns auch das erste Mal getroffen. Zu dem Zeitpunkt war Moore schon an den frühen Konzepten für Power 6 und Cell-Prozessor beteiligt, verließ dann aber bald IBM und kam geraume Zeit später zu AMD, wo er zusammen mit Mike Butler für das Design der Bulldozer-Kerne verantwortlich zeichnete.

Bleibt zu hoffen, dass sein letztes Kind Bulldozer nicht unter die Räder kommt, sondern auch ohne ihn zu einer starken Dampfwalze (Steamroller) heranreift. (as)

Artikel kostenlos herunterladen

Anzeige