Prozessorgeflüster

Von Milchstraßen und Milchmädchen

Trends & News | Prozessorgeflüster

AMD bringt erste x86-Prozessoren mit 5 GHz Takt, aber AMDs Spitzenposition bei den Supercomputern geht verloren. Intels Xeon Phi übernimmt – aber nicht in den USA, sondern in China.

Mit dem FX-9590 bietet AMD den nach eigenem Bekunden „ersten kommerziell erhältlichen 5-GHz-CPU-Prozessor“ an. Das erfreut den Enthusiasten, auch wenn es sich bei den 5 GHz nicht um den Basis-, sondern um den „Max-Turbo“-Wert handelt. Sieht man mal von dem Pleonasmus „CPU-Prozessor“ ab, so ist diese Aussage – sorry, falls dieser Ausdruck inzwischen politically incorrect sein sollte – eine Art Milchmädchenrechnung.

Zeigt sie doch, dass AMD wohl nicht über den x86-Tellerrand geschaut hat. Seit mehreren Jahren schon ackern nämlich IBM P6+ mit 5 GHz und IBM zEnterprise 196 mit 5,2 GHz. Im letzten Jahr kam dann der Sechskernchip der zEnterprise EC12 mit bis zu 5,5 GHz hinzu. Kommerziell erhältlich sind die Chips durchaus, jedenfalls, wenn man über genügend Kleingeld verfügt. Bis zu sechs solcher Chips packt IBM auf ein Multichip-Modul MCM, samt 192 MByte L4-Cache – okay, für den Preis eines komfortablen Einfamilienhauses selbst in der Münchner Gegend.

Für noch ein bisschen mehr, nämlich für 1,75 Millionen Dollar, kann eine Forschungseinrichtung stattdessen ein BlueGene/Q-Express-Rack erwerben, na ja, kein ganzes, sondern ein halb gefülltes. Das schafft dann etwa 100 TFlops. Viele vollbestückte BlueGene/Q-Racks stehen derweil im Lawrence Livermore National Lab im sonnigen Kalifornien. Die haben unter ihrem Namen Sequoia in der letzten Top500-Liste der Supercomputer mit über 16 Petaflops den zweiten Platz erreicht. Wo sie in der neuen Top500-Liste stehen, wird man am 17. Juni zur Eröffnung der internationalen Supercomputer-Konferenz ISC’13 in Leipzig erfahren – falls kein Hochwasser dazwischenkommt.

Milchstraße mit Xeon Phi

Die neue Spitzenposition dürfte diesmal wie schon vor zweieinhalb Jahren an einen chinesischen Rechner gehen. Eigentlich sollte das eine Überraschung werden, aber während es bei Intel noch unter NDA steht, hat Linpack-Schöpfer und Top500-Mitorganisator Jack Dongorra die Freude über seinen Besuch der National University of Defense Technology (NUDT) nicht verbergen können und alle Details in einem Report über den neuen Tianhe 2 bereits ausgeplaudert.

Keine Nvidia-Tesla- wie einst beim Tianhe (Milchstraße) 1A, sondern 48 000 Xeon-Phi-Karten hieven den Rechner auf fast 55 Petaflops theoretischer Spitzenleistung. Real mit Linpack sind es dann noch 30,65 Petaflops, wobei die 384 000 CPU-Kerne mit dem noch gar nicht offiziell erschienenen 12-Kerner Ivy Bridge-EP (Xeon E5-2692v2 mit 2,2 GHz) auch kräftig mithelfen.

Interessant sind ferner die von der NUDT selbst konstruierten Frontend-Prozessoren namens Galaxy FT-1500 auf Basis von SPARC v9. Die beruhen also nicht, wie in China sonst üblich, auf der MIPS-Architektur. Es sind 16-Kern-Prozessoren, die bei 1,8 GHz Takt rund 144 GFlops leisten sollen und die dabei nur 65 Watt verbrauchen.

Immerhin 4096 solcher galaktischen FT-1500 sollen im Tianhe 2 eingebaut sein, die dann allein schon mit einem halben Petaflops theoretischer Spitzenleistung aufwarten können.

Der Rechner schluckt allerdings ohne Berücksichtigung der Kühlung mächtige 17,8 MW. Damit liegt er in der Effizienz zwar nicht schlecht im Rennen, aber doch ein gutes Stück hinter dem bisherigen Spitzenreiter der Top500, dem Titan am Oak Ridge National Lab (Cray XK7 mit AMD Interlagos und Nvidia Tesla K20x) mit 2143 MFlops/Watt. In einem Handstreich hatte Intel im November letzten Jahres kurz vor der Bekanntgabe der damaligen Top500-Liste noch zwei besonders auf Energieeffizienz getrimmte kleinere Systeme mit Xeon Phi aus dem Hut gezaubert, die sogar auf bis zu 2450 MFlops/Watt kamen.

Für den Tianhe 2 kam offenbar der auf dem freien Markt derzeit noch nicht erhältliche Xeon Phi 3120P mit nur 57 freigeschalteten Kernen bei 1,1 GHz Takt zum Einsatz. Der tauchte zwischendurch auch schon in der Intel-Datenbank auf und dürfte wohl recht bald zusammen mit anderen Versionen vom Stapel laufen.

Der 3120A/P müsste dann wegen mutmaßlich höherer Ausbeute bei der Herstellung (Yield rate) um einiges preiswerter sein, als Chips mit 60 oder gar 61 Kernen – insgesamt enthält das Die derer 62.

Soweit man weiß (von cpuworld.com) hat er zudem weniger Speicher (6 GByte mit nur 384-Bit-Interface) sowie etwas langsameren Speichertakt von 2,5 GHz, dafür aber eine weit hungrigere TDP von 300 Watt. Das kommt einem verglichen mit den 225 Watt des 60-Kerners Xeon Phi 5110P ziemlich hoch vor. Wahrscheinlich ist an den halbgenauen Gerüchten über thermische Probleme des Xeon Phi was dran. Neben dem 5110P soll es jetzt beispielsweise auch einen 5110D mit 20 Watt mehr Spielraum geben.

Aber mit TDP ist das wie mit den Turbo-Modi bei Intel eh so eine Sache. Bei den auf der Computex vorgestellten Haswell-Xeons E3-1200v3 für nur einen Sockel (siehe S. 30) gab es eine ziemliche Verwirrung durch unterschiedliche Angaben in der Intel-Datenbank ARK, dem Intel Platform Brief und den Pressemeldungen. Hier die TDP 95 W als Kühllösung für die Plattform, da die TDP mit bis zu 84 W der einzelnen Prozessoren, hier die Max-Turbo-Angaben eines Kernes (ARK), da die Turbo-Angaben für alle Kerne – da muss man kein Milchmädchen sein, um dort nicht mehr durchzublicken. Und um das noch ein bisschen weiter aufzumischen, verwendet Intel bei den Low-Power-Chips inzwischen Scenario Design Power, SDP. Und auch damit ist die Milch allenfalls nur geschüttelt und nicht gerührt, denn die mit SDP ausgezeichneten neuen Atoms mit Silvermont-Architektur will Intel nun sogar unter dem Celeron- und Pentium-Namen vermarkten. Auf der Computex waren bereits erste Boards mit Celeron J1750 zu sehen. Da fragt es sich doch, ob wir bald auch mal etwa einen Itanium Z3370 mit Silvermont werden begrüßen dürfen …

Die Haswell-Xeons jedenfalls gibt es mit und ohne GPU und soweit erkennbar alle mit freigeschaltetem vPRO sowie mit Transactional Synchronization Extension (TSX), die wir am nahezu gleichwertigen Core i7-4770 (S. 114) schon mal erfolgreich erprobt haben.

Bislang beschränkt sich Intels Haswell-Angebot auf Quad-Cores. Apples neuer Einzylinder, der Mac Pro 2013 (S. 24), dürfte mit seinen zwölf angekündigten Kernen folglich ein einzelner Ivy Bridge-EP sein, also noch kein Haswell. Er muss dann zwar ohne die Power von zwei FMA-Pipelines auskommen, aber dafür mit 12 statt 4 Kernen. Und immerhin: Bei einem Einzel-Prozessor fällt die Unfähigkeit von Mac OS X, mit dem inzwischen verbreiteten Non Uniform Memory Address (NUMA) was Vernünftiges anfangen zu können, nicht ins Gewicht – allerdings könnte Apple nicht nur bei dem System-Design, sondern auch beim Betriebssystem so langsam mal über ein zeitgemäßes Update nachdenken. (as)

Artikel kostenlos herunterladen

Kommentare