Prozessorgeflüster

Von Unkorrektem und Unfairem

Trends & News | Prozessorgeflüster

Während Intel den Coprozessor Xeon Phi mit viel Tamtam auf der ISC12 vorstellte, wird der wahrscheinlich vorletzte Mohikaner der Itanium-Linie ganz stiekum herausgebracht, der Poulson. Selbst Itanium-Partner Hewlett-Packard schaut inzwischen verstärkt in die andere Richtung zu den Mikroservern.

In bewährter 32-nm-Technik und bei 2,53 GHz Takt theoretisch bis zu sechsmal schneller als sein Vorgänger: Der totgesagte Itanium dreht mit Poulson noch mal richtig auf.

Da rechnen moderne Supercomputer Trilliarden von Gleitkommaoperationen (siehe S. 68) – und es drängt sich die Frage auf, wie zuverlässig das Ergebnis überhaupt noch sein kann. Abgesehen von möglichen Soft Errors gräbt man hier tief im Dunkeln, denn die Rechnungen mit der üblichen Rechengenauigkeit in doppelter Genauigkeit von gerade mal 53 Bit für die Mantisse laufen inzwischen viel häufiger aus dem Ruder, als viele Anwender glauben. Wackelt bei den Berechnungen jeweils auch nur das letzte Bit, so kann sich das je nach Stabilität des Algorithmus schnell aufschaukeln und irgendwann völligen Unsinn ergeben. Und das gilt umso stärker, seit etwa die x86-Prozessoren nicht mehr die FPU mit ihrem internen 80-Bit-Datenformat nutzen, sondern die weit weniger präzisen SIMD-Einheiten.

Schon 1989 hat das Standardisierungskomitee IEEE ein Format für 128 Bit Gleitkomma (112 Bit Mantisse) eingeführt, das manche Compiler durchaus unterstützen, zum Teil können sie sogar automatisch Double Precision in Quad Precision uminterpretieren (Flag -r16 bei Intel Fortan). Aber damit läuft alles so furchtbar langsam – und so macht das kaum einer. Dabei hätten die Prozessorfirmen höhere Präzision oder Intervallarithmetik als Option schon längst in ihre SSE-, AVX- oder sonstigen Einheiten einbauen können – wollen sie aber offenbar nicht. Nur wenn die Finanzwelt über falsch gerundete Mikrodollars mosert, dann rührt sich was – zumindest bei IBM, wo das dezimale Gleitkommaformat seit Power 6 und z6 zum Standard gehört. Intel hat hierzu zwar leistungsfähige Bibliotheken im Angebot, aber da hätte man auch schon mal eine fixe Hardware erwartet, etwa für den neuen Itanium Poulson, wo der doch ohnehin mit vielen neuen Funktionseinheiten und Befehlen aufwarten kann.

Derweil sind die ersten Poulson-Prozessoren zwar noch nicht in freier Wildbahn, aber mit Produktbezeichnung und Takt bei den Product Change Notifications sowie in der MDDS-Datenbank von Intel aufgetaucht. Vier Produktversionen sind neben zahlreichen Testversionen unter Poulson-8 aufgelistet, als Schnellster geht der Itanium 9560 (SR0T1) mit 2,53 GHz ins Rennen – und das mit 8 Kernen und 32 MByte L3-Cache. Der bislang leistungsfähigste Itanium, der Tukwilla-9350, besaß vier Kerne bei 1,73 GHz Takt, allein das bringt schon einen Performancezuwachs von fast Faktor 3. Hinzu kommt die verdoppelte Breite von zwei auf bis zu vier gleichzeitig ausführbaren Befehlsbündeln. Der Poulson kommt damit theoretisch auf bis zu zwölf Instruktionen pro Takt – das schafft sonst keiner. Bei entsprechend optimierter Software legt Poulson damit nochmals bis zu Faktor 2 drauf.

Schubkarren zum Mond

Obwohl der Poulson auch ganz erhebliche Verbesserungen in der Energieeffizienz mitbringt, kann er in bestimmten Aufgabengebieten mit anderen Datentransportern nicht mithalten: Viele Schubkarren haben eben auch zuweilen klare Vorteile gegenüber einem schweren Lastwagen. Zu den Schubkarrenservern gehört Hewlett-Packards Pilotprojekt Moonshot, ein Konzept für hocheffiziente Mikroserver mit vielen kleinen Rechenknoten, die sich sämtliche Ressourcen teilen; gedacht für dedizierte Webserver, Content-Auslieferung, Data Analytics mit dem aktuellen Trendsetter Apache Hadoop und Ähnliches mehr. Das erste im Herbst 2011 angekündigte Raumfahrtprojekt läuft unter dem Namen Redstone. Hierbei arbeitet HP mit dem Start-up Calxeda zusammen, das eine Steckkarte mit vier Calxeda-SoCs namens „Energy Core ECX-1000“ designt hat, ein jeder versehen mit vier ARM-A9-Kernen. Laut HP soll die Moonshot-Architektur im Vergleich zu den großen x86-Servern 94 Prozent weniger Platz und 89 Prozent weniger Energie benötigen sowie 63 Prozent weniger Kosten verursachen.

Doch die Redstone-Rakete hat die Startrampe noch gar nicht verlassen und schon hat HP die nächste Runde eingeläutet: das Projekt Gemini. Partner ist hierbei Intel, der mit dem auf dem IDF in Peking angekündigten Dual-Core-Atom Centerton den ARM-Prozessoren Paroli bieten will – und wahrscheinlich auch kann. Centerton, der in der zweiten Jahreshälfte 2012 herauskommen soll, ist für eine TDP von nur 6 Watt ausgelegt. Intel will nun zusammen mit HP eine spezielle Cartridge mit einer noch unbekannten Anzahl von Centerton-Prozessoren für HPs Mikroserverfamilie konstruieren. Betont werden hierbei immer schöne Features wie Virtualisierung und 64 Bit – etwas, womit ARM derzeit noch nicht aufwarten kann.

Das Start-up Calxeda, an dem ARM mit etwa 20 Prozent beteiligt ist, hat die ersten laufenden Systeme im Mai auf dem Ubuntu Developer Summit und nun auf der ISC12 unter Ubuntu 12.04 vorgeführt. Und nicht nur HP, sondern auch Supermicro will mit entsprechenden Calxeda-Mikroservern aufwarten. Frech hat inzwischen das kleine Unternehmen mit einem etwas schrägen Benchmark-Vergleich auf sich aufmerksam gemacht: 15 Mal bessere Energieeffizienz beim ApacheBench als ein Xeon-E3-1240-System soll ihr 5-Watt-Webserver bei 1,1 GHz Takt bieten. 4 GByte Speicher hier, 16 GByte da, gemessene Watt hier, TDP-Berechnung da, Volllast hier, nur 15 Prozent CPU-Last da – das eröffnet viele Angriffspunkte, aber letztlich dürfte bei einem faireren Vergleich wohl immer noch etwa Faktor 5 übrig bleiben. Aber der Vergleich hinkt trotzdem, spannend wird es erst, wenn der Centerton in diesen Wettkampf eingreift.

ARM gegen x86 – diesen Dauerkonflikt hat auch Linux-Schöpfer Linus Torvalds zum Teil mit recht drastischen Kommentaren begleitet. Nun hat er sich über Nvidia aufgeregt und scheute sich nicht, in bester Effenberg-Manier den Stinkefinger einzusetzen und „fuck you, Nvidia“ zu skandieren. Nvidia ist zwar im Frühjahr der Linux Foundation beigetreten, verhält sich aber recht zugeknöpft, was die Offenlegung von Linux-Treibern, etwa für die Hybridgrafiktechnik Optimus, angeht – wer weiß, vielleicht sind da auch irgendwelche verletzten Patente im Spiel, sodass die Quellen aus gutem Grunde unter Verschluss sind. Nebojša Novakovíc von Bright Side of News meint jedenfalls erfahren zu haben, dass Nvidias Verschlossenheit einen Riesen-Deal in China mit 10 Millionen Schul-PCs vermasselt habe. Den soll jetzt AMD eingeheimst haben – und die können ihn gut gebrauchen. (as)

Artikel kostenlos herunterladen

Anzeige
Anzeige