Nun ist Cell mit ziemlicher Verspätung beim (amerikanischen und japanischen) Volke angekommen - von dem einstigen Super-Hype ist aber nicht mehr so arg viel übrig geblieben. Nicht zuletzt auch deshalb, weil sich Nvidia und ATI/AMD mit ihren GPUs gut in Position gestellt haben und Intel mit Quad-Cores den Markt aufmischt.
Manche japanischen Analysten glauben gar, dass die PS3 Sonys letzte Playstation sein dürfte. Ausgelöst wurden die Spekulationen durch eine Umstellung des Managements bei Sony Computer Entertainment International (SCEI), wobei dem als „Vater“ der Playstation gefeierten Ken Kutaragi andere Aufgaben im Konzern zugeteilt wurden. Das mag ein bisschen weit hergeholt sein, doch ob die PS3 nun wirklich für die nächsten zehn Jahre aktuell bleibt, wie der neue Chef Kazuo Hirai verlauten ließ, ist doch eher fraglich.
Acht „Synergistische Einheiten” (SPEs) bietet die Cell-CPU neben dem PowerPC-Kern, bestehend aus relativ einfachen SIMD-Prozessorkernen, gestrickt im Schwabenlande. Sony hatte jedoch schon im Vorfeld angekündigt, nur sieben davon nutzen zu wollen und in der von uns in Japan gekauften Box liefen unter dem Yellow Dog Linux gar nur derer sechs - das hat ein Gschmäckle nach schwäbischer Sparsamkeit und spricht nicht gerade für eine gesunde Ausbeute.
Irgendwie muss Sony aber auch den Preis drücken, schließlich legt der japanische Konzern ein paar hundert Dollar pro PS3 drauf. IBM auf der anderen Seite verlangt für seine Cell-Blades schlappe 19 000 Dollar, dafür sollte man dann auch wirklich zwei vollwertige Cell-Prozessoren mit allen acht SPEs erwarten können. Die Cell-Performance unter Linux (siehe S. 166) hat uns erst mal nicht gerade vom Hocker gehauen, der Hauptprozessor PowerPC ist trotz seiner 3,2 GHz ziemlich schlapp (SPECint2000-Niveau eines Athlon mit 1,33 GHz) und die SPEs kommen nur dann wirklich in Fahrt, wenn man sie mit handoptimierter SIMD-Software liebevoll füttert - da sind wir noch dran. Mit ihrem kleinen lokalen Speicher von 256 KByte und ohne den ganzen Überbau-Schnickschnack moderner Prozessoren (eine SPE hat nur einen Thread und wird flat, also quasi im Real-Mode adressiert) fühlen sich die SPEs netterweise so an wie einst ein 8086-PC unter DOS, also „back to the roots“, nun aber mit 128 Registern und leistungsfähigem SIMD auf SSE2-Niveau.
IBM hat sich mit Cell viel Zeit gelassen, vielleicht zu viel, denn inzwischen gibt es ernstzunehmende Konkurrenz aus dem Lager der Grafikprozessorhersteller Nvidia und ATI/AMD. Letztere werben jetzt beispielsweise mit Performance-Angaben für den Stream-Prozessor AMD R580 von bis zu 375 GFLOP/s und brachten auch ein Low-Level-Interface zur Hardware namens ctm heraus: „close to metal“. Clevere Firmen wie RapidMind wollen überdies mit interessanten, plattformübergreifenden C++-Entwicklungsumgebungen für Cell und die GPUs von AMD und Nvidia die Programmierung vereinfachen.
Einfache Genauigkeit der Hardware, wie bei den aktuellen GPUs, muss indes kein Grund sein, auf wissenschaftliche Anwendungen zu verzichten, denn es gibt leistungsfähige Algorithmen wie DGESIRSV, die trotz Single-Precision-Rechenwerken letztlich doppelte Genauigkeit des Ergebnisses herauszaubern - und das erstaunlich schnell. Von solchen „Mixed-Precision“-Tricks können sowohl GPUs als auch Cell profitieren, so ist die Matrix-Multiplikation mit DGESIRSV mehr als achtmal so schnell als mit der zwar doppelt genauen, aber doch recht lahmen FPU in den Cell-SPEs. Linpack-Schöpfer Jack Dongorra konnte mit der gemischten Präzision schon nahezu 100 GFLOP/s Linpack-Leistung aus einem Cell-Prozessor herauskitzeln. Mit 30 PS3s käme man dann so gar in die Top500-Liste der Supercomputer, zwar nur mit insgesamt arg mickrigen 7,5 GByte Speicher, die nicht wirklich für wissenschaftliche Aufgaben ausreichen, aber mit viel Blu-ray und das alles dank der Freundlichkeit von Sony für den Spottpreis von nur 18 000 Dollar.
Mit einer Herstellungstechnik in 90-nm-SOI steht Cell allerdings nicht unbedingt auf dem allerneuesten Stand der Technik, da fragt man sich schon, wo die unterstellte schlechte Ausbeute herkommt. Intel verkauft nun schon seit fast einem Jahr Prozessoren, die im 65-nm-Prozess gefertigt wurden - über 40 Millionen kamen bis September unter die Leute, jetzt dürften es wohl schon mehr als 60 Millionen sein. Die versammelte Prozessorkonkurrenz, ob nun IBM, AMD, Samsung und wie sie alle heißen, haben bislang exakt null Stück in dieser Frontend-Technologie ausgeliefert. Das heißt bis Redaktionsschluss, denn AMD ist seit dem fünften Dezember nun als Zweiter offiziell mit von der 65-nm-Partie (S. 28) - zumindest mit ein paar Exemplaren.
Doch Intel hat AMDs Freude über den Technologiesprung ein paar Tage zuvor ein wenig verregnet: Herstellungsleiter und Senior Fellow Mark Bohr berichtete vom ersten Tape-out des Core-2-Nachfolgers Penryn im 45-nm-Prozess. Man sei voll im Zeitplan, Ende 2007 die ersten 45-nm-Chips auf den Markt zu bringen. So macht Intel klar, dass man den Technologievorsprung von gut einem Jahr weiter beibehält.
Auch bei diesem AMD-Event zeigt sich einmal mehr der Unterschied in der Launch-Strategie der Konkurrenten: Während Intel schon seit geraumer Zeit „von oben“ launcht, also zunächst eine Extreme Edition mit hohem Takt auf den Markt wirft - was so zugleich die Ausgereiftheit der neuen Herstellungstechnologie unter Beweis stellen soll -, kommt AMD in klassischer Weise von unten, zunächst mit niedrigen Takten. Neue Architekturen lässt AMD außerdem lieber erst im Serversegment debütieren.
Und trotz des 65-nm-Vollzugs ist AMDs Wetterlage in etwa so wie bei Intel vor zwei Jahren: Noch ist es sonnig, man verkauft gut und hat vorzeigbare Bilanzen, aber die weiteren Aussichten sind zumindest im Desktop-Sektor eher neblig bis trübe, und der Ruf geht in den Keller. Da hilft 4x4 nicht weiter - diese absonderliche Idee, umgebaute und kastrierte Opterons in lauten, energiehungrigen Desktop-Systemen als Antwort auf Intels Quad-Core zu platzieren. Das wirkt reichlich hilflos, zum Teil gar lächerlich; erste Designs (QuadFather, c't 26/2006, S. 24) wurden im Internet geradezu verrissen.
Die möglicherweise wieder Sonne bringenden Quad-Cores sind noch weit weg und sollen ohnehin zunächst nur im Serverbereich (er-)scheinen. Einen allerersten Prototyp des Barcelona-Kernes hat AMD zwar am letzten grauen Novembertag auf einem Analysten-Treffen in Kalifornien vorgeführt - er bootete Windows und zeigte den Task-Manager - mehr aber auch nicht. Wenn man an den Opteron zurückdenkt, den AMD erstmals auf der Computex im Juni 2002 (unter Linux) lauffähig als Webserver vorführte und dann erst zehn Monate später im April 2003 offiziell vom Stapel ließ, sieht man, dass es sehr schwer für AMD werden dürfte, noch zum vierten Opteron-Geburtstag mit dem Quad-Core herauszukommen. Und so lange dürfte das Wetter stürmisch, mitunter verhagelt sein. Vielleicht aber wird in der Zwischenzeit Neueinkauf ATI mit seinen Stream-Prozessoren für ein paar unerwartete Sonnenstrahlen sorgen. (as)
Version zum Drucken | Per E-Mail versenden | Heft bestellen
Permalink: http://heise.de/-290784
Das aktuelle Heft ist jetzt im Handel erhältlich.
Ältere Artikel können Sie über unser Zeitschriften-Archiv bestellen.