Prozessorgeflüster

Von Erblasten und Erblassten

Trends & News | Prozessorgeflüster

Kaum hat man eine neue Prozessorgeneration, machen gleich echte oder angebliche Prozessorfehler die Runde, jetzt mal wieder bei Intel. AMD lässt ungewollt einige Informationen über die nächsten Desktop-Prozessoren verlauten und Transmeta hat endlich einen Käufer gefunden.

Die zumeist umfangreiche Fehlerliste eines Prozessors ist fast wie ein genetischer Fingerabdruck. Mit ihr kann man abschätzen, wie eng aufeinanderfolgende Mikroarchitekturgenerationen verwandt sind: Mehr als zwanzig übereinstimmende Fehlergene zwischen Nehalem und Merom/Penryn – das dürfte klar für den Nachweis der Vaterschaft ausreichen. Interessanterweise findet man auch beim Atom so manches bekannte Gen wieder, darunter – wen wundert’s – weiterhin die Inkarnation des Erbdefekts schlechthin, also das A20-Gate. Ob Atom, Pentium 4 oder Core-Merom: bei allen gibt’s Ärger mit dem Wurmfortsatz aus uralten Zeiten, etwa im Zusammenspiel mit großen Speicherseiten: „Using 2M/4M Pages When A20M# Is Asserted May Result in Incorrect Address Translations“ (ist beim Penryn allerdings inzwischen korrigiert).

Bei Nehalem, so hatte Intels Chef der Business Unit, Pat Gelsinger, eigentlich versprochen, sollte der A20-Blinddarm endgültig herausoperiert sein, aber denkste! Nehalem-Chips müssen zwar nicht, können aber weiterhin die urige A20-Umschaltung unterstützen. Ob er das tut, lässt sich einem Bit im „natürlich“ undokumentierten Register VLW_CAPABILITY entnehmen – dumm nur, dass das Bit laut Intel-Fehlerbericht (Fehlernummer AAJ49) genau falsch herum implementiert wurde.

Nehalem hat neben einigen weniger aufregenden Fehlern auch den Formalismus der korrekten Invalidierung des Translation Lookaside Buffer (TLB) geerbt. Der ist dann aufwendiger, wenn sogenannte Paging Structure Caches mit ins Spiel kommen. Bei Nehalem wird das zudem weiter verkompliziert, da er Expanded Page Tables (EPT) sowie zusätzlich ID-Einträge für Virtuelle Prozessoren (VPIDs) bietet. Diese Features können die Virtualisierung erheblich beschleunigen, nur sind dann auch die neuen Invalidierungsbefehle wie invvpid und invept zu benutzen.

Die Möglichkeit des Einbaus beziehungsweise des Freischaltens von Paging Structure Caches hält sich Intel offen („may include …“) und hat vorsichtshalber einen entsprechenden, überall gleichlautenden Hinweis in den Spezifikations-Updates von Merom, Atom und Nehalem unter „Specification Clarification“ veröffentlicht. Dort weist Intel zudem darauf hin, dass eine falsche Invalidierung zu Fehlern oder Abstürzen führen könnte – und schon gab es viel Rauschen im Web-Wald, die Intel-Prozessoren litten unter einem TLB-Bug, der möglicherweise schlimmer wäre als der von AMDs Barcelona-Prozessor.

Offenbar ist das nur ein Missverständnis, an dem aber die Firma Intel zum großen Teil selbst schuld ist. Schließlich berichtet sie über die Paging Structure Caches nur geheimniskrämerisch in einem White-Paper zum Thema Invalidierung sowie ansatzweise im neuesten Software Manual. Aber bei den Prozessoren findet man dazu nichts Konkretes (wie groß, wie organisiert, Latenzzeiten, wie schaltet man sie ein und aus etc.). De facto müssen sich also lediglich die Betriebssystem- und Hypervisorprogrammierer an die Intel-Vorgaben halten, wollen sie mit den neuen Features nicht über Kreuz stehen.

AMD hat ihr Gegenstück zu Intels EPT unter dem Namen „Rapid Virtualization Indexing“, RVI, schon seit einiger Zeit im Programm. In den neueren Opterons gibt es ebenfalls quasi undokumentierte „Page Walk Caches“ sowie Address Space ID und auch hier dürfte es detaillierte Vorschriften für die Programmierer geben, wie man damit umzugehen hat, etwa für die von VMware. Von denen liegen nun erste konkrete Erfahrungen auf dem neuen Opteron 8384 (Shanghai) vor, was RVI hier an Performance unter VMware ESX 3.5u2 bringen kann: bis zu 42 Prozent bei Applikationen (Apache-Kompilation), 10 Prozent bei Datenbanken (SQL Server Database Hammer) und bis zu 500 Prozent bei speicherintensiven Mikro-Benchmarks – beides verglichen mit der reinen Softwarelösung (Binärtranslation). Es gibt allerdings auch Benchmarks wie SPECjbb2005, die wegen der höheren TLB-Last unter RVI mitunter langsamer als mit Binärtranslation ablaufen.

Bye-bye Crusoe und Efficeon - aber Transmeta hatte sich von den Prozessoren ohnehin schon vor einiger Zeit verabschiedet und sich auf die Stromspartechnik Longrun2 kapriziert.

Inzwischen sind auch Namen, Daten, Performancewerte und Preise der geplanten Desktop-CPUs mit dem neuen Shanghai-Kern mit 45-nm-Prozess durchgesickert. Diesen Informationen zufolge sollen sie im Januar nächsten Jahres herauskommen. Wieder einmal will AMD dabei ein neues Namensschema einführen. Bislang fand man einen Wildwuchs von Zahlen mit und ohne Plus, mit angehängtem „e“ oder „B“ und vorneweg mit LE oder BE vor. Nun kommen Bezeichnungen wie Phenom II X4 940 Black Edition (3 GHz, offener Multiplikator) oder Phenom II X4 920 (2,6 GHz) – ein Schelm, wer da an Intels neue Core-i7-Prozessoren (Core i7-940, Core i7-920) denkt. AMD vergleicht auf den durchgeschlüpften Folien auch lieber mit dem Intel Core 2 Quad 9400 mit 2,63 GHz, den der schnellste Phenom II in der Dragon-Plattform bei Quake 4 oder Lost Planet um 50 bis 65 Prozent abhängt (bei nicht spezifizierter Grafikkarte). Bei den Preisen, so wie sie jedenfalls ein australischer und ein britischer Computerhändler schon als Vorverkaufspreis aufgelistet hatten, lagen Phenom II X4 920 und der Core 2 Quad 9400 ziemlich gleichauf – komisch, beide Websites waren danach erst mal nicht mehr erreichbar …

Weitere Phenoms für den neuen AM3-Sockel (für DDR3-1366) sind nach den Folien im Februar unter Phenom II X4 920 (2,8 GHz) und Phenom II X4 910 (2,6 GHz) geplant, beide, wie auch die Versionen 940 und 920, mit jeweils 4 x 512 KByte L2- und 6 MByte L3-Cache. Daneben soll es Versionen mit kleineren L3-Caches oder mit nur drei aktiven Kernen geben. Ab April oder später sind unter dem Namen Athlon L3-cachelose Chips mit vier, drei oder zwei Kernen geplant: Athlon X4 600 (Propus), Athlon X3 400 (Rana) und Athlon X2 200 (Regor). Apropos Zweikerner – hier wartet man immer noch auf die versprochenen K10-Versionen (Kuma), die in Kürze als Athlon X2 7xxx herauskommen müssten, sonst lohnt es sich ja kaum noch.

700 000 Transmeta-Aktien hat AMD derweil als Lizenzzahlung an das Designhaus Transmeta zurückgegeben, damit diese zusammen mit der ganzen Firma an den geplanten neuen Besitzer übergeben werden können: Novafora (ehemals Sipharos), ein kleines Start-up für Videoprozessoren. 255 Millionen Dollar Kaufpreis – das klingt nach viel, de facto aber hat Transmeta in etwa diese Summe in der Kasse, allerdings auch noch ein paar Außenstände. Der tatsächliche Wert der einst so hochtaxierten Firma wird bei dem Deal nur mit 11 Millionen Dollar beziffert – ob die Aktionäre mit dieser schwachen Bewertung einverstanden sein werden, bleibt abzuwarten. (as)

Kommentare

Anzeige