Prozessorgeflüster

Vom Zählen, Teilen und Verkleinern

Trends & News | Prozessorgeflüster

Nvidia erobert sich den Spitzenplatz in der Wer-hat-den-Größten-Disziplin zurück, AMD ändert seinen Transistorabzählreim und bewundert wichtige ehemalige Mitarbeiter jetzt bei der Konkurrenz. Intel investiert in neue Fabriken – aber mangels zufriedenstellender Zuschüsse nicht in Israel, sondern in Irland.

Intels Prozess-Roadmap: 10 nm (P1274) ist für 2015 vorgesehen, 7 und 5 nm sollen dann relativ schnell folgen. Die werden dann wohl nicht mehr mit 193-nm-Laserlicht, sondern mit EUV geplant sein.

Nvidias Kepler 2 (siehe S. 18) soll mit 7,1 Milliarden Transistoren der derzeit mächtigste Chip auf Erden sein – jedenfalls, wenn Nvidia richtig gezählt hat. Denn allzu groß ist der Vorsprung nicht, der gigantische Virtex 7 von Xilinx folgt mit 6,8 Milliarden Transistoren gleich dahinter. Dann wird der Abstand größer zum folgenden AMD Tahiti mit 4,3 Milliarden. Die größte CPU ist aktuell noch der 10-Kerner Xeon Westmere-EX mit 2,6 Milliarden Transistoren, der in Kürze von dem Itanium Poulson mit 3,1 Milliarden übertroffen werden dürfte.

Das Zählen von Transistoren ist dabei gar nicht so einfach: Was zählt man mit, was nicht? In den Chips gibt es nämlich zahlreiche Teststrukturen und redundante Schaltkreise, passive Transistoren also, die man nicht unbedingt mit einrechnen muss. Intel hatte schon des Öfteren Erweiterungen zu Testzwecken eingebaut, die bei dem finalen Produkt nicht freigeschaltet waren, beispielsweise das Hyper-Threading beim ersten Pentium 4. Die veröffentlichten Transistorzahlen entsprechen zudem immer der Maximalausstattung einer Prozessorgeneration, bei abgeschaltetem Hyper-Threading und verkleinerten Caches sitzen dann nur allzu oft massenweise zum Nichtstun verdammte Transistoren mit auf dem Chip.

Die Prozessor-Caches besitzen auch häufig redundante Lines für nachträgliche Reparaturen. Der inzwischen mehr oder weniger abgekündigte Itanium kann die Caches sogar im laufenden Betrieb reparieren. Und im BlueGene/Q hat IBM gleich einen kompletten Kern als Reserve vorgesehen.

Insbesondere aber gibt es in den Designs zuhauf Entkoppel-Kondensatoren (Decaps), deren Aufgabe es ist, Übersprechen über die Stromversorgungsleitungen zu vermeiden. Und diese Kondensatoren werden ebenfalls durch spezielle Transistoren gebildet. Wie AMD der Newssite Brightsiteofnews mitteilte, hat die Firma bis Ende 2011 diese „Decap Cells“ mit eingerechnet, ab 2012 aber nicht mehr. Und so hat auf einmal der Llano, der ursprünglich beim Launch mit 1,45 Milliarden Transistoren spezifiziert wurde, nur noch 1,18 Milliarden. Ähnliche Verwirrung über die Transistorzahl gab es zuvor schon beim Bulldozer. Und wer weiß, vielleicht wartet auch hier noch die ein oder andere Testhardware im Verborgenen, um sich mit einem geheimen MSR-Befehl und dem nicht mehr so geheimen AMD-Key (0x9c5a203a) freischalten zu lassen. Womöglich gibt’s ja den offiziell erst für Steamroller vorgesehenen Radix-8-Hardware-Divider testweise schon im Piledriver …

Dividenden

Mitentwickelt hat diese Dividiereinheit der Mathematiker David M. Russinoff, der seit den K5-Zeiten bei AMD für formale Hardware-Verifikation der FPUs verantwortlich war. Russinoff hat wie viele andere AMD Ende letzten Jahres verlassen und wurde mit Freude sofort vom Konkurrenten Intel als Principal Engineer eingestellt. Dazu brauchte er nicht einmal umzuziehen, denn Intel betreibt im texanischen Austin ein inzwischen recht großes Forschungs- und Entwicklungscenter, das unter anderem für die Atoms verantwortlich zeichnet – und die können deutlich mehr Pepp bei den Gleitkommaberechnungen gut gebrauchen. Schaut man sich bei den Atom-Prozessoren die Latenz- und Durchsatzzeiten der Divisionen (IDIV, FDIV, DIVPD …) an – sei es bei den alten Bonnell- oder den aktuellen Saltwell-Architekturen – so sieht das doch arg traurig aus: Sie bleiben um Welten hinter den anderen x86-Prozessoren zurück.

Hardware-Divider auf Basis des SRT-Algorithmus hat Intel ansonsten schon lange, beginnend mit Radix 2 (ein Bit pro Takt) im Pentium. Der hatte anfangs allerdings einen kleinen Fehler, der seinerzeit reichlich Aufmerksamkeit hervorrief. Wir horten hier jedenfalls immer noch ein paar fehlerhafte Pentium-Exemplare, um die versprochene „lebenslange“ Umtauschgarantie irgendwann mal einzufordern. Ein zwischenzeitlicher Austausch vor ein paar Jahren verlief jedenfalls völlig problemlos.

Viele Jahre nach dem Pentium brachte das Entwicklungsteam in Haifa mit dem Merom eine nahezu doppelt so schnelle Radix-4-Division (2 Bits pro Takt) und 2008 trumpfte dann der Core 2 (Penryn) mit dem nochmals doppelt so schnellen Radix-16 (4 Bits pro Takt) auf. Hinzu kommt eine „Early Out“-Erkennung, die im besten Fall schon nach 6 Takten ein Ergebnis liefert, ansonsten braucht der Penryn zum Beispiel für DIVPD 21 Takte – der Atom hingegen 122 Takte …

Kurz nach David Russinoff verließ auch der einst von ATI gekommene Grafikarchitekt und spätere Chief Technology Officer Eric Demers AMD. Jetzt wurde es definitiv bekannt, dass er bei Qualcomm einen neuen Posten gefunden hat. Qualcomm hatte 2009 von AMD die Handy-Grafiksparte (Imageon-Prozessor) übernommen und besitzt das GPU-Design Adreno, das im Snapdragon-Prozessor mit ARM-Kernen verschmolzen wird. Demers kennt sich bestens mit AMDs „Heterogeneous System Architecture“ HSA aus, und so liegt es durchaus nahe, dass die Konkurrenten Qualcomm und AMD im Rahmen der HSA-Initiative Partner werden könnten.

Auf dem Fusion Developer Summit 2012 Mitte Juni in Bellevue bei Seattle will AMD die HSA-Spezifikationen veröffentlichen und dann wohl auch einige Partner benennen.

Lachssprünge

Nicht in Israel, sondern im irischen Leixlip will Intel nun das neue ausländische 14-nm-Werk bauen. Das gab Intel-Chef Otellini auf einem Investorentreffen Mitte Mai bekannt. Damit reagierte Intel auf die Weigerung des israelischen Staats, Subventionen von 600 Millionen Dollar für das 4,8-Milliarden-Dollar-Projekt zu gewähren. Nicht einmal die Hälfte wollte das zuständige Investment Promotion Center des Industrie- und Handelsministeriums zugestehen, und das auch noch gekoppelt an einen Bau an dem Ort Beit She’an. Was die Iren an Subventionen angeboten haben – Guinness, Whiskey, Lachs –, man weiß es nicht. Intel hat offenbar nicht nur eine Aufrüstung der bestehenden Werke vor – ursprünglich war lediglich von einem Update des alten, seit drei Jahren eingemotteten Werkes Fab 14 für 500 Millionen Dollar die Rede –, sondern nun auch die Genehmigung für ein neues Werk auf 162 000 Quadratmeter Grund eingereicht. Neben den beiden Produktionsstandorten in Oregon und Arizona sollen in Leixlip ab Ende 2013 die Broadwell-Prozessoren (auf 10-nm-Stukturen verkleinerte Haswell-Prozessoren) vom Band laufen.

Aber Israel, wo in Kiryat Gat in einem der modernsten Werke für 22-nm-Technik Ivy-Bridge-Prozessoren gefertigt werden, bekommt eine zweite Chance. Fabrik-Leiterin Maxine Fassberg und Intel-Israel-Chef Mooly Eden verhandeln nun mit dem Staat über Zuschüsse für den Bau einer Fabrik für 10-nm-Technologie, die ab 2015 einsatzbereit sein soll. (as)

Artikel kostenlos herunterladen

Infos zum Artikel

Kapitel
  1. Dividenden
  2. Lachssprünge
0Kommentare
Kommentieren
Kommentar verfassen
Anzeige

Anzeige

Anzeige