Prozessorgeflüster

Von Shen und Zen

Trends & News | Prozessorgeflüster

Noch gibt es ihn gar nicht, aber schon werden großen Mengen von ihm für gigantische Supercomputer des Jahres 2018 bestellt: Intels übernächste Xeon-Phi-Generation Knights Hill. Auf Intels Entwicklerforum in Shenzhen gab es nur wenige Neuigkeiten zu neuen Prozessoren – spannender sind wohl diejenigen von AMD zu Zen.

Allüberall wird das 50. Jubiläumsjahr des Moore’schen Gesetzes gefeiert – bei uns natürlich auch (siehe S. 72). In einer Telefonkonferenz vorab gab sich Intels Herstellungsleiter Mark Bohr über dessen Zukunft sehr optimistisch: Der nächste Prozess mit 10-nm-Strukturen läge gut im Zeitplan. Aber nun klang aus anderen Quellen, dass es wohl doch erhebliche Verzögerungen geben könnte. Die Auguren schließen das aus verschobenen Einkäufen von Tools für die 10-nm-Produktion vom März auf Dezember 2015.

Unter anderem soll als einer der ersten Chips im 10-nm-Prozess der übernächste Xeon-Phi-Prozessor namens Knights Hill gefertigt werden. Er wurde jetzt bereits erkoren, 2018 den Supercomputer Aurora anzutreiben, für den Intel und Cray einen Großauftrag vom Department of Energy in Gesamthöhe von 200 Millionen US-Dollar gewonnen haben. Mindestens 180 PFlops, möglicherweise auch noch weit mehr bis hin zu 450 PFlops soll er leisten, und das bei vergleichsweise bescheidenen 13 MWatt Energieaufnahme. Okay, das ist fast das Dreifache dessen, was der jetzige BlueGene-Supercomputer Mira am geplanten Standort Argonne Labs verbraucht, aber eben bei mindestens 18-facher Leistung.

Mit Plan B

Die Performance von 180 PFlops ist allerdings recht konservativ abgeschätzt, sodass sie ein leicht beschleunigter Xeon Phi Knights Landing, noch gefertigt im 14-nm-Prozess, notfalls auch liefern könnte, selbst innerhalb obigen Energierahmens. Bei den vorgesehenen über 50 000 Knoten für Aurora würde schon die für dieses Jahr geplante Version mit ihren über 3 „doppeltgenauen“ TFlops auf mehr als 150 PFlops theoretische Spitzenleistung kommen. Und Knights Hill, das hatte Intel auf der letzten Supercomputer-Konferenz angedeutet, soll etwa dreimal so schnell wie jener sein … da kommt man dann, oh Wunder, genau auf … 450 PFlops. Im Vertrag mit dem Department of Energy gibts also offenbar eine Plan-B-Strategie, falls es mit 10 nm doch nicht klappen sollte. Vermutlich ist Knights Hill demnach als direkter Nachfolger für den mit über 3500 Pads versehenen zweigeteilten Sockel des Knights Landing vorgesehen, der mit seinen 6 DDR4-Speicherkanälen auch kompatibel zum Skylake-EP ist. Das wäre eine gute Nachricht für die HPC-Szene, dann kann man einfach durch einen Prozessortausch die Performance verdreifachen oder auf eine andere Architektur wechseln. Bleibt abzuwarten, welche Flexibilität Cray mit dem Shasta-System anbieten wird.

Auf dem IDF in Shenzhen hat Intel jetzt auch endlich die Kernzahl von „bis zu 72“ bestätigt, die wir ja schon vor eineinhalb Jahren sehr zum Missfallen von Intels HPC-Chef Raj Hazra ausposaunt hatten. Auf Intels nun veröffentlichter Folie steht auch „Full Intel Xeon processor ISA compatible“ – aber das „Full“ hatten wir an dieser Stelle auch schon relativiert. Dumm nur, dass Intel in China jetzt zwar die nächsten Prozessorgenerationen vorstellen kann, aber keine aktuellen mehr an vier große Supercomputer-Center liefern darf, genauso wenig wie Nvidia. Weil dort an Kernwaffen geforscht wird, hat die amerikanische Regierung erst einmal den Export gestoppt, er würde den nationalen Sicherheitsinteressen zuwiderlaufen. Da fragt man sich, wie das in Zukunft mit OpenPower in China wohl aussehen wird.

In Shenzhen berichtete Intel jedenfalls von der guten Zusammenarbeit mit der chinesischen Akademie für wissenschaftliches Supercomputing – man hat jetzt gemeinsam ein Parallel Computing Center in China gegründet. Auch die Kooperationen mit chinesischen Firmen laufe gut, etwa mit Rockchip aus Fuzhou beim SoFIA-Atom x3-C323XRK (das ist die 3G-Version ohne LTE). Diese x3-Atome werden ja, bestückt mit den alten Silvermont-Kernen, nicht bei Intel, sondern bei TSMC in Taiwan im preiswerten, aber recht groben 28-nm-Prozess hergestellt. Die Atom-x5/x7-Prozessoren (Cherry Trail) mit vier 14-nm-Airmont-Kernen hatte Intel wie SoFIA auch schon zum Mobile World Congress Anfang März angekündigt, aber auf dem Markt sind sie noch nicht zu sehen. Mit konkreten Performancewerten hält sich Intel weiterhin zurück, lediglich zur Grafik heißt es, dass der OpenGL-Benchmark GFXBench 2.7 doppelt so schnell laufe und der DirectX-Benchmark 3DMark IceStorm um 50 Prozent schneller sei. Immerhin erklärte Intel, dass künftige Atom-x7-8700-Versionen 4K mit vollen 60 Hertz unterstützen.

Ansonsten erfuhr man, wie sich der Atom x3 mit 2 W SDP im Vergleich zum alten Baytrail-T (Atom Z3735G und Z3795, ebenfalls 2 W SDP) zum Core M (3,5 bis 6 W TDP) und zum Core i7-5600U (15 W TDP) in verschiedenen Benchmarks, insbesondere auch in der Single-Thread Performance so schlägt, Letzteres gemessen mit dem unverwüstlichen SPECint-CPU2000-Benchmark. Man beachte aber die beiden verschiedenen Energieszenarien (SDP und TDP).

Gerüchte

Mit Intels Einstieg in die FPGA-Szene wirds derweil wohl nichts, jedenfalls nicht so bald. Seit einigen Wochen kursieren Gerüchte, Intel wolle Altera übernehmen, eine der wenigen Firmen, die bei Intel fertigen dürfen. Wie es aber heißt, habe man sich über den Kaufpreis nicht einigen können. Schade, auf die Art wäre Intel sogar Mitglied der OpenPower Foundation geworden.

Ein anderes Übernahmegerücht grüßt wie das morgendliche Murmeltier: Samsung wolle die trudelnde Firma AMD einkaufen. Aber AMD will es, wie bislang immer, alleine schaffen, aus dem Schlamassel zu kommen. Vor allem die nächste x86-Prozessorgeneration Zen soll es richten, die, wie Chief Financial Officer Kumar jetzt noch mal betonte, 2016 kommen und auch bei den Servern wieder angreifen soll.

Fudzilla.com hat jetzt ein paar neue Details für die High-End-Zens ausgegraben, die bis zu 16 Kerne mit Hyper-Threading bieten sollen, dazu 512 KByte L2-Cache pro Kern, einen gemeinsamen L3-Cache von 32 MByte und als GPU den Greenland-Stream-Prozessor mit 16 GByte High-Bandwidth-Speicher (HBM), vier DDR4-3200-Kanäle mit ECC, 64 PCIe-3.0-Lanes, die zum Teil zu SATA und SATA Express umgewidmet werden können. Das sieht ja so schlecht nicht aus und mehr Konkurrenz bei den Servern wünschen sich – bis auf eine kalifornische Firma – so gut wie alle. (as@ct.de)

Artikel kostenlos herunterladen

Anzeige
Anzeige