Prozessorgeflüster

Von Rittern und Knappen

Trends & News | Prozessorgeflüster

News zum Xeon Phi Knights Landing, neuer hocheffizienter Rechenbeschleuniger Rex Neo, erster OpenPower-Chip aus China und Platzprobleme mit Nvidia Quadro M6000.

Während die amerikanischen Kollegen bei einem Server-Workshop in Oregon neue Details rund um den für Ende dieses Jahres geplanten Xeon Phi Knights Landing serviert bekamen und auf Intels Referenzboard „Adam Pass“ spielen konnten, mussten sich die von viel weiter angereisten europäischen und asiatischen Journalisten diesbezüglich mit Brosamen begnügen. Immerhin gab es neben den hinreichend bekannten Präsentationen zum „Sternenkrieg“ SDI (Software Defined Irgendwas) auch für die Aliens ein Update zum Thema High Performance Computing, wenn auch mit vergleichsweise spärlichen neuen Informationen. Manches davon hatte Serverchefin Diane Bryant zudem schon im letzten Jahr auf einem Investorentreffen angesprochen, etwa dass Xeon Phi Knights Landing über 7,2 Milliarden Transistoren aufweisen wird. Die Knights-Landing-Version mit integriertem Fabric namens Omni-Path hat derer sogar mehr als 8 Milliarden auf über 700 mm2 Fläche und liegt damit in der Chip-Komplexität mit Nvidias Maxwell (8,1 Milliarden) gleichauf. Höchstwahrscheinlich zur Supercomputer im November in Austin soll der Knights Landing (KNL) herauskommen: boot-fähig nicht nur für alle großen Linux-Distributionen, sondern auch für Windows.

Die anderen Details, Dinge wie Cachegrößen, Speichermodelle und die verbesserte Out-of-Order-Technik des eingesetzten Silvermont-Kerns waren allesamt seit geraumer Zeit bekannt – das lässt sich schön zusammengefasst in „What public disclosures has Intel made about Knights Landing?“ auf Intels Developer Zone nachlesen. Die gern zitierte AVX512-Kompatibilität von Knights Landing mit Skylake und anderen gilt allerdings nur eingeschränkt. Es gibt nämlich AVX512 in vielen Spielarten (Foundation, Conflict Detection, Exponential & Reciprocal, Prefetch, mit Byte-, Word-, Doubleword, Quadword-Instruktionen …). KNL unterstützt nur eine Untermenge davon, Skylake eine andere. Transactional Memory kennt KNL auch nicht.

Weitere über Intels Veröffentlichungen hinausgehende Informationen konnten c’t-Leser hier im Geflüster schon vor über einem Jahr erfahren: Bis zu 72 Kerne auf dem Chip und bis zu 200 Watt TDP, mit Omni-Path (hieß damals noch Storm Lake oder Omniscale) sind es 15 Watt mehr. Offiziell spricht man bei Intel von über 10 GFlops/W. De facto sind es bei 3 TFlops doppeltgenauer Rechenleistung bis zu 15 GFlops/W. Nicht schlecht im Vergleich zu Nvidias Tesla K80 mit 9,7 GFlops/W.

Neuer Rechenkünstler

Die jüngst auf dem Open Compute Summit in San Jose vom jungen Start-up Rex Computing vorgestellte neue Recheneinheit Rex Neo soll demgegenüber auf bis zu 64 GFlops/W kommen. Insgesamt schafft der mehr einem Vektorprozessor entsprechende Chip mit seinen 256 VLIW-Kernen zwar nur 256 GFlops bei 4 W, er ist aber auch – dank Verzicht auf jeglichen Cache – nur 0,1 mm2 im 28-nm-TSMC-Prozess groß, weniger als ein 7000tel des KNL. Mitte 2016 sollen die ersten Entwicklerboards erhältlich sein.

Eine Woche nach dem Open-Compute-Gipfel brachte sich an gleicher Stelle das erste Summit der OpenPower-Community ins Gespräch. Neben den ersten Servern von Tyan und Cirrascale (Seite 40) konnte man hier Prototypen vom CP1-Prozessor bewundern, den ersten OpenPower-Prozessor, der nicht direkt von IBM, sondern von Suzhou PowerCore stammt. Er ist in enger Zusammenarbeit mit IBM entstanden und enthält einen weitgehend unveränderten Power8, aber mit einer eigenen chinesischen Kryptoengine.

OpenPower war auch ein wichtiges Thema auf der CeBIT in Hannover. Erstmalig war IBMs HPC-Evangelist Dave Turek hierher angereist. Er lobte zwar die Kooperation mit Nvidia, brachte aber auch sein Credo vor, dass zukünftig nackte Gleitkommaperformance im HPC-Bereich eine immer kleinere Rolle spielen wird. Dinge wie Big Data Management und Storage dominierten immer mehr. Alte Benchmarks wie Linpack sind nach seiner Auffassung inzwischen völlig untauglich, andere müssen her. Typische Data-Management-Jobs wie Suchen, Sortieren, Verschieben oder Einfügen müssten letztlich da geschehen, wo die Daten liegen, also direkt im aktiven Speicher oder im Storage-System und nicht weit weg im Prozessor oder der GPU. (as@ct.de)

Quadro Problemo

Kaum hatte Nvidia ihr GTX-970-Debakel überwunden, brodelte es hinter den Kulissen erneut. Diesmal ging es um die sündhaft teure Profi-Karte Quadro M6000. Einer zuverlässigen Quelle zufolge hat es nämlich bei der Produktion einige Probleme gegeben. So hätte man schon Anfang Februar erste Karten mit einem Bestückungsfehler wieder retour schicken mussten. Okay, das kommt immer mal vor, aber auch bei der zweiten Lieferung offenbarten sich Tücken.

An sich laufen die Karten aus Charge 2 gut (siehe Test auf S. 64), aber wehe man koppelt zwei davon. Denn neben der Lüftereinlassung finden sich vier angehobene Bereiche, die im SLI-Kopplungsbetrieb mit der Backplate einer zweiten Karte kollidieren können – zumindest beim Einsatz in bestimmten Mainboards. Mit sanfter Gewalt bekommt man zwar die Karten noch in die Slots, aber mangels Platz für Zuluft dürfte dann nach einer Weile die zugesperrte Karte überhitzen.

Peng, schon mussten die 6000-Euro-Karten wieder zurück. Neugierige Leser werden sich jetzt fragen, wie denn Nvidias Qualitätsmanagement bei Profi-Hardware aussieht. Das wissen wir, ehrlich gesagt, auch nicht. Die dritte Charge der Karten soll eine geringfügig dünnere Backplate bieten und so auch im SLI-Modus problemlos funktionieren. Nun soll es im April erste Exemplare der Quadro M6000 zu kaufen geben.

Manche Profis murren ohnehin, denn die neuen Quadros sind zwar klasse fürs Rendern und Designen, aber bei doppeltgenauen Berechnungen schnarchlangsam. Einen echten Nachfolger gibts erst mit Pascal, frühestens 2016. Überdies hat Nvidia auch die Speichergröße bei 12 GByte belassen, während Käufer der halb so teuren FirePro W9100 aus dem Hause AMD gleich 16 GByte bekommen – inklusive deutlich höherer Double-Precision-Leistung.

Artikel kostenlos herunterladen

weiterführende Links

Anzeige
Artikel zum Thema
Anzeige