Cray-Supercomputer XC40 mit Haswell-EP

Das HPC-System XC40 ermöglicht Installationen mit mehr als 1 Million CPU-Kernen. Außer den jüngsten Xeons und DDR4-RAM baut Cray auch SSDs und einen schnelleren Interconnect ein.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 69 Beiträge
Von

Cray XC40 in der Version mit Flüssigkeitskühlung (schmale Schränke).

(Bild: Cray)

Vom neuen Supercomputer XC40 hat Cray schon die ersten Installationen verkauft, etwa das 174-Millionen-Dollar-System Trinity für die Atomwaffenforschung. Nun stellt Cray die technischen Details des Neulings vor, der das zwei Jahre alte System XC30 ablöst. Wichtigste Änderung sind die Xeons der Baureihe E5-2600 v3 alias Haswell-EP, die mehr CPU-Kerne besitzen und DDR4-Hauptspeicher ansteuern. Laut Cray verdoppelt sich die maximal mögliche Rechenleistung der XC40 im Vergleich zur XC30, im Prinzip sind Systeme mit mehr als 1 Million CPU-Kernen machbar. Weiterhin gibt es aber auch Hybridsysteme mit Xeon Phi oder Nvidia Tesla K40. Neu sind SSDs, die Cray als "DataWarp Accelerators" verkauft und per PCIe 3.0 mit den Systemen koppelt.

Wie bei der XC30 gibt es die XC40 in einer Version mit Flüssigkeitskühlung und in einer abgespeckten Version für Luftkühlung. Außerdem hat Cray noch das schwächere Cluster-System CS400 mit Haswell-EP angekündigt.

Cray XC40 (6 Bilder)

Cray XC40

Ein XC40-Supercomputer besteht aus mehreren "Cabinets", von denen jedes rund 1,5 Tonnen wiegen kann und bis zu 90 Kilowatt Leistung umsetzt.
(Bild: Cray)

Bei der XC40 sitzen Luft-Wasser-Wärmetauscher zwischen den einzelnen Rechnerschränken (Cabinets); die Kühlluft strömt waagerecht durch die Chassis in den Cabinets. In der Maximalbestückung sind 90 Kilowatt Abwärme pro Cabinet möglich. Je Cabinet lassen sich drei Chassis montieren, die wiederum 16 Blades (8 Blade-Paare) aufnehmen. Jedes Blade kann mit zwei Processor Daughter Cards (PDCs) bestückt sein, aber auch gemischt mit je einer PDC und den erwähnten Beschleunigerkarten. Jedes Blade besitzt einen Aries-Chip für den Dragonfly-Interconnect, der für eine enge Verschaltung aller Komponenten sorgt.

Bei maximaler Bestückung mit PDCs sind 384 Prozessoren pro Cabinet möglich. Zunächst kommt offenbar höchstens der 16-Kern-Xeon E5-2698 v3 mit 2,3 GHz Taktfrequenz zum Einsatz, weil Cray maximal 6144 Kerne pro Cabinet und 225 TFlops an Dual-Precision-Gleitkomma-Rechenleistung verspricht. Letzteres entspricht jenen 588 GFlops, die jeder Xeon E5-2698 v3 mit AVX2-Code maximal liefern könnte. (ciw)