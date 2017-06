Unter den Top10 gibt's Neues nur zum Piz Daint aus der Schweiz. Ansonsten machen erste Skylake-SP-Systeme auf sich aufmerksam, mit vergleichsweise moderater Performance.

Die größte Supercomputer-Nation der Welt ist nicht China, nicht die USA und schon gar nicht Deutschland – nein, mit großem Vorsprung steht die Schweiz an der Spitze – jedenfalls, wenn man die installierte Rechenleistung mit dem Bruttoinlandsprodukt (BIP) gewichtet. Das kann man aus der zum Auftakt der ISC 2017 in Frankfurt veröffentlichten neuen Top500-Liste der Supercomputer herausrechnen.

Mit 32 KFlops/$ führt die Schweiz danach vor China (20,1 KFlops/$), Saudi Arabien (15,7 KFlops/$) und den USA (13,6 KFlops/$). Dann folgen Japan (12,6 KFlops/$), Polen (12,2 KFlops/$), Großbritannien(11,7 KFlops/$) und erst auf Platz 8 Deutschland (10,8 KFlops/$). Pro Kopf sähe das noch viel eindeutiger für die Schweiz aus, Deutschland stünde hier auf Platz 4, China entschwände auf Platz 17.

In der Schweiz kann man bekanntlich gerade im finanziellen Bereich gut rechnen, hat doch das Marktforschungsinstitut IDC einen Return of Investment von 515 Dollar für jeden in HPC investierten Dollar ausgewiesen. Der wichtigste Aktivposten in der Schweiz ist der Cray-XC50-Supercomputer Piz Daint der ETH Zürich am CSCS in Lugano, der gegenüber dem letzten Jahr kräftig auf 5320 Nvidia-P100-Karten aufgerüstet wurde – mehr als ursprünglich verkündet. Mit 19,6 PFlops ist Piz Daint nun die Nummer 3 in der neuen Top500-Liste, relativ zum BIP wäre das dreieinhalb Mal mehr als beim neuen und alten Spitzenreiter, den Sunway TaihuLight mit 93 PFlops. Und dabei haben die 1431 zusätzlichen Broadwell-EP-Knoten mit je zwei CPUs gar nicht mitgerechnet.

Spitzenklasse

Außer dem großen Sprung des Piz Daint um fünf Plätze nach vorne hat sich bei den Top 10 der Liste nichts getan. Platz 2 hält der schon recht betagte Tiange-2 mit 33,8 PFlops. Auf Platz 4 folgt der noch betagtere Titan am Oak Ridge National Lab mit 17,6 PFlops. Deutschlands Schnellster ist weiterhin das Cray-XC40-System Hazel Hen am HLRS in Stuttgart, mit 5,6 PFlops auf Platz 17.

Damit hat die USA zum zweiten Mal in der 24jährigen Geschichte der Top500-Liste keinen (gemeldeten) Supercomputer unter den Top 3. Rechner der NSA, etwa der in Bluffdale, sowie die Rechenzentren von Google, Amazon, Microsoft … werden ja nicht gemeldet.

1996 lagen mal drei japanische Systeme vorn, das galt in den USA als nationale Katastrophe. Spätestens ab 2018 soll das gemäß des Exascale Computing Projects (ECP) des US-Energieministeriums DOE wieder anders aussehen, aber auch China, Japan und die EU (samt Schweiz) haben milliardenschwere Förderprogramme aufgelegt. Die Schweiz ist dabei in Europa eine treibende Kraft, war Gründungsmitglied der Partnership for Advanced Computing in Europa (PRACE), ist – neben Frankreich, Deutschland, Italien und Spanien – eines der fünf „Hosting Members“ und nimmt an der im März 2017 ratifizierten PRACE 2 teil. Europäische Wissenschaftler können via PRACE damit auch auf Piz Daint rechnen. Ein gutes Vorbild für Großbritannien, wie die Zusammenarbeit auf diesem Gebiet auch nach dem Brexit aussehen könnte.

Die USA haben mit 169 Systemen (zuvor 171) aber wieder die meisten Systeme in der Liste vor China (160, zuvor 171), Japan (38, zuvor 27), Deutschland (28 zuvor 31), Frankreich (18, zuvor 20) und Großbritannien (17, zuvor 13). Auch in Rechenleistung ausgedrückt führen die USA mit 255 PFlops vor China (235 PFlops), Japan (62 PFlops), Deutschland (37 PFlops) und Großbritannien (30 PFlops). Westeuropa insgesamt kommt auf 161 PFlops.

Bei den Herstellern liegt HPE mit 144 (zuvor 140) Systemen stückzahlmäßig klar vorn, vor Lenovo (88, zuvor 92) und Cray(57, zuvor 56). Allerdings dominiert Cray bei den großen Systemen und liegt so in der Performance mit 21 Prozent der Gesamtleistung vor HPE (16,5 Prozent) und – dank des Tabellenführers SunWay TaihuLight – folgt dann das National Research Center of Parallel Computer Engineering & Technology (NRCPC) mit 12,5 Prozent. Die Gesamtleistung ist dabei gegenüber der letzten Liste um 32 Prozent auf 749 PFlops gestiegen.

Neulinge

108 Neusysteme sind in die Liste eingezogen, bis auf zwei Power8-Systeme alle mit Intel-Prozessoren bestückt. Darunter sind bereits drei Rechner mit Intels noch gar nicht offiziell erschienenem Skylake-SP-Prozessor; neben Intels eigenem Testrechner Endeavor I mit Xeon Gold 6148 (20 Kerne) sind das zwei Systeme in Europa. Mit 6,6 PFlops auf Platz 13 kommt das neue Mare-Nostrum-System des Barcelona SC mit Platinum 8160 (24 Kerne), aufgebaut von Lenovo. Etwas weiter hinten mit 1,7 PFlops auf Platz 65 steht das HPE-Apollo-XL230k-System Quriosity bei BASF in Deutschland. Neben Quriosity kam in Deutschland ein HPE-Cluster (504 TFlops, Platz 412) bei einem nicht benannten Datenzentrum neu hinzu sowie der QPACE3 mit 449 TFlops (Platz 483) – ein Xeon-Phi-Rechner der Unis Wuppertal und Regensburg, aufgebaut von Fujitsu.

Mit 62 bis 66 Prozent Effizienz im Vergleich zum theoretischen Linpack-Spitzenwert Rpeak kann sich Skylake-SP mit AVX512 allerdings nicht so gut ins Szene setzen, wie erwartet. Zum Vergleich: Die ebenfalls mit Omni Path verknüpften Broadwell-Systeme liegen zwischen 82 und 94 Prozent. Das ergibt bei den Xeon-Goldtypen etwa 50 GFlops/Core, mit gleichem Grundtakt laufende Broadwell-EP-Systeme kommen auf 32 GFlops/Core.

Andere Benchmarks

AMDs neuer Serverchip Epyc ist noch nicht dabei – er ist mit seinen nur 128-bittigen Recheneinheiten beim Linpack-Ranking auch ziemlich außen vor. In die Top500 sind jetzt daher auch die Ergebnisse des HPCG-Benchmarks, sofern vorhanden, aufgenommen worden. Bei dem geht vor allem die Speicherperformance ein, wobei der morgen offiziell vom Stapel laufende Epyc mit seinen acht Speicherkanälen ordentlich punkten kann. In der HPCG-Disziplin steht derzeit Fujitsus K-Computer klar an der Spitze vor dem Tianhe-2, Piz Daint und dem OakForest-PACS, eine Fujitsu Primergy mit Xeon Phi. Erst danach folgt der Top500-Spitzenreiter Sunway TaihuLight. Laut CSCS-Direktor Thomas Schulthess liegt Piz Daint bei realen Anwendungen noch weiter vorne: Bei COSMO für die Metereologie, etwa für die Wettervorhersage, soll Piz Daint TaihuLight um fast Faktor 3 abhängen.

Neu in die Top500-Liste aufgenommen ist auch die Energieeffizienz gemäß Green500. Für 370 der 500 Systeme hat man inzwischen Daten. Hier führen 13 mit Nvidia Tesla P100 bestückte Systeme die Liste an, darunter vier Nvidia-DGX-1-Systeme.

Die ersten vier Plätze belegen japanische Rechner. An der Spitze steht der Tsubame 3, ein modifiziertes SGI-ICE-System (jetzt HPE) am GSIC-Center in Tokio mit 14,11 GFlops/Watt. Von den Großsystemen innerhalb der Top 50 dominiert wiedermal der schweizerische Piz Daint auf Platz 6 mit 10,4 GFlops/Watt. Er ist auch der einzige im oberen Bereich der Liste, der mit einer hochpräzisen Messung gemäß Qualitätslevel 3 aufwarten kann – wie man es ja so von Schweizern erwartet …