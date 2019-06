Die 53. Top500-Liste der Supercomputer verzeichnet nur noch Systeme, die mehr als 1 Billiarde Gleitkomma-Rechenoperationen pro Sekunde schaffen. Genauer geht es um 1 Petaflops (PFlops) an "doppelt genauen" (FP64-)Berechnungen im Benchmark Linpack. Die internationale Supercomputer-Szene arbeitet mit Hochdruck an Exaflops-Systemen, von denen einige Vorläufer auch in der aktuellen Top500-Liste auftauchen, die zur Eröffnung der Internationalen Supercomputer-Konferenz ISC 19 in Frankfurt herauskam.

Erstmals ist ein Cloud-System in die Liste eingezogen: Amazon EC2 C5 Instance Cluster us-east-1a. Bestückt mit Xeon Platinum 8124M mit 18 Kernen, erreichte die Amazon-Cloud mit 41.472 Kernen 1,93 PFlops und damit Platz 136.

Acht Systeme mit Intels neuen "Cascade Lake"-Xeons (mit 20 bis 28 Kernen) haben es bereits in die Top500 geschafft. Ein "Überraschungssystem" mit AMDs kommendem Epyc "Rome" ist jedoch noch nicht dabei. Auch ein weiteres ARM-System neben HPEs Astra findet man bisher nicht.

Ein neues System in den Top10

Die Liste führt weiterhin der amerikanische Summit mit Power9/Nvidia Tesla V100 am Oak Ridge National Laboratory (ORNL) an. Er hat gegenüber der letzten Top500-Liste vom November 2018 noch ein paar Racks hinzubekommen und verfügt nun über 2,4 Millionen Power9-Kerne sowie 2,2 Millionen Nvidia Streaming Cores. Damit stieg seine Performance auf 143,5 PFlops. Platz 2 hält wie gehabt sein kleinerer Power9-Kollege am Lawrence Livermore National Laboratory (LLNL) mit 94,6 PFlops. Auch Platz 3 und 4 sind gleich geblieben: die beiden chinesischen Systeme Sunway TaihuLight mit 93 und Tianhe-2A mit 61,4 Pflops.

Dann aber folgt auf Platz 5 ein Neuling: der Frontera am Texas Advanced Computing Center in Austin. Das Dell-C4130-System kommt ohne Beschleuniger mit 448.448 Xeon Cascade-Lake-Kernen auf 23,516 PFlops und darf sich damit schnellster "Universalrechner" nennen, vor dem SuperMUC-NG in München, der mit 19,5 PFlops Platz 9 belegt.

Der Trend hin zu Beschleunigern hat sich etwas verlangsamt. Intel ist ausgestiegen und hat den Xeon Phi eingestellt (und den Xe erst für 2020 avisiert) und Nvidia musste einen, allerdings nur leichten, Verlust in Kauf nehmen: 125 der 500 Top-Systeme sind mit Nvidia-GPUs bestückt, zuvor waren es noch 127.

"Gallier" vorn, "Goten" verlieren

92 Systeme sind neu in die Liste eingezogen, alle mit Intel-Prozessoren bestückt – alle? Nein das wehrbereite gallische Dorf ist hier das französische Power9-System Pangea III, das beschleunigt mit Nvidia Tesla V100 mit 17,8 PFlops Platz 11 erklimmt.

Aus Deutschland ist nur ein neues System hinzugekommen, der CLAIX an der Universität Aachen, der sich bei den reinen Unirechnern mit 2,5 PFlops auf Platz 92 und damit vor den – ebenfalls von NEC aufgebauten – Mogon II der Johannes Gutenberg-Uni in Mainz schiebt (2 PFlops, Platz 131). Weiterhin klar an der Spitze ist hierzulande der schon erwähnte SuperMUC-NG von Lenovo am Leibniz-Rechenzentrum in München/Garching mit 19,5 PFlops weit vor dem Bull-Sequana-Rechner Juwels Module 1 am Jülicher SC mit 6,2 PFlops.

Bild 1 von 12 Top10 der Top500-Liste vom Juni 2019 (12 Bilder) Nr. 1 Unangefochten weiterhin die Nr. 1: Der Summit am Oak Ridge National Lab mit Power9 und Nvidia V100 hält die Spitze mit 148,6 PFlops

(Bild: Oak Ridge National Lab)

Insgesamt ist Deutschland aber ziemlich abgefallen: Hatte man vor einem halben Jahr noch 17 Systeme mit 60,5 PFlops platziert, sind es jetzt nur noch 14 mit 59,1 PFlops. In der hier ausgewerteten Vorabversion der Top500-Liste wird aber noch der alte SuperMUC Phase 1 am Leibniz-Rechenzentrum aufgeführt, der eigentlich schon längst deinstalliert sein müsste – dann fiele Deutschland noch weiter um 2,9 PFlops zurück und läge stückzahlmäßig gleichauf mit Irland oder den Niederlanden. Unsere Nachbarn und Lieblingsfußballgegner haben jedenfalls kräftig aufgerüstet, ihre Supercomputerleistung hat sich gegenüber der vorigen Liste mehr als verdoppelt. Der geplante Hawk am HLRS in Stuttgart könnte aber schon auf der 54. Top500-Liste für Schub sorgen: Er soll gleich 24 PFlops drauflegen.

Frankreich – als Atommacht auf Supercomputer für Waffensysteme angewiesen – übernimmt in Europa mit 19 Systemen und 67,1 PFlops klar die Führung, Großbritannien hat 18 Systeme mit 40 PFlops und Italien nur 5, dafür recht kräftige Systeme mit insgesamt 30 PFlops.

Der schnellste Supercomputer in Europa bleibt jedoch weiterhin der schweizerische Piz Daint (Cray XC50, Nvidia P100) am CSCS in Lugano mit 21,2 PFlops auf Platz 6. Mit dabei ist nun auch wieder Österreich mit einem Lenovo ThinkSystem an der technischen Universität Wien, der sich mit 2,7 PFlops und Platz 82 noch vor den deutschen Unis platziert.

Weltweit hat China mit 219 Systemen (zuvor 229) etwas an die USA (119, zuvor 108) verloren, aber weiterhin fast doppelt so viele Systeme in der Liste. Die amerikanischen Systeme haben dank der beiden Spitzenreiter allerdings deutlich mehr Power, sie kommen zusammen auf 600 PFlops, die chinesischen "nur" auf 466. Auf dem dritten Platz folgt Japan mit 29/117,2 (zuvor 31/109,4 PFlops).

Im kontinentalen Vergleich ist die Verteilung der Rechenpower gegenüber der letzten Liste weitgehend gleich geblieben: Asien führt mit 42,8 % vor Amerika (inklusive Kanada und Brasilien) mit 38,6 % und Europa mit 18 %. Der kleine Rest geht mit 0,55 % nach Ozeanien (5 Rechner in Australien) und mit 0,15 % nach Afrika (3 Rechner in Südafrika).

HPE trumpft mit Cray-Power auf

Hieß es beim letzten Mal noch: "HPE fällt zurück", so hat HPE das inzwischen durch einen finanztechnischen Trick kompensiert: Man hat im letzten Monat einfach Cray aufgekauft. Dieser "Trick" hat ja bei HP Tradition: SGI: 2016, Compaq: 2002, Convex: 1995, Apollo: 1989 ...

Die alte HPE fiel zwar stückzahlmäßig von 45 auf 40 Systeme weiter zurück, kann jetzt aber 39 Cray-Systeme hinzubuchen. Und die haben es bekanntlich in sich. Mit der gemeinsamen Power von 316 PFlops liegt HPE/Cray damit vor dem mit 173 Systemen (zuvor 142) zwar stückzahlmäßig weit vorausliegenden Konkurrenten Lenovo, aber deren Gesamtleistung beträgt nur 306 PFlops. HPE und Lenovo müssen sich jedoch dank der beiden Spitzensysteme Summit und Sierra IBM geschlagen geben, die auch ohne den fraglichen SuperMUC Phase 1, der ohnehin jetzt zu Lenovo gehört, mit nur 13 Systemen auf 321 PFlops kommen.

Im chinesischen Vierkampf konnte sich Lenovo deutlich von der Konkurrenz absetzen, alle anderen haben verloren: Inspur (71, zuvor 86), Sugon/Dawning (57, zuvor 63) und Huawei (7, zuvor 14). Huawei litt dabei sicherlich unter der Kampagne der US-Regierung gegen den Konzern. Ansonsten spielen noch Bull (22, zuvor 21) und DellEMC (17, zuvor 14) eine größere Rolle.

Intel legt weiter zu

Intel hat noch ein bisschen zugelegt: In 478 Systemen (zuvor 476) stecken Xeons. Neben dem einzigen AMD-Epyc-System aus chinesischer Produktion findet man noch zwei alte Opteron-Systeme sowie eines mit ARM Cavium Thunder 2, den chinesischen Sunway TaihuLight mit hausgemachten ShenWei-Prozessoren sowie sechs japanische Sparc-Systeme und 13 mit Power/PowerPC. Dominanter als Intel ist nur noch Linux, das schon vor eineinhalb Jahren 100 Prozent erreicht hat – mehr geht nicht!

Insgesamt ist die Gesamtperformance der Top500-Liste lediglich um 10 Prozent auf 1,56 EFlops gestiegen, der zweitschlechteste Anstiegswert in der über 25-jährigen Geschichte der Liste überhaupt. Interessant ist auch, zu schauen, wie lange es zurückliegt, dass die gesamte Top500-Performance geringer war als die des aktuellen Spitzensystems. Bis zum Juni 2016 waren das regelmäßig etwa 7 bis 8,5 Jahre. In den letzten drei Jahren stieg dieser Wert aber um 2 Jahre auf 10 bis nunmehr 11. Im Juni 2008 lag die Gesamtleistung der Top500 mit 121 PFlops unter der des Summit jetzt. Im Juni 2018 wurde die 1-EFlops-Marke als Gesamtleistung überschritten – danach dürften wir eigentlich erstmals gegen 2028 mit Exaflops-Rechnern rechnen.

Aber die Milliardeninvestitionen weltweit werden das wohl deutlich beschleunigen. So soll der nächste Rechner "Frontier" am Oak Ridge National Laboratory mit AMD Epyc Zen-3 (Milan) schon 2021 etwa 1,5 EFlops liefern. Hinzu kommt Aurora am Argonne National Lab, den Cray/HPE mit Intels geplanten HPC-Xeons und vielleicht mit Xe-GPUs mit mindestens 1 EFlops etwa zur gleichen Zeit aufbauen soll. Und die Chinesen haben auch einiges in petto. Und so wird man in nicht allzu ferner Zeit nicht mehr von Exa-, sondern von Zetta-Scale hören.

Energieeffizienz und Speicher-Speed

Das Top500-Team verwaltet inzwischen auch die Resultate für die Energieeffizienz (Green500) und die vom HPCG-Benchmark, der sich weit stärker an der Speicherperformance orientiert als der für die Top500 zuständige Linpack. Doch hier hat sich gegenüber November 2018 fast nichts getan – hier nur das Gesamtresultat: Die mittlere Energieeffizienz beim Linpack ist von 3,0 GFlops/Watt auf 3,2 GFlops/Watt gestiegen und die mittlere HPCG-Performance von 211,2 auf 213,3 TFlops.

Top 10 der 53. Top500-Liste der Supercomputer Platz (vor. Liste) Rechner (Hersteller) Betreiber Land CPU-Cores GPU-Cores Linpack Rmax (PFlops) Energie-effizienz (GFlops/W) HPCG (TFlops) 1 (1) upgrade Summit (IBM) Oak Ridge National Lab USA 9216 × 22 Power9, 3,07 GHz 27.648 × 80 Tesla V100 148,6 14,72 2925,75 2 (2) Sierra (IBM) Lawrence Livermore National Lab USA 8640 × 22 Power9, 3,1 Ghz 17.280 × 80 Tesla V100 94,64 12,72 1795,67 3 (3) Sunway TaihuLight (NRCPC) National Supercomputing Center in Wuxi China 40.960 × 260 ShenWei 26010, 1,45 GHz 0 93,01 6,05 480,84 4 (4) Tianhe-2A (NUDT) National Supercomputing Center in Guangzhou China 35.584 × 12 Xeon E5-2692v2, 2,2 GHz 35.584 × 128 Matrix 2000 61,44 3,33 k.A. 5(-) Frontera (DellEMC) Texas Advanced Computing Center (TACC) USA 16016 x 28 Xeon Platinum 8280, 2,7 GHz 0 23,52 k.A. k.A. 6 (5) Piz Daint (Cray) Centro Svizzero di Calculo Scientifico (CSCS) Schweiz 5704 × 12 Xeon E5-2690v3, 2,6 GHz (+2862 × 18 Xeon E5-2695v4) 5704 × 56 Tesla P100 21,2 10,4 486,39 7 (6) Trinity (Cray) DOE/NNSA/LANL/SNL USA unbekannte Anzahl Xeon E5 + Xeon Phi 7250. 979.072 Kerne insgesamt 0 20,2 2,66 546,12 8 (7) ABCI AIST Japan 2176 × 20 Xeon Gold 6148, 2,4 Ghz 4352 × 80 Tesla V100 19,88 12,05 k.A. 9 (8) SuperMUC-NG Leibniz-Rechenzentrum Deutschland 12.744 x 24 Xeon Platinum 8174 0 19,48 k.A. 207,84 10 (11) upgrade Lassen (IBM)

Lawrence Livermore National Lab USA 1584 x 22 IBM Power9 3168 x 80 Tesla V100 18,20 13,07 k.A.

(as)