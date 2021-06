Auf der auch in diesem Jahr online abgehaltenen Supercomputerkonferenz ISC wurde zur Eröffnung – wie seit nunmehr 28 Jahren – die neue halbjährliche Rangliste (gemäß Linpack-Benchmark) der Supercomputer vorgestellt, die 57. Top500-Liste.

Lediglich ein neues System konnte sich in die Top10 der Liste eintragen: Perlmutter, ein HPE/Cray-System mit AMD Epyc 7763 "Milan" (Zen 3) und Nvidia A100, das mit 64,6 PFlops den Platz 5 eroberte. Das System steht am zivilen "National Energy Research Scientific Computing Center" (NERSC) in California, dem langjährigen Arbeitsort der beiden Top500-Mitautoren Erich Strohmaier (inzwischen im Ruhestand) und Horst Simon.

Perlmutter ist nach dem Physiker und Nobelpreisträger Saul Perlmutter benannt. Laut Nvidia erreicht der Rechner eine AI-Performance von 4 Exaflops (EFlops), aber nicht mit 64-Bit-Werten wie beim Linpack, sondern mit 16/32-Bit Mixed Precision auf seinen mehr als 6100 Tensor-Core-GPUs.

Top-Ränge

An der Top500-Spitze ist alles wie gehabt, ganz oben thront der japanische Fugaku aus dem Vorjahr mit 7,6 Millionen ARM-Kernen des A64FX-Prozessoren, der 442 PFlops erreicht.

Mit weitem Abstand dahinter folgen zwei schon etwas ältere IBM-Systeme aus dem Jahre 2018. Sie stehen in den amerikanischen nationalen Laboren in Oak Rigde und Livermore, beide bestückt mit Power9 und Nvidia Volta GV100 und sie erreichen 148,6 bzw. 94,6 PFlops. Noch etwas älter ist das chinesische System Sunway TaihuLight auf Platz vier mit 93 PFlops, das vor fünf Jahren die Liste anführte.

Bild 1 von 10 Top10 der 57. Top500-Liste vom Juni 2021 (10 Bilder) Nr. 1 Bleibt unangefochten die Nummer 1: Japans Fugaku am Forschungsinstitut Riken kommt ausschließlich mit ARM-Prozessoren (samt integrierten SVEs) auf 442 PFlops.

(Bild: Riken Center for Computational Science)

Sunway hat spezielle MPP-Prozessoren (ShenWei 26010 mit je 260 Kernen), die einem überdimensionalen Cell-Prozessor aus der IBM-Vergangenheit ähneln.

Von Perlmutter gerade so eben auf Platz 6 verdrängt wurde Nvidias hauseigenes Entwicklungssystem Selene mit AMD Epyc "Rome" (Zen 2) und A100 mit 63,5 PFlops. Dahinter folgt ein weiterer ehemaliger Spitzenreiter aus China aus der fernen Vergangenheit, der Tianhe2 (Milchstraße), der ab Juni 2013 drei Jahre lang die Liste mit 33,8 PFlops anführte. Dann schmiss man 2018 die Intel-Xeon Phi-Prozessoren raus und ersetzte sie durch chinesische Matrix 2000 -Akzeleratoren, so dass er mit 61,4 PFlops seither in der Liste steht.

Nunmehr auf Platz 8 folgt der deutsche und europäische Spitzenreiter, das JUWELS Booster Module am Jülicher SC. Das Atos/Bull-Sequana-System kombiniert AMD Epyc 7002 Rome mit Nvida A100 und erreicht damit 44,1 PFlops.

China-Pause

Man sieht schon an den Altersangaben, dass von China nicht viel zu berichten ist. Lediglich von Lenovo sind neun Industriesysteme (ThinkSystem HR650X mit älteren Intel Xeon-SP "Skylake") neu im mittelern Bereich ab Platz 147 in der Liste hinzugekommen, gleichzeitig sind aber 36 System unter die Mindestleistung von 1,52 PFlops (zuvor 1,32 PFlops) gefallen, die man braucht, um überhaupt auf die Liste zu kommen.

Von neuen großen Systemen an den chinesischen Universitäten und Forschungseinrichtungen findet sich also keine Spur, insbesondere nichts von den drei laufenden Exascale-Projekten, deren erste Systeme ja eigentlich für Ende 2020 angekündigt waren: Tianhe-3 auf Basis des chinesischen Armv8-Prozessors Phytium 2000 und Matrix 3000, Sunway Exascale mit erweiterten Shenwei-Prozessoren mit 520 Kernen (davon 512 einfach Rechenkerne) und Sugon, mit in Lizenz nachgebauten AMD-EPYC-Prozessoren von Hygon. Allerdings befinden sich diese beiden Firmen derzeit noch auf der weiterhin geltenden Bann-Liste von Donald Trump aus dem Jahre 2019.

Aber auch mit 186 von zuvor 213 System ist hat China immer noch die meisten Systeme in der Liste, vor den USA 133 (zuvor 113) und Japan mit 34 ( 28). Danach kommen gleichauf Deutschland und Frankreich mit je 18, Frankreich hat damit eins weniger Deutschland zwei mehr als in der letzten

In der installierten Performance legten die USA dank Perlmutter nochmal kräftig drauf und stehen mit 857 (zuvor) PFlops an der Spitze, vor Japan 635( 594) und China 538 (565).

Deutschland legt weiter zu

Deutschland steht mit 168 (134) PFlops weiterhin auf Platz vier. Mit dabei sind zwei neue Rechner mit NECs Vektor-Engine Aurora Tsubasa beim Deutschen Wetterdienst mit 3,9 PFlops (Platz 106) und 2,6 PFlops (Platz 181). Das sind die einzigen solcher Maschinen außerhalb Japans, wo ebenfalls zwei solcher Vektorsysteme installiert sind.

Insgesamt konnten hierzulande sieben Neusysteme einziehen. Jülich hat ein weiteres Modul neben dem europäischen Spitzenreiter in Betrieb genommen, das JURECA Data Centric Module mit 9,3 PFlops (Platz 44). Ansonsten hat Lenovo in Deutschland eine guten Absatz mit vier ThinkSystemen SD650 gehabt, zwei bei Max-Planck-Instituten (Raven) und zwei (Horeka) beim Karlsruher Institut für Technologie KIT, die zwischen 2,3 und 8,6 PFlops liefern.

Lenovo ist nicht nur in Deutschland die aktuell beliebteste Wahl, sondern kann sich weltweit mit nunmehr 185 (184) vor HPE/Cray 78 (77), Inspur 57 (66) und Sugon 39 (51) behaupten. Bei Sugon macht sich die seit 2019 geltende Bann-Liste bemerkbar: seitdem hat der chinesische Hersteller hat kein neues System mehr in die Liste eingebracht. Das einzige größere europäische Systemhaus Atos/Bull konnte gut von 31 auf 36 Systemen zulegen und belegt nun Platz 5.

IBM macht nicht mehr viel, weder bei den Systemen noch bei den Power-Prozessoren. Das letzte neue System hielt vor einem Jahr mit dem italienischen Marconi-Rechner Einzug. Nun sind nur noch 7 (9) Power-Systeme platziert, der letzte BlueGene-Mohikaner ist inzwischen aus der Liste herausgefallen, genauso wie der letzte Sparc-Rechner. Aber immer noch wird der ururalte chinesische Tianhe 1 mit Intel-Nehalem gelistet – ob der wirklich noch in Betrieb ist, darf bezweifelt werden.