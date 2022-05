Nun ist er da, der erste Exascale-Rechner, jedenfalls der erste, der für die neue 59. Top500-Liste gemeldet wurde: der US-amerikanische Frontier am Oak Ridge National Lab (ORNL). Mit 1,1 EFlops im doppeltgenauen Linpack-Benchmark (1,68 EFlops Spitzenleistung) steht er souverän an der Spitze, fast dreimal so schnell wie der bisherige Spitzenreiter Fugaku aus Japan mit 442 Petaflops. Auf Platz 3 folgt mit 152 PFlops Europas neuer Schnellster Lumi, der zwar in Finnland sein Zuhause hat, aber ein Gemeinschaftswerk der skandinavischen Länder, Belgien, Schweiz, Polen und Tschechien ist. China ist allerdings derweil aus der Top500-Liste ausgestiegen.

Frontier und Lumi sind beides HPE/Cray-EX-Systeme, ausgestattet mit AMD Epyc (Zen 3 Milan beziehungsweise Trento), AMD Instinct MI250X als Rechenbeschleuniger und HPE Slingshot als Interconnect. Schon am Vortag der ISC-Konferenz für High-Performance-Computing, die diesmal wieder „in persona“ im Hamburger CCH bis Donnerstag läuft, ließ HPE zusammen mit AMD und ORNL im Hotel Grand Elysee die Sektkorken knallen.

Hinzu kommt, dass sich mit Adastra gleich noch ein drittes Cray-EX-System auf Platz 10 mit 46 PFlops neu in die Top10 der Liste eintragen hat, das in Frankreich von den beiden „Grand-National“- Einrichtungen GENCI und CINES betrieben wird und ebenfalls AMD-Technik verwendet. Und auf Platz 29 gibt es zudem am ORNL noch einen kleinen Bruder des Frontier namens Frontier TDS – auch Crusher genannt.

Bild 1 von 10 Top10 der 59. Top500-Liste vom Mai 2022 (10 Bilder) Nr. 1 Mit 1,1 Exaflops die neue Nummer 1: Frontier am Oak Ridge National Laboratory der USA. Der Abstand auf Fugaku mit 0,442 EFlops ist gewaltig.

(Bild: HPE/Oak Ridge National Laboratory)

Beeindruckende Effizienz

All diese Cray-EX235a-Systeme mit Milan und MI250X können mit beeindruckenden Energieeffizienzen von über 50 GFlops/Watt aufwarten, der kleine Frontier TDS gar mit 62,2 GFlops/Watt vor dem großen Bruder, der mit 52,2 GFlops/Watt das hochgesteckte Ziel für ExaScale von maximal 30 Megawatt einhalten kann. Weiterhin gibt es noch drei weitere Cray-EX235a-Systeme an US-Laboren auf den Plätzen 123, 135 und 200, allerdings ohne Effizienzangabe.

Die Daten von Frontier sind schon beeindruckend: 74 Racks mit Warmwasserkühlung, jedes Rack 8000 amerikanische Pfund schwer, mit insgesamt 9408 CPUs und 37.632 GPUs. Dazu 90 km Slingshot-Verkabelung, 9,2 PByte Hauptspeicher (davon 4,6 PByte High Bandwidth Memory/HBM), 716 PByte Storage. Die Aufbauzeit betrug 7 Monate. Dabei scheinen für den Linpack-Lauf noch nicht alle GPUs eingesteckt gewesen zu sein, denn aus den Angaben in der Top500-Liste errechnen sich „nur“ 31.790 GPUs. Ohnehin hat das ORNL noch Reserven an Platz, Stromversorgung und Kühlung, kann also noch in Richtung 2 Exaflops aufstocken.

Rund 3 Stunden hat der Rechner am Linpack-Benchmark geackert, die Energieaufnahme stieg dabei sprunghaft um 15 auf 29 MW. So hat der Linpack-Lauf also etwa 87.000 KWh geschluckt, was schon eine Kleinigkeit kostet. Wie HPE aber betont, ist der Linpack-Lauf über die ganze Anlage als hervorragender Stabilitätstest unverzichtbar.

Die Performance für den HPCG-Benchmark ist derzeit allerdings noch nicht berauschend. Für Frontier ist noch gar kein Wert angegeben, für LUMI und Adastra sind diese recht mickrig. Offenbar ist AMD noch nicht dazu gekommen, diesen Benchmark für Instrinct MI250X anzupassen.

Frontier von innen, allein 70 km Kabel fürs Interconnect Slingshot mussten verlegt werden (Bild: ORNL)

Sanktionen

Aus China wurde kein einziges neues System mehr gemeldet, im letzten Jahr auch nur ein paar Industrie-Systeme von Lenovo. Auslöser dürften die seit April 2021 geltenden US-Sanktionen gegen China sein mit den Exportverboten von High-Tech an viele chinesische Firmen. Auch aus Russland gabs nichts Neues, russische Firmen sind aus bekannten Gründen ja seit März dieses Jahres auf der Sanktionsliste. Zu den sanktionierten Firmen gehört auch T-Platforms, die den Lomonosov 2 an die gleichnamigen Moskauer Uni geliefert hat (derzeit auf Platz 240).

Es gilt als sicher, dass in China bereits geraume Zeit mindestens zwei Exascale-Systeme in Betrieb sind, das erste, der „Sunway TaihuLight 2“, wahrscheinlich schon seit März 2021. Nach den Erkenntnissen der gewöhnlich gut unterrichteten HPC-Onlineplattform The Nextplatform wurden Kernzahl der Sunway-Prozessoren auf 512 Rechen- und 12 Kontrollprozessoren verdoppelt und der SW52020 genannte Prozessor in 14-nm-Technik hergestellt. Die Architektur erinnert an IBMs Cell-Prozessor, der 2008/2009 im „Road Runner“ die Nr. 1 der Top500 befeuerte, nur hat der SW52020 64-mal so viele Rechenkerne.

Daneben dürfte ein auf ARMv8-Architektur basierter Rechner Tianhe-3, unterstützt von selbstentwickelten Beschleunigern Matrix 2000+, ebenfalls den Exascale-Bereich erreicht haben. Die Prozessorarchitektur von Phytium wurde unter dem Namen Mars auf der Hot-Chips-Konferenz 2016 in Cupertino vorgestellt, die konkreten Prozessoren laufen nun unter „Feiteng“. Allerdings musste der taiwanische Hersteller TSMC die Fertigung für Phytium einstellen, da auch diese Firma auf die US-Sanktionsliste vom April 2021 kam.