In den USA arbeiten die Forschungseinrichtungen Oak Ridge, Argonne und Lawrence Livermore National Labs (CORAL) mit Hardware-Herstellern seit Jahren an neuen Großrechnern, um die Grenze von 1 Exaflops bei doppelt genauen wissenschaftlichen Berechnungen zu knacken. Ein Exaflops (EFlops) sind 10^18 Gleitkommaoperationen pro Sekunde – oder eine Trillion, eine Milliarde Milliarden oder eben eine 1 mit 18 Nullen.

Nun hätte sich die Gelegenheit ergeben, so die Betreiber, El Capitan von den projizierten 1,5 auf über 2 EFlops zu beschleunigen – dabei handele es sich nicht um eine neue Vorgabe seitens des U.S. Department of Energy (DOE, auch für das atomare Arsenal der USA zuständig). Der Kostenrahmen bleibe bei den angekündigten 600 Millionen US-Dollar.

Den kohärenten Interconnect (nicht nur) zwischen Epyc und Radeon-MI übernimmt Infinity Fabric 3. (Bild: AMD)

Effizienz oberstes Gebot

Exascale-Supercomputer sind etwa fünfmal schneller als der heute schnellste Supercomputer Summit. El Capitan käme auf die sechzehnfache Leistung der zweit- und drittplatzierten der Top500-Liste der weltschnellsten Computer, Sierra (USA) und Sunway TaihuLight (China). Den Supercomputer Sierra soll El Capitan beerben.

Der Energieverbrauch soll die heute üblichen Werten von 10 bis 20 Megawatt nicht noch einmal drastisch überschreiten – zumindest nicht in Relation zum Rechendurchsatz. Anvisiert ist ein Maximum von 40 Megawatt für Exascale-Systeme. HPE rechnet derzeit damit, eher Richtung 30 als Richtung 40 Megawatt zu kommen.

Bereit für Kilowatt-Prozessoren

Unter den Beteiligten der Exascale-Initiative sind auch die Lawrence Livermore National Labs (LLNL) und die National Nuclear Security Administration (NNSA), die HPE (inklusive ex-Cray und ex-SGI) mit dem Bau des Supercomputers El Capitan beauftragt haben. HPE steuert die mit Cray eingekaufte "Shasta"-Systemarchitektur und den "Slingshot"-Interconnect bei.

Die Racks, in denen die einzelnen Compute-Module untergebracht sind, verfügen über direkte Flüssigkeitskühlung (DLC) und sollen auch für kommende Prozessoren im Kilowatt-Bereich gerüstet sein. Ob man damit die Host-CPUs oder doch eher Beschleunigerkarten meinte, ließ man offen.

Fakt sei jedenfalls, dass Moore's Law nur noch einige wenige Generationen zu den gewohnten Leistungssprüngen verhülfe. Danach müsse man andere Wege finden, um die weiterhin nötige Steigerung der Performance zu erreichen. Denn, so war man sich einig, an neuen, heterogenen Rechenmodellen, gehe über kurz oder lang kein Weg vorbei. Dabei sind nicht nur die Rechenkerne und -beschleuniger als solches gemeint, sondern auch ein Umdenken bei der Software- und Speicherumgebung gefordert.

Die Epyc-Serverprozessoren 7004 "Genoa" bekommen Zen-4-Kerne - den Nach-Nachfolger aktueller AMD-CPUs. (Bild: AMD)

El Capitan mit AMD Zen-4-Kernen

Als Herzstück der bereits 2019 angekündigten Rechenanlage, die 2022 in Betrieb gehen soll und 2023 die finale Ausbaustufe erreichen soll, haben die Betreiber und Entwickler zusammen mit AMD nun Serverprozessoren aus AMDs Epyc-Baureihe bestätigt. Über deren genaue Anzahl bewahrt man weiterhin Stillschweigen. Sie sollen mit Zen-4-Kernen, den Nach-Nachfolgern der aktuellen AMD-CPUs, ausgerüstet sein und unter dem Codenamen Genoa laufen – bisher sind mit Milan und Rome bereits zwei italienische Metropolen im Codenamen-Gebrauch.

Pro Server-CPU werden vier ebenfalls von AMD stammende Beschleunigerkarten der Radeon-Instinct-Reihe angebunden. Sie sollen mit einem weiterentwickelten Interconnect ausgestattet sein, dem Infinity Fabric 3, und über Unified Memory verfügen, sodass der gesamte Systemspeicher für CPU und GPU gleichermaßen zugänglich und adressierbar ist. Ob im gleichen Zuge auch PCI Express 5.0 mit CXL zum Einsatz komme, um die Prozessoren mit den Beschleunigern zu verbinden (und natürlich auch das Speichersubsystem anzubinden), bestätigten die Beteiligten nicht.

Radeon Instinct-Beschleuniger sollen den Löwenanteil der Rechenleistung von El Captian liefern. (Bild: AMD)

Mehr als zwei EFflops durch Radeon

Die kommenden Radeon Instinct seien zusammen mit den Partnern entwickelt worden und verfügten neben allgemein hoher Rechenleistung auch über High Bandwidth Memory der nächsten Generation sowie über flexible Mixed-Precision-Betriebsmodi für (KI-)Aufgaben aus dem Feld der Machine Intelligence. Das Verhältnis der Rechenleistung zwischen Epyc-Serverprozessoren und den Radeon-Beschleunigern soll bei circa 1:10 liegen.

So sei eines der wesentlichen Merkmale von El Capitan nicht nur die hohe Double-Precision-Rechenleistung, sondern auch die Flexibilität, mit Mixed-Precision Big Data-Analysen durchführen zu können, sodass eine Vielzahl von Aufgaben auf demselben (Super)Computer laufen könnten, für die man zuvor eigene, spezialisierte Anlagen genutzt habe. Denn klassisches High-Performance-Computing und Machine Intelligence hätten neben hohen Anforderungen an die Rechenleistung durchaus auch Parallelen in Sachen Speicher- und Storage-Anforderungen.

Das DOE fördert die Entwicklung von drei Exascale-Systemen – je eines für die drei genannten Forschungseinrichtungen – mit knapp 2 Milliarden US-Dollar. Das erste der Systeme soll 2021 der "Aurora" für die Argonne National Labs werden, der mit Intel-Hardware ausgerüstet, darunter auch Ponte-Vecchio-Beschleunigern mit Xe-Architektur. (csp)