In einer gemeinsamen Pressemitteilung gaben das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften und der Chipdesigner Cerebras bekannt, dass am LRZ-Standort Garching im Sommer 2022 ein System mit der von Cerebras entwickelten Wafer Scale Engine 2 errichtet werden soll.

Gefördert durch Mittel der bayrischen Hightech-Agenda, versprechen die Garchinger sich von dem System auf Basis eines HPE Superdome-Servers speziell in der Forschung und KI-Entwicklung Fortschritte. Die Anforderungen an KI-Modelle erhöhen sich mit rasanter Geschwindigkeit – alle drei bis vier Monate verdoppeln sich laut Angaben des LRZ und aus der Industrie die nötigen Berechnungskapazitäten und auch die erforderliche Speichermenge wächst enorm.

Chip der Superlative

Die Wafer Scale Engine 2 wurde vor knapp zwei Jahren auf der Hotchips vorgestellt. Cerebras beschreibt die WSE2 als einen Chip der Superlative: Hergestellt in 7-Nanometer-Technik hat das annähernd quadratische Monstrum eine Kantenlänge von 215 Millimetern – etwas breiter als eine der DIN-A4-Seiten im c't-Magazin.

Links Cerebras' WSE2, rechts Nvidias A100, einer der aktuell größen GPU-Beschleuniger (Bild: Cerebras)

In den 46.225 Quadratmillimetern sind 2,6 Billionen Transistoren zu 850.000 Rechenkernen mit gleichmäßig verteilten 40 GByte SRAM vereint. Pro Kern bleiben zwar nur rund 50 KByte übrig, doch die sind rasend schnell ver- und angebunden: Bis zu 220 Petabits/s soll das Netzwerk aus Datenleitungen auf dem Chip transportieren und sich zusammen mit der Speichertransferrate von 20 Petabyte/s daher besonders für KI-Berechnungen eignen – zum Speicher selbst macht Cerebras keine Angaben. Hier bezieht man sich wohl auf den on-Chip-SRAM.

Ein riesiges Die

Anders als herkömmliche Chips lässt Cerebras die WSE als Ganzes belichten (daher der Name) und die funktional identischen Prozessoren werden auch nicht in einzelne Teile zersägt. Dadurch können schnellere Interconnects auf einem einzelnen Silizium-Chip eingesetzt werden, anstatt hinterher die zersägten Chips aufwendig und langsamer wieder zu verbinden.

Das Cerebras-System schluckt bis zu 23 Kilowatt, was durch die hohe Performance bei ausgewählten Algorithmen allerdings sehr effizient ist. Es passt in einen Serverschrank und belegt dort 15 Höheneinheiten.

Für Strömungsberechnung und NLP

Das System soll dem LRZ-Pool aus gemischten Rechenressource aus CPUs, GPUs, FPGAs und ASICs zur Verfügung stehen und in einem Rack die Leistung etlicher konventioneller Systeme erreichen. Das spart Energie und Zeit.

Nach Systemen bei Total Energies und einer nicht näher genannten US-Finanzinstituation wäre das Cerebras-System im LRZ die dritte Installation der WSE2. Es soll in Garching unter anderem für Sprachverarbeitung (Natural Language Processing, NLP), computergestützte Diagnosen oder (Wetter-)Vorhersagen, sowie bei Strömungsberechnungen etwa für Luftfahrtentwicklung oder Herstellung eingesetzt werden.

Obwohl die Wafer Scale Engine 2 auf dem Papier beeindruckend aussieht, hat sie es bisher noch nicht in einen der Top500-Supercomputer geschafft, auch wenn es bereits zum Vorgänger Forschungsprojekte mit beeindruckender Leistung auf Supercomputer-Niveau gab. Doch möglicherweise tauchen erste System ja in der für Montag avisierten Juni-Liste auf, die auf der ISC22 in Hamburg präsentiert wird.

(csp)