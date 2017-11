Die ersten drei Plätze auf der neuen Top500-Liste der weltweit schnellsten Supercomputer blieben unverändert in China und der Schweiz. Im Reich der Mitte laufen jedoch 94 neue Systeme, die meisten zwischen den Plätzen 100 und 300. China hat jetzt 202 Top500-Superrechner, die USA nur 143. Auch bei der aggregierten Performance aller Top500-Systeme liegt China mit 35 Prozent jetzt vor den USA (30 Prozent). 90 Systeme laufen in der EU, in der Schweiz und in Norwegen. Japan hat als weiteres asiatisches Land einen Treffer gelandet: Der Gyoukou auf Platz vier ist besonders, vor allem bei der Energieeffizienz. Mit 14,17 GFlops/Watt überholt das „ZettaScaler-2.2“-System mit Intel Xeon D-1500 und Pezy-SC2-Beschleunigern viele bisherige Effizienz-Spitzenreiter mit Nvidia-Tesla-Karten. Ganz oben auf der Green500-Liste mit 17 GFlops/Watt steht allerdings das viel kleinere ZettaScaler-System Shoubou B am japanischen Forschungsinstitut Riken.

102 der Top500-Rechner nutzen Beschleuniger, vor allem Nvidia Tesla (86), Intel Xeon Phi (10) und den erwähnten Pezy (5). In weiteren 14 läuft der Xeon Phi als Hauptprozessor. AMD kann bisher weder mit Radeons punkten noch mit einem Epyc – aber es stehen noch fünf Systeme mit Opterons auf der Liste, darunter Titan am Oak Ridge National Laboratory. Die Rechenleistung dieser Nummer 5 steuern allerdings vor allem die Tesla K20x bei. Eine nagelneue Tesla V100 ist im DGX SarurnV Volta dabei, die P100 schon in 42 Systemen. Bei den Prozessoren dominieren Intels Xeons in 94 Prozent aller Systeme. Zu den wenigen Ausnahmen gehören die Nummer 1 mit dem chinesischen ShenWei (Sunway) oder die Nummer 6, Sequoia mit IBM BlueGene/Q. Auf Rang 440 steht der italienische Davide mit Power8+ und Tesla P100. Und der K Computer mit SPARC64 VIIIfx hält sich auf Platz 10. Gar keine Abwechslung gibt es jedoch beim Betriebssystem: Es ist immer Linux.

Bei der Anzahl der Supercomputer-Hersteller in der Top500 machten sich die vielen chinesischen Neusysteme von Inspur und Surgon bemerkbar. HPE bleibt aber mit 123 vorne, vor Lenovo mit 81. Dann folgt Inspur mit 56 vor Cray (53) und Sugon (51).

JSC-Leiter Thomas Lippelt und Dells HPC-Experte Werner Hartz berichten über den ersten modularen Supercomputer mit Booster. Jülichs nächster wird aber von Bull/Atos stammen.

Bei der aggregierten Leistungsfähigkeit bleibt Cray mit 19,5 Prozent der Top500-Gesamtperformance vorne, vor HPE mit 15,2 Prozent und dem Hersteller NRCPC des Spitzensystems TaihuLight mit 11,1 Prozent. Die Gesamt-Performance aller Top500-Supercomputer zusammen ist gegenüber der Liste vom Juni um 27 Prozent gestiegen, liegt aber mit 845 PFlops noch unter 1 Exaflops. Man braucht jetzt mindestens 548 TFlops, um überhaupt auf die Liste zu kommen. 2018 wollen sich dann IBM Power9 und Tesla V100 in den CORAL-Systemen Sierra und Summit mit jeweils über 100 PFlops an die Spitze setzen.

Und Deutschland?

Neue deutsche Systeme gab es gar nicht in der Liste, aber es wurden zumindest zwei erheblich erweitert. Die mussten das Kunststück vollbringen, den Linpack über verschiedene Architekturen laufen zu lassen. Beim Jureca am Jülicher Supercomputer Center war das Haswell-System mit Nvidia Tesla und InfiniBand-EDR mit dem von Dell aufgebaute Booster mit Xeon Phi und Omnipath zu verheiraten. Die Ehe klappte: mit 3,8 PFlops kam er auf Platz 29. Und die Johannes Gutenberg-Universität Mainz hat das vorhandene Megware-System mit Broadwell um ein Skylake-System von NEC erweitert. Mit fast 2 PFlops auf Platz 65 wurde er damit Deutschlands schnellster Uni-Rechner.

HPCG

Der Benchmark „High Performance Conjugate Gradients“ (HPCG) soll die für die Top500-Platzierung ausschließlich mit Linpack ermittelte Leistungsangabe ergänzen – ähnlich wie die Green500-Liste etwas über die Effizienz im Linpack aussagt. Noch machen aber erst wenige Top500-Systeme beim HPCG mit, melden also keine Ergebnisse. Ein Benchmark-Lauf ist ein enormer Aufwand, währenddessen der teure Superrechner den eigentlichen Nutzern nicht zur Verfügung steht. Der HPCG hängt jedenfalls stark von der maximalen Transferrate des RAM ab. Unter den HPCG-Top-Ten hat sich nichts geändert, es führt der japanische K-Computer mit 603 TFlops vor dem chinesischen TaihuLight mit 580 und dem amerikanischen Xeon-Phi-System Trinity mit 542 TFlops.

Bei der Energieeffizienz laut Green500 liegen Pezy SC2 und Nvidia Tesla P100 dicht beieinander, der beste P100-Rechner liefert 15,113 GFlops/W. Das effizienteste Xeon-Phi-System schafft mit 5,414 GFlops/Watt nur rund ein Drittel davon und liegt erst auf Platz 21. Das beste System mit „normalem“ Xeon E5, also ohne Beschleuniger, liefert immerhin auch schon 4,761 GFlops/W. Der Top500-führende TaihuLight kommt in der Green500 auf Platz 20 mit 6,051 GFlops/W, schluckt im Betrieb aber satte 15,371 Megawatt. Da er in der Spitze 0,093 Exaflops leistet, muss für die kommenden Exaflops-Superrechner die Effizienz noch drastisch steigen. Der Gyoukou mit 0,0191 EFlops aus 1,35 MW liegt da schon besser: Für 1 EFlops bräuchte man 52 dieser Maschinen, die zusammen theoretisch 71 Megawatt verschlängen. (ciw@ct.de)