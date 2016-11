(Bild: NERSC)

In Salt Lake City trifft sich in diesem Jahr die internationale Supercomputerszene zur SC16. Zu Beginn der Konferenz wird die neue Top500-Liste der Supercomputer veröffentlicht. Im Zweikampf USA gegen China hat die USA wieder ein bisschen nachgelegt.

Mit Cori, dem neuen Supercomputer in Berkeley, hat man es noch vor Donald Trumps Regentschaft geschafft, wenn auch nicht auf Platz 1 der Top500-Liste: Amerika ist zumindest bei der Gesamtleistung der Supercomputer wieder Nummer 1, nachdem China im Sommer die USA überholt hatte. Das ergibt die neue 48. Top500-Liste, die zum Auftakt der Supercomputer-Konferenz SC16 in Salt Lake City veröffentlicht wurde. Das gilt allerdings nur für die installierte Leistung, denn in der Anzahl der Systeme in der neuen Liste zog Berkeley mit 171 Systemen mit China lediglich gleich. Cori, der neue Cray-Supercomputer am National Energy Research Scientific Computing Center (NERSC) in Berkeley hat dabei mit 9152 Xeon-Phi-7250-Prozessoren 14 Petaflops beigetragen und damit Platz 5 erreicht, hinter den vier führenden Systemen, die schon im Sommer vorne standen.

Allen voran an der Spitze steht weiterhin einsam und allein der Sunway TaihuLight am National Supercomputing Center in Wuxi, der mit den 10 Millionen Kernen der Sunway-S26010-Prozessoren auf 93 PFlops im Linpack-Benchmark kommt. Nummer zwei ist der Tianghe am National Supercomputing Center in Guangzhou mit 33,9 Pflops, der lange die Liste anführte. Er speist seine Performance hauptsächlich aus den älteren Intel-Xeon-Phi-Prozessoren (Knights Corner). Platz 3 mit 7,6 PFlops hält der Oldtimer Titan am Oakridge National Lab mit AMD-Bulldozer-Prozessoren vor dem noch älteren Sequoia am Lawence Livermore National Lab (17,2 Pflops) mit BlueGene/Q.

Xeon Phi legt allmählich los

Dann folgt der neu in die Liste eingestiegene Cori, der nach der ersten US-Nobelpreisträgerin Gerty Cori (1947 in Medizin/Physiologie) benannt ist. Er ist sogar noch leistungsfähiger als der erreichte Wert von 14 PFlops ausdrückt, denn ihm stehen daneben noch 1650 Haswell-Prozessoren zur Verfügung, die beim Linpack nicht mitgerechnet haben. Außerdem war er bei der Top500-Submission auch noch nicht ganz komplett, inzwischen ist er auf 9304 Xeon-Phi-7250-Prozessoren à 68 Kerne ausgebaut.

Hinter Cori folgt ein weiterer Newcomer mit Xeon Phi Knights Landing in die Top Ten: Oakforest-PACS vom Joint Center for Advanced High Performance Computing in Tokio mit 13,6 PFlops.

Europas Schnellster, der Piz Daint am schweizerischem nationalen Supercomputer-Zentrum (CSCS), konnte seinen achten Platz verteidigen, aber nur weil er kräftig mit 4480 Nvidia-Pascal-GPUs P100 aufgerüstet wurde und er dadurch jetzt 9,8 PFlops erzielt. Deutschlands schnellster Supercomputer bleibt weiterhin der Cray-XC40-Rechner "Hazel Hen" am HLR Stuttgart, der mit 7,6 PFlops auf Platz 14 in der Liste zurückgefallen ist. Er ist ein reiner "General-Purpose"-Rechner ohne spezielle Beschleuniger.

Es gibt wieder einen leichten Trend hin zu den Allzweckrechnern. Die Zahl der mit Beschleunigern arbeitenden Systeme ist gegenüber dem Sommer von 104 auf 96 zurückgegangen. Mit dabei sind auch 10 Systeme mit dem neuen Xeon Phi Knights Landing als selbst-bootenden Hauptprozessor. Aber, da ist jetzt nicht so genau bekannt, ob die als Allzweck- oder als Spezialrechner eingestuft werden sollen. Die Leistung eines einzelnen Kerns blieb zwar etwas unter den Erwartungen, aber ansonsten ist es ein ganz normaler Hauptprozessor mit guter Skalierung, sagte Richard Gerber von NERSC – jedenfalls, wenn man ihn nicht Out-of-the Box, sondern mit liebevoller Optimierung betreibt. Jede Software hat dabei ihre eigenen Konfigurationswünsche (Memory-Layout, internes Mesh …), was vorab beim Booten im BIOS-Setup berücksichtigt werden muss.

Erste Systeme mit Nvidia Pascal P100

Erzkonkurrent Nvidia hat außer dem schweizerischen Vorzeigerechner Piz Daint und dem eigenen Entwicklungsrechner DGX SaturnV mit DLX1-Systemen (3,3 PFlops, Platz 28) noch keine weiteren Tesla-P100-Systeme platzieren können. Offenbar sind die Riesen-Chips noch nicht in größeren Stückzahlen lieferbar oder auch schlicht zu teuer. Aber in der Green500 zeigen sie schon mal, wo es lang geht. Mit bis zu 8,2 GFlops/Watt (DGX SaturnV) hängen sie die Rechner mit dem PEZY-Beschleuniger (6,6 GFlops/Watt) locker ab. Damit ist Nvidia jetzt beim Sechstel der projizierten Mindesteffizienz von 50 GFops/Watt für Exascale-Systeme angekommen.

Ansonsten dominiert Intel mit gut 92 Prozent die Top500-Liste total, ein paar Altsysteme mit AMD-Opteron und IBM-BlueGene und -Power sind noch zu finden und eine Handvoll SPARC-Systeme, sonst nur Intel. Von ARM64 ist noch nichts zu sehen, da muss man wohl auf Fujitsu mit dem Post-K-Computer warten.

Deutschlands noch verbliebene AMD-Hochburg, die Gutenberg-Universität Mainz mit dem Supercomputer Mogon, ist inzwischen auch zu Intel gewechselt. Der von der Chemnitzer Firma Megware aufgebaute Mogon II verwendet Broadwell-Prozessoren und Omnipath-Interconnects und kommt auf 557 TFlops (Platz 265). Megware hat ein ähnliches, etwas kleineres System "Meggie" auch an der Universität Erlangen aufgebaut, das mit 472 TFlops Platz 346 erreichte.

Im Länder-Ranking belegt Deutschland mit 31 Systemen jetzt Platz 3 vor Japan mit 27 Systemen. Dank der beiden Top-10-Rechner K Computer und Oakforest-PACS liegt Japan aber bei der Performance mit 55 PFlops weit vor Deutschland mit 36,5 PFlops. Danach folgen Frankreich (20 Systeme, 25,4 PFlops) und Großbritannien mit nur noch 13 Systemen, allerdings mit ziemlich "dicken", die insgesamt 27,6 PFlops leisten. Europa insgesamt hat seine Systemzahl in etwa gehalten.

Bei den Herstellern hat HPE zwar 16 Systeme verloren, konnte das durch den Zukauf von SGI aber mehr als kompensieren. Beide zusammen kommen jetzt auf 140 (zuvor 153) Systeme. Dahinter folgen Lenovo (92 zuvor 84) und Cray (56 zuvor 60).HPE bleibt aber in der installierten Performance gegen Spitzenreiter Cray weit zurück. Mit 21,4 Prozent dominiert in dieser Disziplin Cray klar vor HPE/SGI mit zusammen 15,8 Prozent. Dritter ist allein mit dem Spitzenreiter TaihuLight das National Research Center of Parallel Computer Engineering & Technology (NRCPC).

Insgesamt hat die Rechenleistung aller 500 Systeme gegenüber der 47. Liste um 18 Prozent auf 672 PFlops zugenommen, die Mindestperformance, um auf die Liste zu kommen betrug 349 TFlops (zuvor 286 TFlops).