Zur traditionellen Supercomputing-Konferenz Ende Juni in Heidelberg diskutierten 438 Teilnehmer aus 24 Ländern den Stand der Technik und zukünftige Konzepte im High Performance Computing.
Obwohl die ISC in Heidelberg nicht von einer großen Messe, sondern von einer eher kleinen Ausstellung begleitet wird, haben Hersteller von Hard- und Software auf dieser Tagung einen ungleich höheren Einfluss als bei einer rein wissenschaftlichen Fachkonferenz. Das fängt schon beim Hauptsponsor an: Nach Intel im vergangenen Jahr fiel nun Intels Erzkonkurrent AMD diese Rolle zu. Im nächsten Jahr steht wahrscheinlich IBM auf der Liste.
Für Gesprächsstoff sorgte die Ankündigung von Microsoft, in das HPC-Geschäft einsteigen zu wollen - laut Kyril Faenov von Microsoft war diese Ankündigung zunächst gar nicht geplant, sondern musste als Reaktion auf ein „unintentional leak“ gestartet werden. Der Konzern peilt den Markt kleiner und mittlerer Cluster an und will „Supercomputing to the masses“ bringen. Lizenziert werden soll das Paket pro Node - insgesamt sollen die Software-Kosten „nur einen kleinen Teil der Gesamtkosten“ ausmachen. Neben der Spezialedition von Windows 2003 Server will der Software-Riese eine MPI-Bibliothek, einen Scheduler und Cluster-Managing-Software mitliefern. Eine Fallstudie von Gerd Heber vom Cornell Theory Centre zu Windows HPC rief jedoch nur wenig Reaktionen im Publikum hervor.
Die Wissenschaftler der Cornell University hatten 1997 von Intel einen Cluster aus Windows-NT-Maschinen bekommen und wollten die Ausbreitung von Rissen in Festkörpern auf diesen Maschinen simulieren. Als größte Hürde beschrieb Heber das Fehlen geeigneter Software - so stehe bislang noch kein paralleler Debugger und keine MPI-Bibliothek zur Verfügung; als Vorteil nannte er jedoch die gute Anbindung an einen SQL-Server und die Microsoft Webservices. Auch in der Hot-Seat-Session zu diesem Thema blieb es eher ruhig - in der Hauptsache interessierte das anwesende Publikum, warum man denn von einem funktionierenden System zu neuer Software wechseln sollte, die sich noch bewähren muss.
AMD war als Hauptsponsor des diesjährigen Treffens der Supercomputer-Gilde nicht nur mit zahlreichen Plakaten, Transparenten und Partnerständen allgegenwärtig, sondern konnte mit dem Supercomputer-Projekt Red Storm auch einen gewichtigen inhaltlichen Beitrag liefern. Noch ist Red Storm nicht in den Charts der Top-500-Liste, aber im Dezember 2004 soll der erste Teilabschnitt (eine von vier Reihen) des aus insgesamt mehr als 10 000 Opteron-Prozessoren bestehenden Rechners des Sandia National Labs in Betrieb gehen.
Bestückt mit 2-GHz-Low-Power-Versionen soll Red Storm im Vollausbau mit mehr als 30 Teraflop/s realer Linpack-Leistung hinter dem Earth Simulator (36 Teraflop/s) auf Platz zwei landen. Red Storm verwendet jedoch keine „normalen“, sondern speziell von Cray entwickelte Chipsätze, die möglicherweise schon von vornherein für 90-nm-Prozessoren und ein schnelleres Hypertransport-Protokoll ausgelegt sind. Cray will diese Chipsätze samt seiner Red-Storm-Erfahrungen auch in kleineren Supercomputern neben den weiterhin gepflegten Vektorrechnern vermarkten.
Verglichen mit den Kosten und der Bauzeit des Earth Simulator wird Red Storm trotz der spezialisierten Komponenten von Cray ein schnell produziertes Schnäppchen. Kein Zufall, inzwischen dominieren rein zahlenmäßig relativ preisgünstige Cluster die Szene. Rechenkapazität anzuhäufen scheint kein echtes technisches Problem mehr zu sein: Man nimmt einen Haufen Server vom Hardware-Händler um die Ecke, vernetzt sie mehr oder weniger geschickt und hat ruck, zuck ein Teraflop/s zur Verfügung. Sowohl der diesjährige Hauptsponsor AMD als auch dessen Erzkonkurrent Intel sind überzeugt, dass „commercial off-the-shelf“-Komponenten aus dem High Performance Computing nicht mehr wegzudenken sind.
| Wächst die Rechenkapazität so weiter wie bislang, wird es zum Ende das Jahrzehnts mehrere Petaflop-Systeme geben, glauben die Organisatoren der ISC 2004. |
Auf den zweiten Blick differenziert sich dieses Bild jedoch - wer nachfragt, warum dieses oder jenes Produkt dem der Konkurrenz vorzuziehen sei, hört oft, „there’s no one size that fits it all“. „Sie können einen billigen, schnellen und verlässlichen Supercomputer kaufen“, erklärt Frank Baetke von HP. „Aber Sie dürfen sich normalerweise nur zwei von drei Eigenschaften aussuchen“. HP verkündet, Bandbreite bei der I/O sei der maßgebende Flaschenhals. Mit einem auf der Open-Source-Software Lustre basierenden Scalable File System SFS will der Konzern praktisch unbegrenzt skalierbare Bandbreite für Cluster liefern.
IBM setzt dagegen mit Blue Gene Light auf Platz- und Energieersparnis. Zwei der Prototypen hatten es erstmals in die Top-500-Liste geschafft. Der Konzern packt bis zu 32 PowerPC-Prozessoren auf jeweils eine „Node Card“ und jeweils 32 solcher Karten in ein Kabinett -„praktisch ohne Verkabelung“. Auf jeder Karte läuft ein abgespeckter Linux-Kernel. Die einzelnen Nodes kommunizieren über verschiedene Netzwerke miteinander - je nach Aufgabe wird der optimale Netzwerktyp ausgewählt. Da die Prozessoren mit relativ niedrigen Taktfrequenzen von 700 MHz laufen, soll der Rechner in der Endausbaustufe bei 360 Teraflop/s Peak-Leistung nur 1,5 MW schlucken. Red Storm soll dagegen 1,7 MW verbrauchen - der Earth Simulator schluckt 6,4 MW.
Außer über nackte Rechenleistung wurde auf der Tagung aber auch mehr und mehr über „capability“ diskutiert. Das meint einen gesunden Mix aus Verlässlichkeit, Programmierbarkeit, Rechenleistung und Kosten/Nutzenverhältnis - wobei unter Kosten nicht nur Finanzen, sondern auch Energie und „Footprint“ auftauchen. Schließlich schlage auch erheblich zu Buche, wenn man für einen neuen Cluster gleich ein neues Rechenzentrum bauen müsse. Was diese capability angehe, so sei die Supercomputing-Szene „mindestens eine Größenordnung“ hinter dem zurück, was technisch möglich sei, kritisierte Thomas Sterling, der als Vater der Linux-Beowulf-Cluster gilt.
Dass es wirklich schwierig ist, die Performance einer Maschine zu beurteilen, demonstrierte David H. Bailey schließlich mit einem Update seines 1991 erstmals publizierten Aufsatzes „Twelve Ways to fool the Masses”. Immer noch finde man, erklärte Bailey, selbst in seriösen wissenschaftlichen Aufsätzen die Tendenz, Ergebnisse zurechtzubiegen. So würden Performancemessungen beispielsweise auf völlig sauberen, unbeschäftigten Systemen gefahren - im Extremfall beispielsweise mit einem Prozessor per Node, was die benötigte Bandbreite extrem reduziere. Die Wissenschaftsgemeinde müsse sich immer wieder vor Augen halten, dass solches Verhalten nicht nur unwissenschaftlich sei, sondern letztendlich Erwartungen wecke, die man in Wirklichkeit nie erfüllen könne. (wst)
Version zum Drucken | Per E-Mail versenden | Heft bestellen
Permalink: http://heise.de/-289446
Das aktuelle Heft ist jetzt im Handel erhältlich.
Ältere Artikel können Sie über unser Zeitschriften-Archiv bestellen.