Die Cloud sprengt alle Grenzen

Inhaltsverzeichnis

Die hochflexible Wolke taugt allerdings nicht für alle Anwendungen. Zu einem echten Flaschenhals kann die Datenübertragung werden. So bleibt Nikolai Longolius von der "schnee von morgen webTV GmbH" mitunter nichts anderes übrig, als unkomprimiertes Videomaterial mit einer Festplatte zu Amazon zu schicken, weil der Upload Tage dauern würde.

Noch extremer ist die Situation bei der Genomanalyse. Die Suche nach Mutationen im Genom ist eigentlich sehr gut parallelisierbar. Das heißt: Die Berechnung lässt sich leicht in Hunderte oder Tausende Teiljobs zerlegen, die über die Computer in der Cloud verteilt werden. Diese rechnen dann vor sich hin und melden die Ergebnisse zurück. "Die Sequenzierungsdaten eines einzigen Patienten sind zwei Terabyte groß", berichtet John Castle, der am Institut für Translationale Onkologie (Tron) an der Universität Mainz forscht. Castle entwickelt individualisierte Therapien für Krebspatienten. Ob ein bestimmtes Medikament wirkt oder nicht, hängt nämlich auch von der Art der Mutationen in den Tumorzellen ab.

Um die passende Therapie zu finden, wird den Betroffenen verdächtiges Zellgewebe entnommen und anschließend die DNA sequenziert. "Die Daten aus der Sequenzierung bestehen aus Milliarden etwa 200 Basenpaare langen Teilstücken", erklärt Castle. Diese Puzzlestücke müssen zunächst wieder zum vollständigen Genom zusammengefügt werden, um dann gezielt nach Mutationen zu suchen, welche für den Tumor verantwortlich sein könnten.

Wegen der riesigen Datenmengen – auch nach der Vorverarbeitung sind es noch 200 Gigabyte pro Patient – nutzen die Mainzer Forscher daher noch keine externe Cloud, sondern eine sogenannte Private Cloud im Rechenzentrum der Universität. Bislang dauert das rechenintensive Prozedere eine Woche – künftig sollen Ärzte binnen 48 Stunden nach der Sequenzierung wissen, welcher Krebstyp vorliegt und wie man ihn am besten bekämpft. Castle kann sich gut vorstellen, dass in einigen Jahren, wenn die Übertragungsgeschwindigkeit im Internet noch mal deutlich gestiegen ist, auch Sequenzierungsdaten in der externen Cloud zusammengepuzzelt und analysiert werden können.

Wie die Genomanalyse gehören auch viele Simulationen zu den sogenannten "trivial parallelen Problemen" (Embarrassingly Parallel Problems) – das sind Berechnungen, die sehr oft hintereinander, immer wieder mit verschiedenen Daten durchgeführt werden müssen, um zur Lösung zu gelangen. Weil die einzelnen Teilschritte in dieser Problemklasse nicht voneinander abhängig sind, lassen sich solche Berechnungen sehr gut parallelisieren. Sie sind daher prinzipiell auch gut für die Cloud geeignet. Auf Aufgaben dieser Art zielt auch das Softwarepaket Comsol Multiphysics der gleichnamigen Software-Schmiede aus Schweden. Mit dem Programmpaket simulieren die Kunden komplexe physikalische Prozesse, etwa das Kühlen supraleitender Magneten am Kernforschungszentrum Cern oder die Akustik von Konzertsälen.

"Die Skalierung funktioniert besonders gut für einfach verteilbare Aufgabenstellungen wie Parameterstudien", sagt Winfried Geis von der deutschen Comsol-Niederlassung in Göttingen. So kann der italienische Autozulieferer Metelli dank der Multiphysik-Simulationssoftware die Entwicklung neuer Bauteile extrem beschleunigen. Statt wie früher für 10000 Euro teure Prototypen herzustellen und einzeln zu untersuchen, werden Wasserpumpen für neue Automodelle heutzutage virtuell entwickelt und dann mithilfe der Simulation optimiert.

Die umfangreichen Kalkulationen erfordern viel Rechnerkapazität – wären also ideal geeignet für Cloud Computing. Noch gibt es keine Cloud-Version der Software von Comsol. Die Kunden nutzen bislang sogenannte Computercluster – also eine in der Regel eigene Serverfarm (Private Cloud). Künftig soll die Software jedoch auch klassisches offenes Cloud Computing unterstützen. Bei der jährlichen Comsol-Anwenderkonferenz Ende 2010 in Paris war die Wolke denn auch das zentrale Thema. Microsoft-Manager Henrik Steepler schwärmte in seiner Keynote von der "grenzenlosen Kapazität der Cloud". Doch Anwendungsfälle wie etwa eine Fluid-Dynamik-Simulation für ein neues Flugzeug beispielsweise basieren auf hochgeheimen CAD-Konstruktionsdateien. Auch diese Daten dürfen keinesfalls in die falschen Hände geraten.

Zu den Sicherheitsbedenken kommt oftmals auch eine gewisse rechtliche Unsicherheit, etwa in Sachen Datenschutz. So dürfen deutsche Banken ihre Kundendaten nicht ins Ausland transferieren. Da die größten Cloud-Zentren jedoch alle in den USA stehen, kommt eine Auslagerung für sie nicht infrage. "Es müssen zumindest auf europäischer Ebene einheitliche rechtliche Rahmenbedingungen in Bezug auf den Datenschutz und das Recht auf informationelle Selbstbestimmung geschaffen werden", fordert deshalb Alexander Voss vom European Microsoft Innovation Center. Dann könnten in Europa aufgebaute Cloud-Rechenzentren ihre Dienste länderübergreifend anbieten.