CERN: Selbst entwickelter Storage für riesige Datenmengen Weit und breit Martin Gerhard Loschwitz Mit über 350 PByte Nutzdaten sind die Anforderungen an den Storage des CERN nichts für schwache Nerven. Das Rückgrat bildet die dortige Eigenentwicklung EOS, die inzwischen auch andere Forschungseinrichtungen nutzen.

iX-tract Das europäische Physikforschungsinstitut CERN hostet in seinen eigenen Rechenzentren Hunderte PByte Nutzdaten in redundanter Art und Weise.

Das umfasst auch die Daten der Experimente des Large Hadron Collider, die die Existenz des Higgs-Boson nachgewiesen haben.

Zum Bewältigen der Datenmengen setzt das CERN auf einen eigens entwickelten Software-defined Storage namens EOS. Er ist auf den schnellen Zugriff bei geringer Latenz optimiert.

Mittlerweile kommen auch andere Forschungsinstitute auf den Geschmack. Neuerdings bildet EOS auch den Kern des ownCloud Infinity Scale.

Der LHC (Large Hadron Collider) des CERN mit seinen vier Experimenten Alice, ATLAS, CMS und LHCb zählt zu den bekanntesten Laboreinrichtungen der Welt (siehe Abbildung 1). Hier gelang es 2012, das Higgs-­Boson nachzuweisen. Schon mehrere Male war der LHC implizit Thema in der iX. Denn IT spielt im CERN eine große Rolle, und immer wieder entstehen dort Innovationen, die auch andernorts äußerst nützlich sind. Darüber hinaus betätigt sich das CERN als fleißiger Nutzer und Ent­wickler von Open-Source-Software.

Der größte Teil des 27 km langen, in 100 Meter Tiefe angelegten LHC-Beschleunigerrings befindet sich unter französischem Boden (Abb. 1). Maximilien Brice/CERN

Gerade in der IT operiert das CERN in Dimensionen, die selbst hartgesottenen Admins Schweißperlen auf die Stirn treiben. Der LHC ist dafür ein hervorragendes Beispiel. In seinen aktiven Phasen produziert er etliche PByte pro Sekunde. Nach dem ersten Reduzieren und Aufarbeiten mit Spezialhardware filtern die Wissenschaftler die Daten der LHC-Experimente in einer verteilten OpenStack-Cloud weiter. Doch selbst im Anschluss daran bleiben im Schnitt zehn PByte pro Monat übrig, die zumindest kurzzeitig für spätere Auswertungen vorzuhalten sind. Zudem ist der LHC nicht das einzige Experiment am CERN: Insgesamt fallen dort jährlich 15 PByte Daten an, die langfristig zu speichern sind, um auch nach Jahren noch schnell im Zugriff zu liegen (siehe Abbildung 2).