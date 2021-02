Eine Sammlung von Daten aus aller Welt zu individuellen Erkrankungen mit Covid-19 soll Forscherinnen und Forschern in aller Welt im Kampf gegen das Coronavirus helfen. Die Datenbank ist unter Global.health einsehbar und wurde von Wissenschaftlern in den USA und Europa aufgebaut, die nicht nur finanziell von Google und der Rockefeller Foundation unterstützt wurden. Gesammelt sind Informationen zu Millionen einzelnen Erkrankungen, die aus verschiedenen Quellen zusammengetragen wurden. Vorreiter ist offenbar Deutschland, die Datenbank umfasst Einträge zu mehr als 2,26 Millionen erkannten Fällen in der Bundesrepublik. Das sind etwas mehr als Mitte Februar vom Robert Koch-Institut gemeldet. Aus anderen Staaten – etwa Frankreich – gibt es hier gar keine Daten.

Fast 10 Millionen Datensätze

Wie das US-Wissenschaftsmagazin Nature erläutert, hat das Projekt seinen Ursprung in einer simplen Google-Tabelle. Die war demnach von Epidemiologen im Januar 2020 angelegt worden, um einen Überblick über die neue Krankheit aus dem chinesischen Wuhan zu bekommen. Während Einige Informationen aus verschiedensten Quellen sammelten und dort eintrugen, hätten andere diese genutzt, um herauszufinden, was es mit der unbekannten Krankheit auf sich hatte. Bald hätten sie jedoch die technische Obergrenze erreicht – die Tabelle war zu voll. Dann hätten sich die Verantwortlichen an Google gewandt und Hilfe von dem Konzern und dessen Stiftung Google.org bekommen. Zusammen hätten sie die Datenbank erarbeitet, die aus Dutzenden Quellen automatisch befüllt werde und künftig auch bei anderen Epidemien beziehungsweise Pandemien helfen könnte.

Die Datenbank von Global.health steht jedem offen, richtet sich aber vor allem an Gesundheitsexperten und Wissenschaftler. Zwar würden die Quellen nicht alle im Einzelnen geprüft, erklärt die an der Entwicklung beteiligte Northeastern University aus Boston, aber alle würden aufgeführt und könnten verifiziert werden. Gesammelt würde weit mehr nur die jeweilige Anzahl der Erkrankten beziehungsweise Verstorbenen. Insgesamt könnten bis zu 40 Variablen pro Fall eingetragen werden. Entfernt würden alle Daten, die Erkrankte identifizierbar machten. Für die Fälle aus Deutschland gibt es etwa Angaben über das ungefähre Alter, das Geschlecht und das Datum der ersten Symptome. Besser verfolgbar werden soll etwa die Ausbreitung der neuen Mutationen.

Google hat in der andauernden Pandemie schon mehrfach mit Datenprojekten die Kompetenzen im Umgang mit Big-Data eingebracht, nachdem staatliche Stellen lange hinterherhinkten. Im September hatte der US-Konzern beispielsweise ein Open-Data-Portal vorgestellt, in dem Daten zur Pandemie aus verschiedenen Quellen zusammengetragen wurden. Schon seit April des vergangenen Jahres macht der für Android verantwortliche Konzern außerdem Daten zur Mobilität vieler Millionen Nutzer zugänglich, die bis auf die regionale Ebene Auskunft dazu geben, wie die Menschen in der Pandemie etwa den öffentlichen Nahverkehr nutzen oder zur Arbeit gehen.

(mho)