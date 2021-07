Während der gesamten Pandemie tat sich ein Spannungsfeld auf: Was weiß Wissenschaft wirklich und was kann sie der Bevölkerung mitteilen, wie sie sich am besten im Kampf gegen SARS-CoV-2 verhält? Zwar waren Forscherinnen und Forscher in der Lage, immer mehr über COVID-19 zu lernen – und das wohl sogar schneller als bei jeder anderen Krankheit in der jüngeren Geschichte. Allerdings gibt es diverse Dinge rund um das neue Coronavirus, die immer noch nur teilweise geklärt sind. Das betrifft fundamentale Erkenntnisse wie Verbreitung, Symptomatik und Anfälligkeit für das Virus, bei denen wir vieles wissen, aber auch vieles einfach noch nicht mit Bestimmtheit sagen können. Hinzu kommt die zentrale Frage, wie Erkrankte am besten behandelt werden sollten.

Nirgendwo ist dieser Konflikt zwischen Wissen und Nichtwissen deutlicher geworden als in den USA, die zwar fast ein Fünftel ihres Bruttoinlandsprodukts für die Gesundheitsversorgung ausgeben, aber schlechtere Ergebnisse im Corona-Kampf erzielten als jedes andere reiche Land. Die Suche nach Antworten ist kompliziert, nicht nur, weil Wissenschaft ein hartes Geschäft ist, sondern auch, weil die amerikanische Gesundheitsversorgung aus einem Flickenteppich inkompatibler, archaischer Systeme besteht.

Bundes-, bundesstaatliche und lokale Datenschutzgesetze überschneiden sich und widersprechen sich manchmal sogar. Medizinische Daten sind unübersichtlich, fragmentiert und von den Institutionen, die sie vorhalten, oft stark abgeschottet – sowohl aus Gründen des Datenschutzes als auch aufgrund der Tatsache, dass der Verkauf medizinischer Daten unglaublich profitabel ist und verhindert werden soll.

Aber der Zugriff auf Daten, die in diesen Silos gefangen sind, ist der einzige Weg, um Fragen rund um COVID-19 abschließend zu beantworten. Das ist der Grund, warum so viel wichtige Forschung außerhalb der USA durchgeführt wurde, in Ländern mit staatlichen Gesundheitssystemen. Dabei wird wohl nirgendwo mehr am Coronavirus geforscht als in Amerika. Einige der aussagekräftigsten Daten über Risikofaktoren für die COVID-Mortalität sowie Merkmale einer Long-COVID-Erkrankung stammen zum Beispiel aus Großbritannien. Dort haben Forscher des öffentlichen Gesundheitswesens Zugang zu Daten aus den Krankenakten von 56 Millionen NHS-Patienten.

Zu Beginn der Pandemie erkannte eine Gruppe von Forschern, die von den US National Institutes of Health (NIH) ihr Geld bekommen, dass viele Fragen zu COVID-19 nicht beantwortet werden können, ohne die Barrieren für den Datenaustausch zu überwinden. Also entwickelten sie einen Rahmen, um echte Patientendatensätze von verschiedenen Institutionen auf eine Weise zu kombinieren, die sowohl privatsphärenfreundlich als auch forschungsrelevant sein soll.

Das Ergebnis ist die National COVID Cohort Collaborative, kurz N3C, die medizinische Aufzeichnungen von Millionen von Patienten im ganzen Land sammelt, sie bereinigt und dann Gruppen Zugang gewährt, die an ihnen nahezu alles erforschen können – von der Frage, wann ein Beatmungsgerät eingesetzt werden sollte, bis hin zur Frage, ob und wie COVID-19 den Menstruationszyklus beeinflusst.

"Schockierender" Datenmangel

"Es ist einfach schockierend, dass wir angesichts einer Pandemie keine harmonisierten, aggregierten Gesundheitsdaten für die Forschung hatten", sagt Melissa Haendel, Professorin für Forschungsinformatik an der University of Colorado Anschutz Medical Campus und eine der Co-Leiterinnen von N3C. "Außerhalb des Kontexts einer Pandemie hätten es nie geschafft, dieses Ausmaß an Daten zu bekommen." Nun zeige sich, dass es möglich ist, aufbereitete klinische Daten auf sichere und transparente Weise breit zu teilen.

Die Datenbank ist schon jetzt eine der größten Sammlungen von COVID-Datensätzen der Welt, mit 6,3 Millionen Patientendatensätzen aus 56 Institutionen. 2,1 Millionen davon waren infiziert. Die meisten Datensätze reichen bis ins Jahr 2018 zurück, und die beteiligten Organisationen haben sich verpflichtet, sie fünf Jahre lang zu aktualisieren. Das macht N3C nicht nur zu einer der nützlichsten Ressourcen für die Erforschung der Krankheit, sondern auch zu einer der vielversprechendsten Möglichkeiten, das Virus langfristig zu beobachten.

Ein System, bei dem Institutionen Datensätze in großen Mengen an eine zentralisierte Bundesregierung senden, bleibt eine Anomalie im US-Gesundheitssystem. Richtig eingesetzt, hat es das Potenzial, lange nach der Pandemie detaillierte Fragen zu beantworten. Und es könnte sogar als Proof of Concept für ähnliche Bemühungen in der Zukunft dienen.

Um Informationen zur Datenbank beizusteuern, wählen die teilnehmenden Anbieter zunächst zwei Gruppen von Patienten aus: Menschen, die positiv auf SARS-CoV-2 getestet wurden, sowie andere, die als Kontrollgruppe dienen. Dann entfernen sie alles, was die Daten persönlich identifizierbar macht – außer der Postleitzahl und dem Datum der Behandlung – und übermitteln sie geschützt an das N3C. Dort bereinigen Techniker die Daten weiter – eine nicht zu unterschätzende Aufgabe – und geben sie in die Datenbank ein.