Oft völlig überbewertet: Vorsicht bei Corona-Statistiken

Die Sache mit den Zahlen ist heikel. Man weiß nicht immer genau, wo sie herkommen und was sie umfassen. Dennoch vermitteln sie ein Gefühl von Sicherheit.

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 433 Beiträge

Wie ein Rennen... Corona-Diagramm bei der Financial Times

Von

Den größten Wert in Corona-Zeiten haben – neben Nudeln und Klopapier – wohl Zahlen. Auf einmal rufen Menschen, die mit Mathematik wenig und mit Statistik überhaupt nichts am Hut haben, mehrmals täglich Daten zu Coronavirus-Fällen ab. Plötzlich scheint ein jeder zu wissen, was exponentielles Wachstum ist. Und gefühlt halb Deutschland drückt in häuslicher Isolation die Daumen, die Kurve – DIE Kurve – möge schnell und ausreichend abflachen. Statistiker warnen jedoch davor, sich allzu sehr auf die Zahlen zu verlassen.

heise online daily Newsletter

Keine News verpassen! Mit unserem täglichen Newsletter erhalten Sie jeden Morgen alle Nachrichten von heise online der vergangenen 24 Stunden.

Die verfügbaren Zahlen enthielten zu wenige Informationen, erklärt Katharina Schüller, Gründerin des Münchner Unternehmens Stat-Up und Leiterin der Arbeitsgruppe "Statistical Literacy" der Deutschen Statistischen Gesellschaft. "Sie bilden nur einen kleinen Teil der Realität ab, nämlich die schwer Erkrankten, einen Teil der leichter Erkrankten mit Symptomen und einen ganz kleinen Teil von Menschen ohne Krankheitszeichen, die getestet wurden, weil sie Verdachtsfälle waren."

Ob auch viele andere infiziert sind oder nicht, "das wissen wir nicht und können es auch nur mehr oder weniger begründet erraten", schreibt Schüller in einem Beitrag für das Hochschulforum Digitalisierung: "Wir wissen, dass jede unserer Modellrechnungen falsch sein muss." Trotzdem könnten die Schlussfolgerungen daraus richtig sein.


Das Robert Koch-Institut (RKI) als oberste Behörde für Infektionskrankheiten in Deutschland bekommt Zahlen zu mit Sars-CoV-2 infizierten Menschen und Toten, die die Krankheit Covid-19 hatten, von den Landesbehörden. Die wiederum erhalten sie von den regionalen Gesundheitsämtern. "Zwischen der Meldung durch die Ärzte und Labore an das Gesundheitsamt und der Übermittlung der Fälle an die zuständigen Landesbehörden und das RKI können einige Tage vergehen (Melde- und Übermittlungsverzug)", erklärt das RKI dazu. Zahlen werden also auch nachträglich in der Statistik ergänzt.

Andere wie die bekannte Sammlung der Johns Hopkins University aus den USA beziehen auch Quellen wie regionale Medien ein. Das Europäische Zentrum für die Prävention und die Kontrolle von Krankheiten (ECDC), eine Einrichtung der EU, wiederum gleicht nach eigener Darstellung staatliche Angaben mit rund 500 anderen Quellen ab, darunter etwa Twitter-, Facebook- oder Youtube-Konten von Gesundheitsministerien. "Benutzern wird empfohlen, alle Daten mit Vorsicht und unter Berücksichtigung ihrer Einschränkungen zu verwenden", heißt es dazu extra auf der ECDC-Homepage.

Mehr zum Coronavirus:


Und auch die Weltgesundheitsorganisation (WHO) weist unter anderem auf "Unterschiede bei den Berichtsmethoden, rückwirkende Datenkonsolidierung und Verzögerungen bei der Berichterstattung" hin. Wegen der Inkubationszeit, der Zeit für den Test und der Meldeverzögerungen zeigen in Deutschland zum Beispiel Maßnahmen wie Kontaktverbote oft erst etwa 14 Tage später Folgen bei den Zahlen.

Es gibt viele solche Stolperfallen bei den Corona-Daten. Die Tücke liegt wie so oft im Detail. "So hat die Zahl der getesteten Infizierten nur bedingt etwas mit der Zahl der tatsächlichen Infizierten zu tun, weil Menschen mit wenigen oder gar keinen Symptomen bislang in den seltensten Fällen getestet werden, insbesondere nicht, wenn sie keinen Kontakt zu nachweislich Infizierten hatten", erklären die Macher der "Unstatistik des Monats", einem Angebot mehrerer Statistik-Experten, das auf mögliche Fehler bei der Interpretation von Statistiken hinweist.

Neue Testverfahren könnten das zwar ändern und beispielsweise auch bislang nicht erfasste Fälle (Stichwort: Dunkelziffer) erheben – doch dann könnten die gemeldeten Fallzahlen steigen, ohne dass es eine beschleunigte Erkrankungsdynamik gibt.

Besonders heikel sind Ländervergleiche. "Insbesondere hängen die erfassten Fallzahlen in jedem Land zentral davon ab, wie systematisch und umfangreich dort auf den Virus getestet wird", erläutern die Macher der "Unstatistik", zu denen auch Katharina Schüller gehört.

Etliche Faktoren beeinflussen Stand und Schweregrad der Infektionen und können sich von Land zu Land immens unterscheiden: Einwohnerzahl, Altersstruktur, spezielle Erkrankungen in der Bevölkerung wie Tuberkulose, das Stadium der Ausbruchswelle, der Wille oder das Vermögen zu testen, die Richtlinien dafür, wer überhaupt getestet wird. In Altenheimen gestorbene Menschen etwa werden in einigen Ländern nachträglich getestet und fließen in die Statistik ein – in anderen nicht. Da vorwiegend Ältere mit Covid-19 sterben, kann das enorme vermeintliche Unterschiede zur Folge haben.


Die statistische Erfassung der Todesursachen variiere von Land zu Land erheblich, betonen auch die Autoren der "Unstatistik". Dennoch werden immer wieder Vergleiche von Sterberaten diskutiert. Generell sei es falsch, einfach die Toten ins Verhältnis zu den bekannten Infizierten zu setzen. Werde die Dunkelziffer nicht berücksichtigt (die wiederum erheblich vom Ausmaß der durchgeführten Tests abhängt), dann werde der Nenner zu klein. Daraus folgt: Die geschätzte Letalität – also der Anteil der Todesfälle unter allen Infizierten – wird systematisch überschätzt.

Kniffelig wird es auch bei Aussagen zur Zahl der Genesenen, die hier und da bis auf die letzte Stelle angegeben werden und damit ziemlich exakt aussehen. Doch wo nicht einmal alle Infizierten getestet und erhoben werden, kann natürlich noch viel weniger über die Zahl der Genesenen bekannt sein. Daher sind all diese Angaben immer nur Schätzungen – sehr grobe Schätzungen in vielen Fällen.

Das bayerische Landesamt für Gesundheit und Lebensmittelsicherheit erklärt dazu: "Fälle gelten als genesen, wenn deren Meldedatum länger als zwei Wochen zurückliegt und keine Hospitalisierung ohne bekanntes Entlassungsdatum vorliegt, keine Pneumonie und/oder Dyspnoe vorliegt, und kein Todesfall gemeldet wurde." Hier sollen kürzlich mancherorts gestartete flächendeckendere Tests unter anderem auf Antikörper helfen, die Schätzungen und Hochrechnungen zumindest etwas zu verbessern. (mho)