Die Überschätzung des tatsächlichen Anstiegs der Coronavirus-Neuinfektionen

Bild: Fusion Medical Animation / Unsplash

Ein "Faktencheck" des MDR-Beitrags zu meinem Artikel, ein Facebook-Post von Boris Palmer und eine Diskussion interessanter Leserfragen. Update

In Reaktion auf meinen Artikel Von der fehlenden wissenschaftlichen Begründung der Corona-Maßnahmen ist ein Beitrag vom MDR erschienen, in dem mögliche Kritikpunkte vorgebracht werden. Zudem ist ein Facebook-Post von Boris Palmer, Oberbürgermeister von Tübingen, erschienen, in dem er ebenfalls versucht, Kritik anzubringen. Weiterhin habe ich interessante Leserfragen erhalten. (Dort findet sich auch der am 03.05. eingefügte Nachtrag zur "Gefahr des Virus für Menschen mit versus ohne Vorerkrankungen".)

In diesem Artikel soll darauf genauer eingegangen werden. Als Ausgangspunkt wird zunächst noch einmal der statistische Trugschluss bei der Interpretation der steigenden Anzahl an beobachteten täglichen Neuinfektionen prägnant zusammengefasst. Anschließend wird auf den Beitrag vom MDR und den Facebook Post eingegangen. Wie eine genauere Betrachtung zeigen wird, ist in Wirklichkeit kein einziges der Argumente stichhaltig. Abschließend wird noch auf interessante Fragen von Leserinnen und Lesern eingegangen.

Eine wichtige Vorbemerkung: Das Ziel meiner vorherigen Beiträge war, die genauere Betrachtung der Zahlen zu den Neuinfektionen so darzustellen, dass die - durchaus komplexeren - statistischen Gedankengänge von jeder Person möglichst leicht nachvollzogen werden können. Der Grund ist, dass ich hier niemanden mit bloßen Meinungen überzeugen möchte. Stattdessen war das Ziel, dass sich einfach jeder die Zahlen ansehen und die Dinge selber durchdenken kann. Meine Hoffnung war, dass man dann die Stichhaltigkeit solcher Argumente wie der von Prof. Schneider oder Boris Palmer selbst prüfen kann. Mit derselben Herangehensweise soll auch wieder in diesem Artikel gearbeitet werden.

Der statistische Trugschluss bei der Interpretation der Zahlen zu den täglichen Neuinfektionen

In meinem vorherigen Artikel zur fehlenden wissenschaftlichen Begründung der ergriffenen Corona-Maßnahmen wurde die Grundlage genauer beleuchtet, auf der diese Maßnahmen begründet werden: Der offenbare rapide Anstieg in den berichteten Zahlen zu den Neuinfektionen, welcher viele dazu verleitet, von einer drohenden Epidemie mit mehreren Millionen von Infizierten in Deutschland auszugehen, die mit drastischen Maßnahmen bekämpft werden muss.

Dabei wurde das Problem beleuchtet, dass nicht nur die Anzahl der Neuinfektionen zugenommen hat, sondern parallel dazu auch die Anzahl der durchgeführten Coronavirus-Tests, was zu einer Überschätzung des wahren Anstiegs der Neuinfektionen führen kann. Um diese mögliche Überschätzung zu prüfen, wurde eine einfache statistische Methode angewendet, mit der man abschätzen kann, was passiert wäre, wenn man über die Zeit hinweg immer mit der gleichen Anzahl an Tests getestet hätte.

Die statistische Technik kann man noch einmal anhand eines einfachen Beispiels illustrieren: Nehmen wir an, man möchte die Häufigkeit eines Virus in zwei verschiedenen Städten vergleichen. In der einen Stadt hat man doppelt so viele Tests wie in der anderen gemacht - nehmen wir an 10.000 Tests in der Stadt A und 20.000 Tests in der Stadt B. Würde man nun in der Stadt A 1.000 und in der Stadt B 2.000 positive Testergebnisse erhalten, wäre es natürlich ein Trugschluss, daraus zu schließen, dass das Virus in der Stadt B doppelt so häufig verbreitet ist, denn man hat in der Stadt B ja einfach nur doppelt so viele Tests durchgeführt.

Die einfachste Methode um das wahre Verhältnis zwischen beiden Städten herauszufinden, besteht darin, den relativen Anteil erhaltener positiver Testergebnisse zu bestimmen: Man teilt also einmal 1.000 durch 10.000 und einmal 2.000 durch 20.000. Dann würde man sehen, dass in beiden Städten 10% der Tests positiv waren und es also keinen Unterschied in der Virusverbreitung gibt. Wendet man diese Methode auf die berichteten Zahlen zu den Coronavirus-Neuinfektionen an, zeigt sich, dass diese den wahren Anstieg in den Neuinfektionen ohne Korrektur um die gleichzeitig erhöhte Testanzahl extrem überschätzen.

Für die Coronavirus-Neuinfektionen kann das auch anhand der Graphiken des Robert Koch-Instituts (RKI) verdeutlicht werden. In der folgenden Abbildung ist auf der linken Seite der Verlauf der täglichen berichteten Neuinfektionen zu sehen (Dashboard RKI, Stand 30.04.) und auf der rechten Seite die Anzahl der Tests und der Anteil erhaltener positiver Testergebnisse pro Tag (Täglicher Lagebericht des RKI vom 29.04., Abbildung 7).

Wie man in der linken Graphik sieht, ist die berichtete Anzahl der Neuinfektionen vom 15. auf den 16. März sprunghaft angestiegen. Wie man in der rechte Graphik sieht, ist zu diesem Zeitpunkt auch die Anzahl der Tests (widergespiegelt durch die Größe der Punkte) sprunghaft angestiegen, allerdings ohne dass sich der Anteil erhaltener positiver Testergebnisse verändert hat, so dass die berichteten Zahlen (linke Graphik) den wahren Anstieg (rechte Graphik) überschätzen.

Wie in meinem vorherigen Artikel beschrieben, hat sich laut den berichteten Zahlen die Anzahl der täglichen Neuinfektionen von Kalenderwoche 10 auf 14 um das 41-fache erhöht. Betrachtet man dagegen den Anteil erhaltener positiver Testergebnisse (Kurvenverlauf in der rechten Graphik), so ist der Anteil erhaltener positiver Testergebnisse von der Zeit bis zur 10. Kalenderwoche (einschließlich 08. März) auf die 14. Kalenderwoche (30. März - 05. April) nur von 0.03 auf 0.09 gestiegen (Täglicher Lagebericht des RKI vom 29.04., Tabelle 5). Die berichteten Zahlen überschätzen den wahren Anstieg in den Neuinfektionen also sehr dramatisch.

In einem Nachfolgebeitrag (Die Überschätzung des tatsächlichen Anstiegs der Coronavirus-Neuinfektionen) wurden die Vorbedingungen noch genauer beleuchtet, unter welchen der Anteil erhaltener positiver Testergebnisse den wahren Verlauf der Neuinfektionen zuverlässig schätzt. Vorbedingungen sind hier zum einen das Vorhandensein einer Dunkelziffer von zwar infizierten, aber aufgrund der geringen Testanzahl nicht entdeckten Personen, zum anderen sollten sich sowohl die Sensitivität des Tests - also die Wahrscheinlichkeit, dass eine tatsächlich infizierte Person auch tatsächlich ein positives Testergebnis erhält - als auch die Kriterien der Testanwendung nicht groß verändern, was für den Zeitraum des Anstiegs in den beobachteten Neuinfektionen der Fall ist.

Weiterhin wurde herausgearbeitet, dass der Anteil erhaltener positiver Testergebnisse zudem von der Zahl der an anderen Atemwegs-Infektionen leidenden Personen in der getesteten Personengruppe abhängt. Da diese Zahl bis zur 12. Kalenderwoche in etwa gleichbleibt, aber danach deutlich zurückgeht, schätzt der Anteil erhaltener positiver Testergebnisse den wahren Anstieg von der Kalenderwoche 10 auf 12 relativ genau, während der Anteil erhaltener positiver Testergebnisse ab der 13. Kalenderwoche (23. - 29- März) den wahren Verlauf sogar noch überschätzt.

Die Kritikpunkte von Prof. Kristian Schneider im Beitrag des MDR

In Reaktion auf meinen Artikel ist ein MDR-Beitrag erschienen, in welchem verschiedene Kritikpunkte von Prof. Kristian Schneider von der Hochschule Mittweida vorgebracht werden. Leider wurde mir nicht die Möglichkeit gegeben, dazu im Vorfeld Stellung zu nehmen. Das ist schade, denn zum einen wäre das meiner Meinung nach aus journalistischer Perspektive heraus angebracht gewesen, zum anderen hätte dadurch die Verbreitung von weiteren Trugschlüssen vermieden werden können.

Dazu werden im Folgenden alle Kritikpunkte als wörtliches Zitat aufgeführt und anschließend kritisch beleuchtet.

Argument 1: Dabei nimmt Kuhbandner "implizit an, dass nur Personen getestet werden, die mit dem Corona-Virus infiziert sind", erwidert Mathematiker Schneider. "Doch das ist völlig absurd. Denn das kann man ja nicht wissen."

Diese Aussage ist einfach falsch. So wird im Artikel sogar der geringe Anteil von Personen, welcher bei den Coronavirus-Tests ein positives Testergebnis erhält, explizit diskutiert. Zudem wird bei der Analyse der Rolle der weiteren Krankheitserreger im Beitrag sogar explizit angenommen, dass zahlreiche Personen getestet werden, die gar nicht vom Coronavirus infiziert sind, was den beobachteten Anteil an erhaltenen positiven Testergebnissen verzerrt.

Argument 2: Zudem verwechselt er die Inzidenz mit der Prävalenz. Dies sind Schlüsselbegriffe der Epidemiologie. Die Prävalenz gibt Aufschluss über bestehende Fälle, die Inzidenz hingegen über neu auftretende Fälle. Nur auf letzteres zu gehen, sei falsch, erklärt Schneider. Denn die bislang Erkrankten sind weiterhin vorhanden - und eine potenzielle Gefahr. Das müsse in so wichtige Entscheidungen mit einbezogen werden.

Zunächst ist hier anzumerken, dass - wie zu Beginn meines Artikels an drei Beispielen angeführt - die ergriffenen Maßnahmen mit der Anzahl der Neuinfektionen begründet werden. Hier als Beispiel nochmals die Aussage von Jens Spahn im ZDF Heute Journal am 19. April: "Wenn wir es geschafft haben, gemeinsam auch die Zahl der Neuinfektion so runterzubringen Richtung 3.000 bis 4.000 am Tag, dann muss es uns auch gelingen dort zu bleiben, nur dann können wir schrittweise zurück in eine neue Normalität."

Zudem hat Herr Schneider hier auch inhaltlich nicht recht. Es ist natürlich selbst medizinischen Laien klar, dass erkrankte Personen sich nach der Testung nicht in Luft auflösen, sondern andere Personen weiterhin anstecken können. Damit tragen diese erkrankten Personen natürlich zur beobachteten Kurve der Neuinfektionen bei - laut RKI im Schnitt sogar einen Tag vor (!) Beginn der Erkrankung (also dem Beginn der Ausbildung von Krankheitssymptomen). Die Kurve der Neuinfektionen bildet aber das aktuelle Infektionsgeschehen ab, und für diese Kurve ist es relativ egal, wer sich wann genau wo angesteckt hat. Das ist vermutlich genau der Punkt, warum in jedem Lagebericht des RKI die Kurve der Neuinfektionen gezeigt wird.

Anders ausgedrückt: Um das Infektionsgeschehen beobachten zu können, muss man einfach jeden Tag auf das Geschehen schauen und die Neuinfektionen zählen. Zu diesen haben die bereits erkrankten Personen natürlich beigetragen, aber deren Erkrankung ist für das tägliche Zählen der Neuinfektionen nicht relevant.

Argument 3: Zudem lasse der Psychologe außer Acht, dass bei immer mehr Tests anteilig immer weniger Fälle gefunden werden.

Das ist ein statistischer Irrtum. Wie im Artikel ausgeführt und von vielen Experten angenommen, gibt es eine hohe Dunkelziffer von zwar infizierten, aber aufgrund der geringen Testanzahl nicht entdeckten Personen. Gerade diese hohe Dunkelziffer war ja das Argument von vielen Experten, warum man die Testanzahl erhöhen muss (siehe auch den Abschnitt weiter unten bei den Leserfragen).

Wenn es aber eine hohe Dunkelziffer gibt, dann wird man trivialerweise immer genau automatisch um so viel mehr Neuinfektionen finden, als man die Testanzahl erhöht hat (außer die wahre Anzahl an Neuinfektionen nimmt in Wirklichkeit ab). Teilt man dann die Anzahl der jeweils erhaltenen positiven Testergebnisse dann durch die Testanzahl, gibt es zwei Fälle, wann man nach der Testanzahlerhöhung einen geringeren Anteil an positiven Testergebnissen finden würde: Erstens, wenn die wahre Anzahl der Neuinfektionen stärker sinkt, als im Vergleich dazu die Erhöhung der Testanzahl steigt. Zweitens, wenn die Anzahl der Personen in der getesteten Personengruppe, welche keine Coronavirus-Infektionen aufweisen, stärker steigt, als es die Anzahl der Tests tut.

Letzteres könnte dann passieren, wenn man von einer symptomorientierten auf eine nicht symptomorientierte Testung wechselt - was im untersuchten Zeitraum nicht der Fall ist, oder wenn bei einer symptomorientierten Testung die Zahl der Atemwegserkrankungen aufgrund anderer Krankheitserreger steigt - was ebenfalls nicht der Fall ist.

Dass Prof. Schneiders Argument fehlgeht, wird auch durch die echten Daten zur Entwicklung des Anteils positiver Testergebnisse über die Zeit hinweg illustriert. Dazu muss man sich nur die rechte Graphik in der obigen Abbildung ansehen. Wie man dort sehen kann, steigt im März der Anteil positiver Testergebnisse trotz einer gleichzeitigen substantiellen Erhöhung der Testanzahl.

Argument 4: Hat man nur wenige Tests, werden diese bei Hochrisiko-Patienten vorgenommen, erklärt der Fachmann für Modellbildung und Simulation. Es würden nur die Menschen mit Atemwegserkrankungen und deutlichen Symptomen getestet. Dabei fände sich auch automatisch mehr.

Aus einer statistischen Perspektive heraus ist es in der Tat so, dass der Anteil erhaltener positiver Testergebnisse größer ist, wenn Personen mit einer deutlicheren Symptomatik getestet werden. Bei der von Prof. Schneider angenommenen Reihenfolge - zuerst wenige Tests und Testung bei deutlicheren Symptomen, dann mehr Tests und Testung bei weniger deutlichen Symptome - wäre aber ein Rückgang des Anteils erhaltener positiver Testergebnisse über die Zeit hinweg zu erwarten.

Genau das Gegenteil ist in der Realität der Fall, da steigt der Anteil der erhaltenen positiven Testergebnisse im März bei gleichzeitiger Erhöhung der Testanzahl (siehe rechte Graphik in der obigen Abbildung).

Argument 5: Mit der Zunahme der Testkapazitäten auf derzeit bis zu 70.000 pro Tag werden nun auch vermehrt die Menschen getestet, die der Gefahr der Ansteckung mit Covid-19 besonders ausgesetzt sind - auch aus Sicherheitsgründen. So arbeiten allein in Altenpflegeheimen über 700.000 Menschen, sagt Schneider. Ähnlich wie Ärzte und Pfleger in Krankenhäusern müssten diese regelmäßig getestet werden, um die Ausbreitung des Virus zu verhindern. Wenn dadurch die Prozente fallen, nimmt Kuhbandner an, dass nun die Ausbreitung gestoppt ist. Doch das ist nicht so.

Hier macht Herr Prof. Schneider eine Annahme, die meine Analysen im Artikel gar nicht betrifft, denn von mir werden nur die Kalenderwochen 10-15 analysiert, und laut folgender Pressemitteilung des Kassenärztlichen Bundesverbands vom 25. März hat Prof. Schneider hier einfach nicht recht:

"Nach wie vor empfiehlt das RKI, ausschließlich Patienten mit typischen Symptomen für COVID-19 zu testen", erklärte Gassen. In der medialen Berichterstattung ist die Anpassung der RKI-Kriterien bisweilen als eine Ausweitung der Tests dargestellt worden. "Das ist aber nicht der Fall", stellte Gassen klar. "Patienten ohne Symptome zu testen ist medizinisch nicht sinnvoll." Zu den Fällen, die weiterhin labordiagnostisch abgeklärt werden sollen, gehören Personen mit akuten Atemwegsproblemen, die in den vergangenen 14 Tagen Kontakt zu einem bestätigten COVID-19-Fall hatten.

Kassenärztlicher Bundesverband, KBV

Zudem hat er vermutlich nicht einmal für die darauffolgenden Wochen recht. Die vorhandene Testkapazität in den Kalenderwochen 16 und 17 wird laut Lagebericht vom 29. April bei weitem nicht ausgeschöpft. So werden nur 40.3% (Kalenderwoche 16) bzw.52.5% (Kalenderwoche 17) der eigentlich möglichen Tests durchgeführt.

Argument 6: Ein weiter Faktor der, laut Kuhbandner, "die Anzahl der Neuinfektionen künstlich nach oben verzerrt", seien andere Krankheitserreger für Atemwegsbeschwerden. Nehmen diese ab, wie nun etwa durch das Ende der Grippesaison, würden prozentual automatisch mehr Menschen positiv auf eine Infektion mit Sars-CoV-2 getestet werden. Doch momentan sei es so, dass die Menschen stark sensibilisiert sind, sagt Schneider. "Das müsste er als Psychologe eigentlich wissen." So gingen etwa nur 40 Prozent mehr Menschen in der Grippesaison zum Arzt, wenn sie Symptome wie bei einer Influenza haben. In der Corona-Pandemie sind deutlich mehr Menschen alarmiert, wenn sie etwa einen Hustenreiz verspüren. "Momentan sind Allergien im aufkeimen und die Anzahl der eingebildeten Symptome steigt. Dadurch erwartet man mit mehr Tests prozentual auch mehr negativ Getestete." Mit mehr Tests, auch prozentual mehr zu finden, das stimmt erst dann, wenn die eingebildeten Krankheiten zurück und die Pandemie wirklich richtig losgeht.

Auch dieses Argument ist einfach falsch. Die offiziellen Zahlen zur Anzahl der Arztbesuche wegen Atemwegserkrankung, die in den Influenza-Wochenberichten des RKI anhand der Rückmeldungen von Hunderten von Referenzpraxen geschätzt werden, werden ja in meinem Artikel genannt: Diese Zahl bleibt von Kalenderwoche 10 auf 11 gleich (1.6 Millionen), steigt dann minimal an (Kalenderwoche 12: 1.8 Millionen), um dann rapide abzunehmen (auf 1.1 Millionen in Kalenderwoche 13, auf 700.000 in Kalenderwoche 14 und schließlich auf 370.000 in Kalenderwoche 15).

Und selbst wenn Prof. Schneider Recht hätte, dann müsste man die berichteten Zahlen zu den Neuinfektionen um diesen Effekt korrigieren, damit man den wahren Anstieg in den Neuinfektionen sehen kann - also genau das, was in meinem Beitrag gemacht wird.