Die Überschätzung des tatsächlichen Anstiegs der Coronavirus-Neuinfektionen

Warum das Szenario einer epidemischen Ausbreitung des Coronavirus auf einem statistischen Trugschluss beruht

In einem vorherigen Beitrag zur fehlenden wissenschaftlichen Begründung der ergriffenen Corona-Maßnahmen wurde von mir die wissenschaftliche Grundlage methodisch genauer beleuchtet, auf der diese Maßnahmen begründet werden: Die berichteten Zahlen zu den Neuinfektionen. Einer der Aspekte, die genauer beleuchtet wurden, war der offenbare rapide Anstieg der Neuinfektionen, der viele dazu verleitet, von einer drohenden Epidemie mit mehreren Millionen von Infizierten in Deutschland auszugehen, die mit drastischen Maßnahmen bekämpft werden muss.

Neben vielen weiteren Aspekten, wurde das Problem beleuchtet, dass nicht nur die Anzahl der Neuinfektionen pro Tag zugenommen hat, sondern parallel dazu auch die Anzahl der durchgeführten Coronavirus-Tests. Da man bei einer hohen Dunkelziffer - wie es beim Coronavirus offenbar der Fall ist - bei einer Erhöhung der Testanzahl automatisch auch mehr Neuinfektionen findet, selbst wenn es in Wirklichkeit gar keinen Anstieg in den Neuinfektionen gibt, besteht die Gefahr, dass der beobachtete Anstieg in den berichteten Zahlen den wahren Anstieg in den Neuinfektionen überschätzt.

Es wurde dann in einer Grafik gezeigt, was passiert, wenn man eine einfache statistische Methode anwendet, um für den Effekt der Erhöhung der Testanzahl zu kontrollieren. Die Methode funktioniert so, dass man einfach die Anzahl der jeweils gefundenen Neuinfektionen durch die Anzahl der jeweils durchgeführten Tests teilt. Einfach ausgedrückt sagen einem die resultierenden Zahlen, was passiert wäre, wenn man über die Zeit hinweg immer mit der gleichen Anzahl an Tests getestet hätte. Es ergibt sich dann das im vorherigen Beitrag bereits gezeigte Bild:

Die Y-Achse bildet den Wachstumsfaktor ab, der Wert zeigt also, um wie viel die Zahl der Neuinfektionen im Vergleich zur Kalenderwoche 10 zugenommen hat. Die berichteten Zahlen erwecken den Anschein, als hätte sich die Zahl der Neuinfektionen von Kalenderwoche 10 auf 14 um das 41-fache erhöht. Korrigiert man für die Erhöhung der Testanzahl, ist demnach die Anzahl an Neuinfektionen nur um das 2,8-fache gestiegen, und ist zudem zwei Wochen früher rückläufig, als es laut den berichteten Zahlen zu den Neuinfektionen der Fall zu sein scheint. Damit würden die berichteten Zahlen den wahren Anstieg in den Neuinfektionen dramatisch überschätzen.

Ein genauerer Blick auf die statistischen Hintergründe

In vielen Emails wurde nachgefragt, inwiefern diese Art der Kontrolle um die Erhöhung der Testanzahl wirklich den wahren Anstieg in den Neuinfektionen schätzt. Deswegen soll kurz der statistische Hintergrund genauer beleuchtet werden. Anschließend wird zusätzliche empirische Evidenz vorgestellt, welche untermauert, dass der beobachtete Anstieg in den Neuinfektionen den wahren Anstieg extrem überschätzt.

Als Verständnishilfe für die statistischen Hintergründe wollen wir ein einfaches Beispiel benutzen: Nehmen wir an, in einem Garten sind an verschiedenen Stellen jeden Tag zehn Eier versteckt (das entspricht der wahren Anzahl an Neuinfektionen). Am ersten Tag darf man aber nur eine Minute suchen und findet ein Ei, am zweiten Tag dann zwei Minuten und man findet zwei Eier, und am dritten Tag darf man vier Minuten suchen und man findet vier Eier (das entspricht der Erhöhung der Anzahl der Tests über die Zeit). Man könnte nun den irreführenden Eindruck gewinnen, dass Tag exponentiell mehr Eier (Neuinfektionen) im Garten versteckt sind, weil man ja jeden Tag exponentiell mehr Eier findet. Aber das ist natürlich eine problematische Interpretation, denn in Wirklichkeit waren ja immer gleich viele Eier (Neuinfektionen) im Garten versteckt, und die erhöhte Anzahl an gefundenen Eiern (Neuinfektionen) geht nur auf die erhöhte Anzahl an Suchversuchen (erhöhte Anzahl an Coronavirus-Tests) zurück.

Bei einer Erhöhung der Testanzahl findet man also automatisch immer mehr Eier (außer die Menge der versteckten Eier verringert sich um einen größeren Faktor, als sich die Anzahl der Suchversuche erhöht), was aber nichts über die wahre Anzahl der pro Tag versteckten Eier (Neuinfektionen) aussagt.

Man sich an dem Beispiel noch zwei Aspekte klarmachen: Wenn im Garten jeden Tag tatsächlich mehr Eier (Neuinfektionen) im Garten versteckt wären, dann müsste man mehr Eier (Neuinfektionen) finden, als es allein durch die Erhöhung der Testanzahl hervorgerufen wird. Wären beispielsweise am ersten Tag 10, am zweiten Tag 20 und am dritten Tag 40 Eier versteckt, dann würde man am zweiten Tag nicht nur zwei Eier (Effekt der Verdopplung der Testanzahl), sondern vier Eier finden, und am dritten Tag nicht nur vier, sondern 16 Eier. Und wenn im Garten jeden Tag weniger Eier (Neuinfektionen) im Garten versteckt wären, dann würde eine Erhöhung der Suchversuche das verbergen. Wenn zum Beispiel am ersten Tag 10 und am zweiten Tag nur noch 5 Eier versteckt wären, dann würde man am ersten Tag ein Ei und auch am zweiten Tag ein Ei finden. Das erweckt den Eindruck, als wären immer gleich viele Eier im Garten versteckt, obwohl sich die Anzahl der versteckten Eier (Neuinfektionen) in Wirklichkeit um die Hälfte verringert hat.

Was passiert nun, wenn wir die gefundene Anzahl statistisch um die Anzahl der Suchversuche kontrollieren, in dem wir die Anzahl der gefundenen Eier (Neuinfektionen) durch die Anzahl der Suchversuche (Anzahl der Tests) teilen? Im Falle, dass die Anzahl der versteckten Eier (Neuinfektionen) gleichgeblieben ist, würde man für alle drei Tage den Wert 1 erhalten. Im Falle, dass sich die Anzahl der versteckten Eier (Neuinfektionen) jeden Tag verdoppelt hat, würde man die Werte 1, 2 und 4 erhalten. Und im Falle, dass sich die Anzahl der versteckten Eier (Neuinfektionen von einen auf den nächsten Tag um die Hälfte verringert hat, würden wir die Werte 1, 0.5 und 0.25 erhalten. Und das würde jeweils immer genau den wahren Verlauf des Anstieges der Eieranzahl (Anzahl der Neuinfektionen) abbilden.

Die statistische Kontrolle um die Testanzahl bildet also den wahren Verlauf der Neuinfektionen in diesem Fall sehr genau ab. Die Genauigkeit hängt nun von einigen Vorbedingungen ab. Die erste kennen wir schon: Es muss eine hohe Dunkelziffer an infizierten, aber aufgrund der zu geringen Testanzahl nicht entdeckten Personen geben, was laut Studien beim Coronavirus der Fall ist.

Eine zweite Vorbedingung ist, dass sich die Sensitivität des Tests - also die Wahrscheinlichkeit, eine infizierte Person damit auch zu entdecken - nicht ändert. Würde sich die Sensitivität mit der Zeit erhöhen, würden die um die Testanzahl korrigierten Neuinfektionszahlen - ebenso wie die nicht korrigierten Zahlen - den wahren Anstieg noch immer überschätzen. Würde sich die Sensitivität verringern, würden die um die Testanzahl korrigierten Neuinfektionszahlen den wahren Anstieg - ebenso wie die nicht korrigierten Zahlen - unterschätzen. Eine Kontrolle um die Testanzahl macht also hier auf alle Fälle Sinn, nur müsste man im Falle einer sich verändernden Sensitivität noch zusätzlich um die Veränderung in der Sensitivität korrigieren. Zur Sensitivität liegen keine Zahlen für Deutschland vor, allerdings ist es vermutlich eher unwahrscheinlich, dass sich die Sensitivität in relevanten Größenordnungen ändert.

Eine dritte Vorbedingung betrifft mögliche Änderungen in der auf das Coronavirus zu testenden Personengruppe. Das wurde auch schon in meinem vorherigen Beitrag erwähnt: Man teilt ja bei der Kontrolle um die Testanzahl die Anzahl der gefundenen Neuinfektionen durch die Anzahl der Tests - man bestimmt also den Anteil positiver Coronavirus-Diagnosen in Relation zur jeweiligen Testanzahl.

Wie bereits beschrieben, ist hier interessant, dass nur wenige der getesteten Personen eine positive Coronavirus-Diagnose erhalten, in Deutschland sind beispielsweise im Schnitt nur 7,5% der Testergebnisse positiv. Das heißt im Umkehrschluss, dass 93.1% der Testergebnisse negativ sind. Würden nun Einflussfaktoren hinzukommen, welche die Anzahl der negativen Testergebnisse erhöhen oder erniedrigen, würde sich automatisch auch der Anteil an erhaltenen Coronavirus-Diagnosen verändern, was damit die Schätzung des wahren Verlaufs mittels der Kontrolle um die Testanzahl verzerren würde.

Eine Möglichkeit, die schon im vorhergehenden Beitrag erwähnt wurde, ist, dass sich die Richtlinien der Testanwendung ändern. Würde man plötzlich von einer symptombezogenen zu einer nicht symptombezogenen Testung übergehen, würde wahrscheinlich der Anteil erhaltener Coronavirus-Diagnosen sinken, weil plötzlich viel mehr Personen getestet werden, die nicht infiziert sind. Wie wir im vorherigen Beitrag aber schon gesehen haben, ist das insbesondere für die Kalenderwochen in der obigen Grafik in Deutschland nicht der Fall. Hier wurde durchgängig symptombezogen getestet (siehe Pressemitteilung [CK1]der Kassenärztliche Bundesvereinigung vom 25. März):

Aber selbst wenn durchgängig symptombezogen getestet wird, gibt es einen Einflussfaktor, welcher die Anzahl der negativen Testergebnisse erhöhen oder erniedrigen kann. Wie im vorherigen Beitrag erwähnt, ist es bei einer symptombezogenen Testung ja so, dass die Personen mit negativem Testergebnis nicht gesund sind, sondern dass deren Krankheitssymptome auf andere Krankheitserreger als das Coronavirus zurückgehen. Würde die Verbreitung dieser Krankheitserreger zunehmen, würde gleichzeitig der Anteil erhaltener positiver Coronavirus-Diagnosen sinken, und damit würde die Korrektur um die Testanzahl den wahren Anstieg in den Neuinfektionen unterschätzen. Würde dagegen die Verbreitung dieser Krankheitserreger abnehmen, würde gleichzeitig der Anteil erhaltener positiver Coronavirus-Diagnosen steigen, und damit würde die Korrektur um die Testanzahl den wahren Anstieg in den Neuinfektionen noch immer überschätzen.

Der erste Fall ist äußerst unwahrscheinlich angesichts der bereits im vorherigen Beitrag erwähnten Tatsache, dass sich die Anzahl an akuten Atemwegserkrankungen - dem Leitsymptom der Anwendung des Coronavirus-Tests - laut der Influenza-Wochenberichte des RKI von Kalenderwoche 10 auf 12 nur relativ gering geändert hat (Anstieg von 1,6 auf 1.8 Millionen) und seitdem kontinuierlich sinkt (auf 1.1 Millionen in KW 13, auf 700.000 in KW 14 und schließlich auf 370.000 in KW 15. Die Verbreitung anderer Krankheitserreger sinkt also relativ deutlich seit Kalenderwoche 13. Damit überschätzt die Kontrolle um die Testanzahl ab diesem Zeitpunkt - wie am Beispiel der Verringerung der im Garten versteckten Eier oben veranschaulicht - sogar noch den wahren Verlauf der Neuinfektionen. Und in der Tat, wie im vorherigen Beitrag gezeigt, zeigt eine Einrechnung dieses Faktors dann folgendes Bild:

Weitere empirische Evidenz für die Überschätzung des wahren Anstiegs der Neuinfektionen

Interessanterweise wird die dramatische Überschätzung des wahren Anstiegs der Neuinfektionen durch die berichteten Zahlen durch weitere empirische Evidenz gestützt. Von vielen Experten wurde ja angemerkt, dass die wahre Ausbreitung des Coronavirus nur anhand einer repräsentativen Stichprobe bestimmt werden kann. Interessanterweise gibt es schon eine solche Stichprobe im Rahmen der Influenza-Überwachung des RKI, die seltsamerweise kaum erwähnt wird.

Im Rahmen dieser Überwachung werden die von Referenzpraxen an das RKI eingesendeten Proben von Patienten mit Atemwegsinfektionen auf das Vorhandensein von Influenza- und Erkältungsviren und seit dem 24. Februar auch auf das Vorhandensein des Coronavirus untersucht. In Reaktion auf den erstmaligen Nachweis des Coronavirus in einer dieser Probe in der 10. Kalenderwoche sagte Lars Schaade, der Vizepräsident des RKI, auf einer Pressekonferenz am 12. März:

Wir ziehen damit praktisch eine Stichprobe aus der Bevölkerung von Menschen mit Atemwegsinfektionen, um zu schauen, inwieweit sich das neue Virus in der Bevölkerung schon verbreitet hat.

Lars Schaade

Man kann sich nun anhand dieser repräsentativen Stichprobe ansehen, wie stark sich das Coronavirus in den auf die Kalenderwoche 10 folgenden Kalenderwochen verbreitet hat. In den wöchentlichen Influenzaberichten des RKI wird die Anzahl der untersuchten Proben und die Anzahl der Proben veröffentlicht, in denen Grippeviren und das Coronavirus nachgewiesen wurde. Die folgende Abbildung zeigt für die Kalenderwochen 10 bis 16 den prozentualen Anteil von Proben, in denen das Coronavirus bzw. Grippeviren nachgewiesen wurden (die Zahl über den Balken zeigt die Anzahl der auf das Coronavirus untersuchten Proben, die Höhe der Balken zeigt, in wie viel Prozent der Proben die jeweiligen Viren nachgewiesen wurden; das Datum entspricht hier dem Zeitpunkt der Probeentnahme):

Eine erste Beobachtung ist, dass das Coronavirus generell in einer sehr geringen Menge der Proben nachgewiesen wurde. Das passt recht gut dazu, dass bei den Coronavirus-Tests im Schnitt nur 7,5% der Testergebnisse positiv sind. Der etwas höhere Wert bei den Coronavirus-Tests im Vergleich zu den Proben aus der Influenza-Überwachung kann gut damit erklärt werden, dass die wahre Anzahl der tatsächlichen Neuinfektionen vermutlich deutlich geringer ist als die Anzahl positiver Testergebnisse. Beispielsweise ist es offenbar in der ärztlichen Praxis nicht unüblich, die laut RKI-Richtlinie bei einer Person zu machenden Nasen- und Rachenabstriche getrennt zu machen und in getrennten Tests zu testen, so dass in solchen Fällen eine coronainfizierte Person zwei positive Testergebnisse beisteuert.

Die zweite interessante Beobachtung ist: Wenn sich das Coronavirus wirklich so wie bei den berichteten Zahlen zu den Neuinfektionen verhalten hätte (Zunahme um das 41-fache von Kalenderwoche 10 auf 13), dann hätte der Anteil nachgewiesener Coronaviren in den Proben viel extremer steigen müssen. Stattdessen steigt der Anteil aber nur von 0.4% (KW 10) auf maximal 3.1% (KW 13). Von einer epidemischen Ausbreitung - man vergleiche das nur mit den Werten für die Grippeviren - ist hier wenig zu sehen. Die Schätzung der tatsächlichen Ausbreitung des Coronavirus anhand der im Rahmen der Influenza-Überwachung erhobenen repräsentativen Stichproben aus der Bevölkerung von Menschen mit Atemwegsinfektionen bestätigt also, dass der Anstieg in den Neuinfektionen weitaus geringer ist, als es die berichteten Zahlen zu den Neuinfektionen nahelegen.

Noch eine wichtige Anmerkung: In allen obigen Grafiken entspricht das jeweilige Datum dem Zeitpunkt der Probenentnahme. Wie in meinem vorherigen Beitrag herausgearbeitet, entspricht der Zeitpunkt der Probenentnahme - also der Testzeitpunkt - aber nicht dem Zeitpunkt der tatsächlichen Neuinfektion. Laut RKI vergehen zwischen dem Zeitpunkt der Ansteckung - also der tatsächlichen Neuinfektion - und der Ausbildung von Krankheitssymptomen im Schnitt 5-6 Tage und zwischen der Ausbildung von Krankheitssymptomen und der Meldung des Testergebnisses an das RKI nochmals im Schnitt zwischen 7-8 Tage[CK2]. Der Rückgang in den tatsächlichen Neuinfektionen hat also bereits in etwa 12-14 Tage vor dem Zeitpunkt des Rückgangs stattgefunden, der in den obigen Grafiken zu beobachten ist.

Fazit

Ich möchte an dieser Stelle noch einmal das Fazit meines vorherigen Beitrags wiederholen: Praktisch alle der ergriffenen drastischen Maßnahmen werden damit begründet, dass dadurch ein Anstieg in den täglichen Neuinfektionen verhindert werden soll, um einer angeblichen exponentiellen Ausbreitung des Coronavirus entgegenzuwirken. Allerdings zeigen genauere Analysen dieser Zahlen, dass der dort beobachtete rasante Anstieg Anfang März in Wirklichkeit in großen Teilen nur die schnelle Erhöhung der Testanzahl widerspiegelt. Wie sowohl eine statistische Kontrolle der Zahlen um die Erhöhung der Testanzahl als auch die Häufigkeit des Coronavirus in den Proben aus der Influenza-Überwachung nahelegen, gab es in Wirklichkeit keine exponentielle Ausbreitung des Coronavirus.

Zudem zeigt die Kontrolle um die Erhöhung der Testanzahl, dass ein Rückgang bereits bis zu zwei Wochen früher stattgefunden hat, als die berichteten Zahlen zu den Neuinfektionen den Anschein erwecken. Da diese Zahlen zudem zusätzlich dem tatsächlichen Infektionszeitpunkt um 12-14 Tage hinterherhinken, legt dies nahe, dass ein Rückgang in den Neuinfektionen womöglich bereits seit der ersten oder zweiten Märzwoche zu beobachten ist.

Vermutlich kann demnach zumindest keine der ergriffeneren drastischeren Maßnahmen wie die Schließung der Schulen und Kindertagesstätten (16. März) oder das umfangreche bundesweite Kontaktverbot (23. März) den Rückgang in den Neuinfektionen erklären. Wie in meinem vorherigen Beitrag gezeigt, zeichnet sich in Deutschland auch keine Überlastung der Intensivstationen oder eine höhere Anzahl an Sterbefällen im Vergleich zu den Vorjahren ab, so dass auch damit keine der Maßnahmen gerechtfertigt werden kann.

Das aktuelle Schüren der Angst vor einer zweiten Infektionswelle mit einem erneuten exponentiellen Anstieg der Coronavirus-Infektionen, die aktuell von Seiten vieler Experten wie beispielsweise Christian Drosten von der Charité erfolgt, erscheint damit ein unrealistisches Szenario zu sein, da der beobachtete schnelle Anstieg in den Neuinfektionen Anfang März offenbar nur ein künstlicher Effekt der damaligen schnellen Erhöhung der Testanzahl war. Es erscheint äußerst wichtig, diese Punkte endlich in der Öffentlichkeit richtigzustellen, um Menschen ihre womöglich unnötigen großen Ängste zu nehmen und die extremen negativen Nebenwirkungen der wahrscheinlich nicht mehr notwendigen drastischen Eingriffe in unsere Grundrechte zu beseitigen.

Eine Abschlussbemerkung

Ich möchte abschließend noch einmal darstellen, warum ich mit einem solchen Beitrag an die Öffentlichkeit gehe. Als Psychologe weiß man um die möglichen extremen Nebenwirkungen der ergriffenen drastischen Maßnahmen. Ich möchte das kurz noch einmal anhand des Beispiels aus meinem vorherigen Beitrags illustrieren:

Es gibt große Studien dazu, wie viele zusätzliche Suizide die Weltfinanzkrise von 2008-2010 - welche von der drohenden Wirtschaftskrise laut Fachexperten um Welten übertroffen werden wird - mit sich gebracht hat: Allein in den USA, Canada und Europa (andere ärmere Länder nicht mitgerechnet, die von unserer Kaufkraft abhängen und womöglich entsprechend ebenfalls leiden werden) waren das 10.000 zusätzliche Suizide in den Jahren 2008-2010. Wenn man sich klarmacht, dass hinter jedem Suizid viele weitere Menschen stehen, die ähnlich belastet sind, aber keinen Suizid begehen, wird deutlich, wie viel Leid die getroffenen Maßnahmen mit sich bringen können.

Hier ist wichtig zu erwähnen, dass solche Suizidraten in Reaktion auf wirtschaftliche Krisen kein Automatismus sind und man hier Gegenmaßnahmen ergreifen kann. Aber wenn man die Vergangenheit als Heuristik nimmt, was womöglich in Zukunft passieren könnte - denn auch damals hat man ja versucht Gegenmaßnahmen zu ergreifen - ist mit äußerst drastischen Nebenwirkungen zu rechnen.

Wenn man dann als ein in Forschungsmethoden erfahrener Wissenschaftler bemerkt, dass womöglich die den ergriffenen Maßnahmen zugrundeliegende wissenschaftliche Basis Probleme aufweist, sucht man normalerweise nicht den Weg in die Öffentlichkeit. Stattdessen versucht man Kontakt mit den entsprechenden Fachexperten aufzunehmen, um auf diese möglichen Probleme hinzuweisen. Seit Anfang April habe ich mehreren Virologen mehrmals Emails geschrieben, in denen ich sowohl auf das Problem der Erhöhung der Testanzahl als auch auf die Befunde zu den Proben im Rahmen der Influenza-Überwachung hingewiesen habe. Leider habe ich bis heute keine Antwort auf meine Fragen erhalten, was aber bei der aktuellen Arbeitsbelastung dieser Personen absolut verstehbar ist. In einer solchen Situation bleibt einem aber dann nur der Weg an die Öffentlichkeit.

Das Problem ist, dass man dann oft sehr schnell als "Verschwörungstheoretiker" abgetan wird, was manche dazu verleitet, nicht die Öffentlichkeit zu suchen. In diesem Falle ist es allerdings einfach so: Alle berichteten Analysen basieren auf den offiziellen Zahlen, und jede Person kann das einfach selber nachprüfen und die Dinge entsprechend für sich durchdenken.

Noch ein abschließender Satz: Es geht hier in keinster Weise darum, das Leid betroffener Menschen zu verharmlosen. Hier muss es das höchste Ziel einer jeden Gesellschaft sein, diesen Menschen bestmöglich zu helfen. Es geht hier darum, das von vielen angenommene Szenario einer epidemischen Ausbreitung des Coronavirus mit mehreren Millionen von Infizierten zu hinterfragen. Denn sollte dieses Szenario in Wirklichkeit gar nicht drohen, würden viele Menschen ohne wirklichen Grund so große Ängste erleben, und man würde ohne wirklichen Grund Maßnahmen ergreifen, deren womöglich dramatische negative Nebenwirkungen noch gar nicht abgeschätzt werden können.

Prof. Dr. Christof Kuhbandner, Fakultät für Humanwissenschaften, Universität Regensburg

(Christof Kuhbandner)