Warum die Wirksamkeit des Lockdowns wissenschaftlich nicht bewiesen ist

Der fehlende Effekt des Lockdowns im Frühjahr in Deutschland

Auch in den Daten zur Virusausbreitung in Deutschland lässt sich kein Effekt von Lockdowns erkennen. Die unten folgende Abbildung zeigt den Verlauf der effektiven Reproduktionszahl R ("R-Wert") im März laut der Schätzung des RKI in einem Artikel im Epidemiologischen Bulletin. Wichtig ist anzumerken, dass der vom RKI für ein bestimmtes Datum geschätzte R-Wert das Infektionsgeschehen von vor etwa ein bis zwei Wochen abbildet. So schreibt das RKI in einem Artikel zur genaueren Beschreibung der Schätzung des R-Wertes:

Rein technisch handelt es sich bei ᵄ5t um eine sog. instantaneous reproduction number [Cori et al. (2013)], welche rückwärtsschauend in der Zeit definiert ist. (…) Bezieht man noch die Inkubationszeit von 4 bis 6 Tagen mit ein, so beschreibt die am Tag u berichtete Reproduktionszahl ᵄ5t in der sensitiven Variante [4-Tage-R-Wert] die Neuinfektionen im Zeitraum u-13, ⋯ , u-8. (…) Als Beispiel: Im RKI-Lagebericht am 15. Mai 2020 bezieht sich der angegebene sensitive R-Wert auf das Infektionsgeschehen im Zeitraum vom 02. Mai 2020 bis 07. Mai 2020.

In der im Folgenden abgebildeten Graphik des RKI wurde das Original-Datum in der RKI-Graphik um diese Zeitverzögerung korrigiert (Korrektur um zehn Tage Zeitverzögerung) und der Zeitpunkt der im März ergriffenen Maßnahmen entsprechend eingezeichnet (rote gestrichelte Linien). Es ergibt sich folgendes Bild:

Eine korrekte Einzeichnung der Zeitachse zeigt also sehr klar, dass weder der Lockdown noch die Schließung von Schulen, Kindertagesstätten und Geschäften eine Wirkung erzielt hat. Der R-Wert war bereits unter eins und reduzierte sich in der Folge auch nicht in relevanter Weise. Einzig die Absage von Großveranstaltungen könnte noch eine minimale Wirkung erzielt haben.

Allerdings ändert sich der Kurvenverlauf durch die Verordnung der Maßnahme nicht, sondern der Rückgang geht mit der gleichen Geschwindigkeit weiter wie zuvor, was auch hier eine Wirkung unwahrscheinlich macht, da es sich offenbar um einen Rückgang unabhängig von den ergriffenen Maßnahmen handelt (saisonale Effekte und womöglich sich langsam aufbauende Herdenimmunität).

Bestätigt wird dies durch eine in der Zeitschrift Safety Science erschienene Studie zum Verlauf der Virusausbreitung in Deutschland, welche sich insbesondere dadurch auszeichnet, dass der Abstand zwischen dem Meldezeitpunkt eines positiven Testergebnisses und dem tatsächlichen Infektionszeitpunkt sehr exakt bestimmt wurde, was in anderen Studien häufig ein Problem darstellt (siehe unten). Die Ergebnisse werden vom Autor folgendermaßen zusammengefasst (Übersetzung durch den Autor):

Der Rückgang der Infektionen Anfang März 2020 ist auf relativ geringe Interventionen und freiwillige Verhaltensänderungen zurückzuführen. Zusätzliche Auswirkungen späterer Maßnahmen können nicht klar erkannt werden. Die Aufhebung der Maßnahmen ab dem 20. April führte nicht zu einer erneuten Zunahme der Infektionen. Die Wirksamkeit der meisten der in Deutschland ergriffenen Maßnahmen ist daher fraglich.

Der Befund, dass eine Aufhebung der Maßnahmen nicht zu einem Anstieg der Virusausbreitung führte, legt nahe, dass der Verlauf der Virusausbreitung eher einem saisonalen Muster folgt und nicht durch die Einführung oder das Aufheben von Maßnahmen bedingt ist. Dass dem so sein könnte, legt ein – allerdings nicht peer-reviewed – Arbeitspapier des National Bureau of Economic Research (NBER), einer US-amerikanischen überparteiliche Nonprofit-Forschungsorganisation, nahe. Dort wurde anhand der Daten aus 25 US-Bundesstaaten sowie 23 Ländern, die je über 1.000 Tote zählten, gezeigt, dass ab dem Auftreten von 25 "Covid-19-Todesfällen" in allen untersuchten Ländern eine gleichförmige Entwicklung zu beobachten war und die Wachstumsrate binnen 20-30 Tagen auf null fiel, unabhängig von der Art und dem Zeitraum der ergriffenen Maßnahmen. Die Autoren schließen daraus:

Unsere Befunde (…) lassen weitere Zweifel aufkommen an der Bedeutsamkeit der nicht-pharmazeutischen Interventionen (insbesondere von Lockdowns) für den Verlauf der COVID-19-Übertragungsraten über die Zeit und über verschiedene Regionen hinweg. In vielen der Regionen in unserer Stichprobe, in denen zu Beginn Lockdowns verordnet worden waren, wurden diese im untersuchten Zeitraum wieder aufgehoben, in manchen Regionen wurden gar keine wirklichen Lockdowns verhängt. Trotzdem blieb die effektive Reproduktionszahl in allen Regionen im Vergleich zu den anfänglichen Werten weiterhin niedrig, was darauf hinweist, dass die Aufhebung der Lockdowns kaum Auswirkungen auf die Virus-Übertragungsraten hatte.

Methodische Probleme in Studien, die von Wirksamkeit von Lockdowns ausgehen

Es gibt eine Reihe von Studien, in welchen sich entgegen der bisher berichteten Studien ein Effekt von Lockdowns zu zeigen scheint. Allerdings basieren diese Studien auf mathematischen Modellierungen der Virusausbreitung, für welche bestimmte Vorannahmen für die im Modell enthaltenen Parameter gemacht werden müssen, welche kritisch zu hinterfragen sind. So heißt es zu diesen Studien in einem erschienenen Cochrane Rapid Review (Übersetzung durch den Autor):

Die existierende empirische Evidenz ist begrenzt, da alle 10 Studien zu COVID-19 mathematische Modellierungsstudien sind, die auf Datensätzen mit limitierter Qualität basieren und in welchen unterschiedliche Annahmen zu wichtigen Modellparametern getroffen werden.

Das Problem falscher Modellierungen soll im Folgenden an zwei prominenten Studien illustriert werden. Die erste stammt von einer Forschergruppe um Neil Ferguson vom Imperial College London, welche in der Fachzeitschrift Nature erschienen ist und eine hohe Effektivität von Lockdowns nachzuweisen scheint.

Allerdings enthält diese Studie mehrere fundamentale methodische Fehler. In der Studie wurde ausgehend vom Verlauf der in elf europäischen Ländern zu verzeichnenden Sars-CoV-2-Todesfälle mittels einer mathematischen Modellierung auf den Verlauf der Virusausbreitung (R-Wert) rückgeschlossen, mit dem Ziel, den Effekt verschiedener Maßnahmen auf die Virusausbreitung zu bestimmen. Die Ergebnisse scheinen einen großen Effekt von Lockdowns zu zeigen.

Wirft man einen genaueren Blick in die Studie, wird zum einen offenbar, dass der existierende Meldeverzug bei den Todesfällen nicht berücksichtigt wurde. Als Eintrittsdatum eines Todesfalls wurde das Meldedatum bei den Gesundheitsämtern verwendet, obwohl das tatsächliche Sterbedatum bis zu mehrere Wochen vorher liegt. Die in der Studie modellierten Verlaufskurven der Virusausbreitung spiegeln also das tatsächliche Infektionsgeschehen mit einer deutlichen Zeitverzögerung ab, so dass der Schluss auf die Wirkung von Maßnahmen nicht valide ist.

Weiterhin fällt bei einem genaueren Blick auf die Graphiken zu den modellierten Verlaufskurven der R-Werte auf, dass die Modellierung den tatsächlichen Verlauf der Virusausbreitung falsch abbildet. In der folgenden Abbildung sieht man auf der linken Seite den in der Studie mittels der Modellierung für Deutschland geschätzten Verlauf der Virusausbreitung (R-Wert) und auf der rechten Seite den tatsächlichen Verlauf der täglich gemeldeten Neuinfektionen laut Robert-Koch Institut (RKI):

Man sieht sofort, dass die Modellierung die Realität grundlegend falsch abbildet: Ein R-Wert von vier bedeutet, dass sich die Anzahl der Neuinfektionen binnen einer Generationszeit eines Virus (Zeitspanne von der Infektion einer Person bis zur Infektion der von ihr angesteckten Fälle, bei Sars-CoV-2: vier Tage) vervierfacht. Ein R-Wert von unter eins bedeutet, dass sich die Anzahl der Neuinfektionen binnen einer Generationszeit verringert.

Laut der Modellierung der Virusausbreitung des Imperial College London müsste sich demnach in der Verlaufskurve der Neuinfektionen ein spontaner Sprung von einem extremen Wachstum der Anzahl der Neuinfektionen (alle vier Tage vervierfacht sich die Anzahl der Neuinfektionen) auf einen Rückgang der Anzahl der Neuinfektionen zeigen, was nicht der Fall ist.

Wie ist diese seltsame Modellierung des Imperial London College zu erklären? Des Rätsels Lösung findet sich, wenn man den Artikel genauer liest. Dort heißt es (Übersetzung durch den Autor):

Unser Modell nimmt an, dass Veränderungen im R-Wert eine sofortige Reaktion auf das Einführen von Maßnahmen sind, (…) und dass der Effekt von Maßnahmen über die Zeit hinweg konstant bleibt.

Das heißt also, die Modellierung war von Anfang an so angelegt, dass ein Rückgang der Fallzahlen praktisch ausschließlich auf dem Effekt von Maßnahmen beruhen darf. Bei Verwendung einer solchen Modellierung muss sich also automatisch immer ein Effekt von Maßnahmen ergeben, da ein Rückgang ohne Maßnahmen im Modell nicht vorgesehen ist (siehe die folgende Abbildung für eine Illustration). Ein solches Vorgehen ist unwissenschaftlich, da das Modell gar nicht zulässt, dass auch herauskommen könnte, dass die Maßnahmen nicht wirken (für ausführlichere publizierte Kritiken siehe Frontiers und medRxiv).

Die zweite prominente fehlerhafte Modellierungsstudie stammt von einer Forschergruppe um Viola Prieseman vom Max-Planck-Institut für Dynamik und Selbstorganisation, welche in Science publiziert wurde. Dort wurde versucht, mittels einer mathematischen Modellierung das Infektionsgeschehen in Deutschland im März und April zu beschreiben und darauf aufbauend den Effekt der drei zentralen Maßnahmen in Deutschland zu bestimmen. Das in der ursprünglichen Publikation berichtete Ergebnis ist auf der linken Seite der folgenden Abbildung zu sehen:

Angesichts dieses Ergebnisses könnte man meinen, dass die weiter oben gezeigte Graphik des RKI fehlerhaft sei, weil offenbar die drei Maßnahmen doch etwas bewirkt haben. Wie ist diese eigenartige Abweichung gegenüber der Schätzung durch das RKI zu erklären?

Eine kritische Analyse der Methoden der ursprünglichen Publikation offenbart einen fundamentalen Fehler, welcher die Abweichung erklärt: Die Modellierung des Infektionsgeschehens erfolgte anhand des Datums der Meldung einer Infektion. Allerdings liegt der Zeitpunkt der Infektion wie bereits erwähnt deutlich vor dem Meldedatum der Infektion. Ende März lagen beispielsweise zwischen Infektionszeitpunkt und Meldezeitpunkt im Schnitt in etwa 13-14 Tage.

Das sich daraus ergebende Problem ist, dass damit in der ursprünglichen Publikation das tatsächliche Infektionsgeschehen zeitverzögert abgebildet und der Effekt der Maßnahmen damit falsch eingeschätzt wurde. Auf entsprechende kritische Kommentare zum Artikel hin wurde von der Forschergruppe eine sogenannte Technical Note veröffentlicht, in welchem der Verlauf des Infektionsgeschehens nicht anhand des Meldedatum modelliert wurde, sondern – dem Vorgehen des RKI folgend – anhand des Datums des Erkrankungsbeginns, welches nur etwa fünf Tag nach dem Infektionszeitpunkt liegt und damit den tatsächlichen Infektionszeitpunkt genauer abbildet.

Das Ergebnis ist auf der rechten Seite der obigen Abbildung abgebildet. Wie eindrücklich zu sehen ist, zeigt sich nun ein vergleichbarer Verlauf wie in der Graphik des RKI: weder die Schließung der Schulen, Kindertagesstätten und Geschäfte noch der Lockdown wirkten sich auf relevante Weise auf die Virusausbreitung aus (für eine ausführlichere Kritik siehe "Was Germany’s Corona Lockdown Necessary?").

Eine Anmerkung ist abschließend noch wichtig: Die Darstellung der existierenden Studien zum Effekt der Maßnahmen hat nicht den Anspruch erschöpfend zu sein. Das würde den Umfang dieses Artikels sprengen. Das Ziel besteht darin, den zutiefst unwissenschaftlichen Charakter der Stellungnahme der Leopoldina zu illustrieren.

Angesichts der beschriebenen Befundlage ist es zutiefst befremdlich, wenn eine wissenschaftliche Fachgesellschaft in einer politisch hoch gehandelten Stellungnahme die Empfehlung für Maßnahmen auf der Basis des arbiträren Herausgreifens eines zufällig stützenden Einzelbeispiels begründet und den existierenden Stand der Forschung komplett ignoriert und mit keiner Silbe erwähnt.