Corona-Pandemie: Die Mathematik hinter den Reproduktionszahlen R

In den vergangenen Tagen ist bei den Debatten über das Coronavirus die Reproduktionszahl in den Fokus gerückt. Zeit, ein bisschen was zu erklären.

Lesezeit: 4 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 695 Beiträge

(Bild: creativeneko/Shutterstock.com/RKI)

Von

Viel Verwirrung gab es in der Pressekonferenz des Robert-Koch-Instituts (RKI) am Donnerstag über die Berechnung der Reproduktionszahl R und der sogenannten Nowcast-Werte. Zudem wird immer wieder munter die Basis-Reproduktionszahl R0 mit der effektiven Reproduktionszahl Reff durcheinander geworfen. Höchste Zeit, einmal Klarheit zu schaffen.

"Germany’s R0 Coronavirus Experiment, Berlin tries to manage a variable no one can measure accurately" so titelte das Wall Street Journal am Dienstag, aber gehts dabei wirklich um R0? Und kann das RKI die Reproduktionszahl genauer messen?

Hätten die fragenden Journalisten in der Pressekonferenz zuvor in das Epidemiologische Bulletin 17 (mit Update vom 23. April) geschaut, hätten sie gewusst, wie das RKI die Nowcast- und die davon abgeleiteten R-Werte bestimmt und was sich an der Darstellung im Situationsbericht seit Mittwoch geändert hat. Genauer gesagt, geht es um die effektive, aktuelle Reproduktionszahl (mehr zur Begriffsklärung folgt weiter hinten), die über das sogenannte Nowcasting bestimmt werden. Bei diesem Nowcasting werden die Verzugszeiten herausgerechnet und auf den (bei über 60 Prozent) angegebenen oder ansonsten statistisch ermittelten Erkrankungstermin bezogen. Das ist dann wesentlich aussagekräftiger als der Bezug auf eher zufällige Meldetermine.

Leider liegt dem RKI zum aktuellen Tag immer nur ein kleiner Teil der Meldungen von den Gesundheitsämtern vor, sodass die später folgenden zahlreichen Nachmeldungen in den normalen Fall-Diagrammen erst einmal fehlen. Andere Quellen wie etwa die Berliner Morgenpost und die Zeit holen sich daher einen Teil der Nachmeldungen direkt von den Gesundheitsämtern, sodass sie gegenüber dem RKI um ein, zwei Tage voraus sind – aber dennoch fehlen noch etliche Daten, denn die Nachmeldungen reichen teilweise bis zu drei Wochen zurück. Im RKI-Situationsbericht und im Dashboard kann man sich hingegen – zwar verzögert – den korrigierten Verlauf mit den eingearbeiteten Nachmeldungen anschauen, wobei die gegenüber dem Vortag neu hinzugekommenen farblich markiert sind.

Beim Nowcast werden im Voraus die Nachmeldungen statistisch abgeschätzt, was aber erst vernünftig geht, wenn man wenigstens drei Tage abwartet und zumindest noch die in dieser Zeit eingetroffenen Nachmeldungen berücksichtigt. Das RKI macht die Abschätzung nur für Deutschland insgesamt, für Bayern berechnen es die Statistiker von der LM-Universität München.

Um die Tagesschwankungen auszugleichen, haben die RKI-Wissenschaftler um Matthias an der Heiden für die Darstellung D(t) der per Nowcast ermittelten Fälle N(t) eine gleitende Mittelung über drei Tage vorgenommen:

D(t) = (N(t)+N(t-1)+N(t-2)) / 3

Nun liegt aber das für den R-Wert zugrundeliegende mittlere "Generationsintervall" bei vier Tagen, das heißt, dass man davon ausgeht, dass ein Infizierter etwa im Mittel nach vier Tagen eine weitere Person ansteckt. Das deckt sich in etwa mit dem Maximum der Ansteckungswahrscheinlichkeit, das chinesische Forscher zu 0,7 Tagen vor dem symptomatischen Ausbruch verortet haben.

Für die Berechnung des R-Wertes wird daher das Verhältnis des Mittelwertes der Nowcast-Werte der letzten vier Tage zum Mittelwert der vier Tage davor ermittelt:

Reff(t) = (N(t)+N(t-1)+N(t-2)+N(t-3)) / (N(t-4)+N(t-5)+N(t-6)+N(t-7))

Genauere Berechnungen berücksichtigen eine Gaußverteilung um das mittlere Generationsintervall herum, was sich laut RKI aber im Ergebnis nicht wesentlich von der Berechnung mit dem einfachen Mittelwert unterscheidet.

Die RKI-Wissenschaftler haben dann aber erkannt, dass es zweckmäßiger für den Leser ist, das Nowcast-Diagramm dahingehend zu ändern, dass man auch hier ebenfalls (gleitend) über vier statt drei Tage mittelt:

D(t) = (N(t)+N(t-1)+N(t-2)+N(t-3))/4

dann kann man einfach die effektive Reproduktionszahl (R) aus den veröffentlichten Balken ablesen:

Reff(t) = D(t) / D(t-4).

Bleibt also festzustellen: an der Berechnung der Reproduktionszahl hat sich nichts geändert, lediglich die Darstellung im Nowcast-Diagramm wurde geändert, um die Berechnung von R leichter nachvollziehen zu können.

Das Nowcast-Diagramm vom 29.4.2020 mit leichter veränderter Mittelung. Zusätzlich sieht man die kleinen roten "Scan-Punkte" zum Auslesen der Werte, aus denen man direkt die eff. Reproduktionszahl bestimmen kann.

(Bild: RKI /as )

Leider gibt es bislang keine Möglichkeit, die Nowcast-Werte N(t) beim RKI herunterzuladen. So hat man lediglich die Balkendiagramme im täglichen Situationsbericht. Die daraus abgelesenen Nowcast-Werte sind naturgemäß etwas ungenau (ein Pixel entspricht dabei ungefähr 15 Fällen), aber man kommt damit trotzdem auf den aktuell bekannt gegebenen Wert von 0,75. Zudem hat man in der neuen Darstellung auch die Möglichkeit, rückwirkend die R-Werte vergangener Tage mit den Nachmeldungen, also mit exakteren Nowcastwerten zu bestimmen. So dürfte der R-Wert vor einigen Tagen von 1,0 im Nachhinein bestimmt wohl doch eher um 0,9 gelegen haben.

Die mittleren eff. Reproduktionszahlen (ohne Konfidenzintervalle) mit aus dem Nowcasting-Diagramm ausgelesenen aktualisierten Werten und die vom RKI damals gemeldeten Zahlen

(Bild: Andreas Stiller)

Die Reproduktionszahl gibt an, viele Leute ein vom Virus Infizierter innerhalb einer betrachteten Community (Staat, Bundesland, Landkreis ...) im Schnitt ansteckt. Dabei gibts es zum einen die Basisreproduktionszahl R0, die gemeinhin so definiert ist, dass sie die Reproduktionszahl ohne jegliche Schutz- und Gegenmaßnahmen beziffert und dass es auch keine bereits vorhandene Immunität gibt.

Zum anderen spezifiziert man die effektive Reproduktionszahl Reff (t) (auch Nettoreproduktionszahl, oft nur R genannt), die zum Zeitpunkt t effektiv anhand der Falldaten bestimmt wird und die das RKI inzwischen täglich im Situationsbericht aufführt – für ein vier Tage zurückliegendes Datum.

Die Basisreproduktionszahl R0 von Sars-CoV-2 wird allgemein zu 2,5 bis 4 abgeschätzt; andere Virusarten sind da weit aggressiver. Masern etwa geht hinauf bis zu einem R0-Wert von 18. Die Angaben dazu variieren stark, je nach Studie und Betrachtungsart kann der Wert bei Masern zwischen 3,7 und 203 liegen.

Bei der R0-Bestimmung geht natürlich eine gemittelte Bevölkerungsdichte und ein gemitteltes Kontaktverhalten in diesen Wert ein – ein Einsiedler wird immer einen R0-Wert von 0 haben, es sei denn man bezieht die Tiere mit ein. Genauer gesagt sind es üblicherweise drei Parameter, die für R0 herangezogen werden: die Dauer der Ansteckungsphase einer infizierten Person, die Wahrscheinlichkeit der Übertragung pro Kontakt und die Kontaktrate.

Für die Bestimmung von R0 sind Ereignisse in einem überschaubaren, abgeschlossenen Bereich nützlich, wie etwa die Infektion auf dem Kreuzfahrtschiff Diamond Princess mit 2700 Passagieren und einer Crew von 1100. Dabei muss man aber berücksichtigen, dass an Bord die Bevölkerungsdichte etwa viermal so hoch war, wie etwa in Wuhan und auch das Kontaktverhalten dürfte auf einem Kreuzfahrtschiff sicherlich anders sein, als in einer Großstadt. Die analysierenden Wissenschaftler unterschieden dabei auch zwischen dem Kontaktverhalten zwischen den Passagieren und den Crew-Mitgliedern.

Der "anfängliche" R0-Wert lag demzufolge etwa viermal so hoch wie in Wuhan bei 14,8. Nach Einführung rigoroser Quarantänemaßnahmen brach der effektive R-Wert (in der Studie leider weiterhin R0 genannt) auf etwa 1,8 ein. Es gibt zahlreiche weitere Abschätzungen zum R0-Wert, für Deutschland geht man von etwa 3 aus. Aus der Zahl resultieren dann auch Angaben zum Erreichen der Herden-Immunität bei einer Durchseuchung von 2/3 der Gesamtbevölkerung. (as)