Corona-Reproduktionszahl: sensitiv, stabil, komplex, instantan ... und primitiv

R für R-Wert

Inhaltsverzeichnis

Es gibt auch noch zahlreiche andere hübsche Interpretationen der Reproduktionszahl, etwa diejenige, die die Statistiker der Universität Ilmenau in Zusammenarbeit mit den Kollegen der Uni Bielefeld vorgestellt haben. Ihr Berechnungsmodell bezieht sich wie beim HZI zunächst auf den Meldetermin. Hier fehlt jegliche Mittelung, so dass der sogenannte "instantane R-Wert" im Wochenverlauf insbesondere in Deutschland kräftig zwischen 0,3 und 1,25 schwankt. Für Deutschland holen sich die Wissenschaftler dabei die Daten vom RKI, für die Auswertung anderer Länder via Github von der Johns-Hopkins-Universität. Um den Meldeverzug auszugleichen, verschieben sie dann das Bezugsdatum um eine Woche. Das stimmt nach meinen Rechnungen auch recht gut mit dem Mittelwert der Zeitunterschiede zwischen Erkrankungs- und Meldetermine überein (sofern angegeben), der bei 6,7 Tagen für Deutschland liegt.

Größere Unterschiede zeigen sich aber bei den Bundesländern: Bayern ist hier das Schlusslicht mit 7,5 Tagen, Sachsen liegt bei 4,8 Tagen. Diesen Verzug darf man aber nicht mit dem Meldeverzug verwechseln, der zwischen dem Meldetermin des Testergebnisses beim Gesundheitsamt und der irgendwann erfolgenden Meldung über die Landesgesundheitsbehörde zum RKI liegt. Bei diesem Meldeverzug sind Saarland, Bremen, Schleswig Holstein und Rheinland Pfalz vorbildlich, sie lieferten zumindest in der untersuchten letzten Woche meist noch am selben Tag. Selbst Nordrhein-Westfalen als eines der großen "Epizentren" ist mit nur 0,7 Tage Verzug noch gut im Rennen. Das andere Epizentrum Baden-Württemberg hängt demgegenüber mit 6,3 Tagen ziemlich weit zurück, Bayern liegt in der Mitte dazwischen und rätselhaft bleibt, was in Hamburg los ist – die Hanseaten hängen über einen halben Monat hinterher ... Diese mittleren Verzugswerte wurden aus den Falldaten für Neuinfizierte in KW20 aus der RKI-Datenbank bei npgeo ermittelt.

Beim "instantanen" R-Wert rechnen die Statistiker und Gesundheitswissenschafler der Unis Ilmenau und Bielefeld die Meldeverzögerungen nicht weg ...

(Bild: Bild mit der quelloffenen Software der Wissenschaftler erzeugt )

Das Schöne an dem Berechnungsmodell der Universitäten ist, dass sie die komplette Software dazu auf Github zum Download zur Verfügung stellen. Und wie es sich für "ordentliche" statistische Software gehört, ist sie in R programmiert, was sich ja allein schon vom Namen her für den R-Wert anbietet. Mit den üblichen kleinen Anpassungsschwierigkeiten (das passende Pandoc und Plotly muss man für Ubuntu 18.04 noch etwas mühevoll aufsuchen und manuell installieren) und nach gefühlt stundenlanger Kompilationszeit, holt sich das Programm dann die aktuellen Daten vom RKI und von der JHU (Github) und erzeugt komplette Reports als HTML-Dateien mit den Plots (samt "Hoover" über die Daten). Um die Werte besser vergleichen zu können, hab ich dann aber doch mal die Daten vorab über 7 Tage gemittelt und dann darauf das Programm losgelassen. Dann sind die Ilmenauer R-Werte zwar nicht mehr so instantan, liegen aber gut im Bereich der Schwankungsbreite der RKI-Werte.

... es sei denn, man macht's selber. hier die mit dem gleitenden 7-Tage-Mittelwert berechnete R-Kurve

(Bild: Bild mit der quelloffenen Software erzeugt)

Und wenn nun schon jeder seine eigenen R-Werte präsentiert, darf auch mein Vorschlag nicht fehlen, der weit einfacher als die aufwendigen akademischen Berechnungen gestrickt ist und der nur mit einer Schätzung (Generationszeit von 4 Tagen) auskommt und der dennoch in der Schwankungsbreite der RKI-Werte liegt. Und der lässt sich viel leichter von jedermann er- und auch leichter vermitteln, als all die anderen.

Vier verschiedene Berechnungsmethoden für den R-Wert im Vergleich. Bei sich nur mäßig ändernden Infektionswerten unter R=1 reicht offenbar eine einfache Berechnung (braune Kurve) aus, die auf den geglätteten Werten von Zeit Online beruht.

(Bild: Andreas Stiller)

Dieser Primitiv-R-Wert ergibt sich aus dem Quotienten des gleitenden 7-Tage-Mittelwerts der Neuinfektionen vor vier Tagen mit dem aktuellen 7-Tage-Mittelwert. Er verwendet dazu aber nicht die Trödeldaten vom RKI, sondern die etwa zwei Tage aktuelleren, die die Zeit-Online-Redaktion mehrmals täglich von den über 400 Gesundheitsämtern abholt und veröffentlicht. Bleibt zu hoffen, dass das nicht mehr allzu lange nötig ist, wenn denn irgendwann mal das seit Urzeiten geplante Deutsche Elektronische Melde- und Informationssystem (DEMIS) da ist, wo es eigentlich längst schon sein sollte. Dann bräuchte man keine in den Gesundheitsämtern "Seuchenfaxe" genannten Übertragungswege mehr und könnte wohl auch die Brieftauben in Rente schicken.

(as)