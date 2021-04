Nun ist das "Vierte Gesetz zum Schutz der Bevölkerung bei einer epidemischen Lage von nationaler Tragweite" in Kraft getreten – zunächst jedenfalls, falls nicht das bereits angerufene Bundesverfassungsgericht es wieder außer Kraft setzt. Zuletzt sind noch gegenüber dem ursprünglichen Entwurf ein paar gewichtige Änderungen eingebracht worden, Änderungen zu Uhrzeit und Modalitäten des Lockdowns mit Ausgangsbeschränkung sowie die zugrunde gelegten Sieben-Tage-Inzidenzen für die nunmehr bundesweit verbindlichen Einschränkungen an den Schulen.

Allüberall taucht im Gesetz die Sieben-Tage-Inzidenz als Maßgröße auf, Grund genug, sich diese ein bisschen genauer anzuschauen.

Eine Analyse von Andreas Stiller

Maßstabsfragen

Ob die Inzidenz allein ein guter Maßstab ist, wurde im Vorfeld der Gesetzesänderung von vielen Kritikern mit guten Gründen in Frage gestellt, hat sie doch viele Schwachstellen. Und nicht nur deswegen, weil die Inzidenz sich durch die Nachmeldungen immer für den Vortag erhöht.

Unbestritten ist, dass die Sieben-Tage-Inzidenz in hohem Maße von der Anzahl der durchgeführten Tests abhängig ist. Wer viel testet findet auch viel. So könnte der ein oder andere Landrat versucht sein, die Anzahl der Tests herunterzufahren, wenn sich die Sieben-Tage-Inzidenz einem der Schwellenwerte nähert.

Die FDP hatte daher in die Bundestagsdebatte einen Änderungsantrag eingebracht, um "gewichtete Inzidenzen" in das Gesetz einzubringen, die das RKI unter Berücksichtigung der Testanzahl bestimmen soll – der Antrag wurde jedoch abgelehnt.

Vermutlich wichtigstes Gegenargument: Die Änderung hätte das Inkrafttreten des Gesetzes erheblich verzögert. Das gilt auch für die vielen anderen Vorschläge zur Einschätzung der Pandemie. Man wollte schnell handeln und eine vergleichsweise einfache Methode verwenden, die auf Bundes-, Landes- und vor allem auch auf Landkreisebene funktioniert.

Vorbild Großbritannien

Zumindest für den Bund hätte man schon längst Besseres einführen können. Hier könnte man sich (nicht nur wegen der weit besseren Impfquote) an Großbritannien orientieren. Die gesamte Testrate ist hier mit aktuell 212 % gut dreimal so hoch wie in Deutschland (64,4 %). Und bei der Testrate pro Neuinfektion steht Deutschland weit hinten auf der "roten Liste", über 50 Mal so schlecht wie Großbritannien. In England hatte man schon vor einem Jahr eine sinnvolle Methode eingeführt, um die Pandemie abschätzen zu können. Man schickte 100.000 Tests an zufällig ausgewählte Bürger und bekam so ein ziemlich realistisches Bild über das tatsächliche Geschehen, samt Dunkelziffer. Das National Office of Statistics macht das seit August 2020 14-tägig für ganz Großbritannien. (ONS Infection survey)

Viel röter gehts für Deutschland nicht. In Großbritannien ist die Testrate pro Neuinfektion mehr als 50 Mal so hoch. (Bild: OurWorldInData.org/coronavirus)

Aber hierzulande ist das zunächst alles nur Makulatur, es bleibt vorerst bei der einfachen, heftig umstrittenen Inzidenz als Maßstab. Aber was ist das eigentlich genau, diese Sieben-Tage-Inzidenz?

Unwägbarkeiten

Allgemein heißt es, die Inzidenz sei die aufsummierte Zahl der Neuinfektionen der letzten sieben Tage, dividiert durch die Bevölkerungszahl und mit 100.000 multipliziert. Doch wer das mal macht, kommt zumeist auf ziemlich andere Werte als das RKI. Blöd ist, wenn sich Geschäftsinhaber, wie vor einigen Wochen in Hannover geschehen, auf die von der Region veröffentlichten Werte beziehen, den Laden aufmachen und dann Besuch von der Polizei bekommen. Denn auch für die Beschlüsse des Landes gelten allein die vom RKI veröffentlichten Sieben-Tage-Inzidenzen, was damals sehr mangelhaft kommuniziert wurde. Das steht jetzt aber klar im Gesetz.

Bei der im Gesetz zugrunde gelegten Definition sieht man kleine, aber feine Unterschiede zwischen der finalen Fassung und dem Entwurf. In Letzterem fand man dazu eine "nach § 28a Absatz 3 Satz 13 durch das Robert Koch-Institut veröffentlichte Anzahl der Neuinfektionen mit dem Coronavirus SARS-CoV-2 je 100 000 Einwohner innerhalb von sieben Tagen (Sieben-Tage-Inzidenz)". Und dieser Satz 13 lautete: Maßgeblich sind die auf dem RKI-Dashboard unter der Adresse http://corona.rki.de im Internet veröffentlichten Zahlen.

Was sind "Neuinfektionen"?

Doch das Dashboard als Datenquelle, das nur aktuelle Tageswerte wiedergibt, wurde sinnvollerweise verworfen. Jetzt muss das RKI auf https://www.rki.de/inzidenzen übersichtliche und einfach downloadbare Tabellen für Bundesländer und Landkreise der letzten 14 Tage veröffentlichen.

In den täglichen Situationsberichten des RKI findet man allerdings nur kurz den Hinweis, dass sich die Inzidenzwerte auf die Meldetermine und nicht auf die veröffentlichte Zahl der Neuinfektionen beziehen. Die eine oder andere Landesbehörde hat das netterweise genauer erklärt, etwa die Landesuntersuchungsanstalt von Rheinland Pfalz. Die Behörde rechnete für die letzte Januar-Woche 2021 genau vor, welchen Unterschied es macht, ob man die veröffentlichte Zahl der Neuinfektionen zugrunde legt (auf Basis der Differenz der Fallzahlen zum Vortag) oder die Zahl der Infektionen, die zu einem Meldetermin innerhalb der letzten Woche gehört. Und die Ergebnisse differieren durchaus deutlich: 89,3 hier, 78,3 da.

Man wird ein bisschen brauchen, um diese Grafik vom Landesuntersuchungsamt in Rheinland Pfalz zu verstehen. Sie macht klar, wie sich die Zaheln zusammensetzen und wie unterschiedlich die Ergebnisse sind, ob man sich auf "Neuinfektionen" oder "Meldedaten" bezieht. (Bild: Landesuntersuchungsamt, Rheinland Pfalz)

Um den Unterschied zu verstehen, muss man zunächst den unterschiedlich gebrauchten Begriff der "Neuinfektion" hinterfragen. Denn die vom RKI tagtäglich veröffentlichten Zahlen sind keinesfalls "neue aufgetretene Infektionen" gegenüber dem Vortag, sondern "bislang noch nicht veröffentlichte Infektionen", deren Meldetermine beim Gesundheitsamt durchaus ein paar Tage, mitunter auch Wochen oder Monate zurückliegen können. Es ist also ein bunter Strauß von Infektionen an zurückliegenden Terminen, deren Aktualität durch den hinreichend oft kritisierten (gesetzlich erlaubten) Meldeverzug zwischen den Gesundheitsämtern, den zuständigen Landesbehörden und dem RKI zusätzlich leidet.

Vor allem aber gibt es laufend Probleme mit der Datenübermittlung, diese Woche etwa mit den Werten aus Nordrhein-Westfalen. Die Zahlen am Anfang dieser Woche sind daher im wesentlichen Makulatur oder Fake-Zahlen, wie Professor Lauterbach zu sagen pflegt. Da fragt man sich, was wohl so schwierig ist, ein paar tausend Datensätze von Düsseldorf nach Berlin zu bekommen? Und wie kann man solche Unbillen in Zukunft vermeiden, damit die Gesetze nicht auf möglichen Fake-Zahlen aufbauen?

Wenn man sich die Mühe macht, die über 400 RKI-Situationsberichte seit März 2020 auf berichtete Datenübertragungsprobleme zu durchforsten, wird man häufig fündig. Ja, es ist verheerend: 96 Vorfälle sind in den Fußnoten zu finden, darunter Serverprobleme beim RKI selbst (u.a. wegen Cyber-Angriffs) oder auch "keine Datenübermittlung wegen Softwareupdates" (vor allem in Baden-Württemberg). Da fragt man sich weiter, muss man wirklich bei einem Softwareupdate auf die Datenübermittlung verzichten?

Von den zuletzt in den Medien berichteten Problemen mit den Zahlen aus Nordrhein-Westfalen findet man in den Fußnoten der Situationsberichte jedoch keine Spur. Hat das RKI etwa aufgehört über Datenübertragungsprobleme zu berichten?

Das RKI hatte vor etwa einem Jahr jene Landesbehörden an den Pranger gestellt, die die Daten noch per Brieftaube (sprich Fax) und nicht elektronisch übermittelten. Dem Vorbild folge ich mit den Datenübertragungsproblemen hiermit auch: Spitzenreiter mit 18 Nicht- oder unvollständigen Meldungen ist Baden-Württemberg, gefolgt von Mecklenburg Vorpommern (16) und Sachsen (14). Mit nur einem Vorfall sind Bayern, Niedersachsen, Thüringen, Hessen und Schleswig-Holstein dabei.

Die Map des Grauens:96 Fälle von fehlenden oder unvollständigen Datenübermittlungen findet man in den Fußnoten in den Situationsberichten des RKI -- und da ist der neueste Fall aus Nordrhein-Westfalen noch nicht dabei ... (Bild: Andreas Stiller)

Weitere Fehlerquellen

Hinzu kommt bei der veröffentlichten Zahl der Neuinfektionen aber noch eine weitere "Fehlerquelle", nämlich solche Korrekturen, die nicht selten viele Wochen alte Einträge betreffen, aber die mit der aktuellen Zahl der "Neuinfektionen" gegengerechnet werden. Und dann gibt es auch noch zahlreiche falsch eingetragene Meldetermine, dazu weiter unten mehr.

Angesichts dieser ungenügenden Prägnanz der als Neuinfektionen veröffentlichten Zahl war es daher durchaus die bessere Wahl des RKI, sich für die Inzidenz auf die Meldedaten zu beziehen und die vorhandenen Fallzahlen der letzten sieben Meldetage zu addieren.

Dabei nimmt man dann in Kauf, dass sich die Sieben-Tag-Inzidenzen nachträglich durch Nachmeldungen und Korrekturen noch ändern. Das könnte man zwar durch statistische Methoden (sogenanntes Nowcasting) ähnlich wie bei den R-Werten abschätzen, darauf hat man aber verzichtet.

Wichtig ist, dass man im neuen Gesetz verschiedene Schwellen definiert hat, die mal nach drei, mal nach fünf Tagen hintereinander über- oder unterschritten werden. Da man also drei oder fünf Tage zurückblicken muss, hätte des RKI die Inzidenzen für diese vorangegangenen Tage durchaus nachträglich aktualisieren können, was um ein paar Prozent höhere Werte bedeutet hätte – aber auch darauf hat das RKI verzichtet. Die Werte auf https://www.rki.de/inzidenzen sind daher jene, die zum Zeitpunkt der Erstveröffentlichung galten.

Die Sache mit den hintereinander folgenden Tagen ist im Gesetz übrigens relativ kompliziert gelöst, selbst Gesundheitsminister Jens Spahn hat das in der Bundespressekonferenz zur Notbremse nicht korrekt hingekriegt. Für das Ziehen der Notbremse für den verstärkten Lockdown mit Ausgangsbeschränkung sind die Werte von drei aufeinanderfolgenden Tagen entscheidend, für das Wiederloslassen der Bremse jedoch die Werte von fünf aufeinanderfolgenden Werktagen!

Fehlerquellen detailliert

Wie schon erwähnt, beeinflussen – wenn auch nicht erheblich – zwei Fehlerquellen die alltäglich veröffentlichten Werte der Neuinfektionen.

Eine Analyse der Meldetermine seit Beginn der Pandemie ergibt, dass nur etwa 59 Prozent vom Vortag der Veröffentlichung der Zahl der Neuinfektion einfließen, 31 Prozent stammen vom Vorvortag, 5 Prozent liegen drei Tage zurück und 2 Prozent vier Tage. Die restlichen 3 Prozent gehen zum Teil weit zurück, zuweilen liegen sie gar vor dem 27.1. 2020, dem Tag, an dem die erste Corona-Erkrankung überhaupt in Deutschland auftrat.

Die Ursache für letzteres dürften vorrangig schlampig eingetragene Termine durch die Gesundheitsämter sein, eine Plausibilitätskontrolle findet dort offenbar nicht statt, Korrekturen werden vom RKI zwar irgendwann durchgeführt, aber meist erst nach geraumer Zeit. Besonders krass waren solche klar erkennbaren Falscheinträge am Jahresanfang 2021, wo viele Dutzend Meldungen noch den "Januar 2020" angaben.

Korrekturen

Die schon angesprochenen Korrekturen, stammen zu gut 50 Prozent aus der weiteren Vergangenheit vor den letzten sieben Tagen. Es sind zumeist Löschungen von Duplikaten oder falsche Positiv-Meldungen. Es gibt allerdings auch "neutrale" Korrekturen, etwa Umzüge von einem Landkreis in einen anderen, dann steht der Löschung im alten ein neuer Eintrag im neuen Landkreis gegenüber.

Leider hat das RKI in der auf im COVID19-Hub von npgeo veröffentlichten Datenbank keine Möglichkeit vorgesehen, zwischen den verschiedenen Korrekturarten (Löschen, Verändern, Verschieben) unterscheiden zu können, Einfache Korrekturen, etwa beim Alter, Geschlecht oder Meldetag, kommen noch hinzu, die werden in der Datenbank jedoch stiekum ohne jedwede Kennzeichnung durchgeführt.

Das RKI hat sich für die Veröffentlichung dafür entschieden, einfach die "Altschulden" mit den Neuinfektionen zu verrechnen, statt, was besser gewesen wäre, die Fallzahlen vom Vortag entsprechend zu korrigieren und die tatsächlichen Neuwerte anzugeben. Beide Rechenwege sorgen für die gleiche ordentliche Buchhaltung der Datenbank, aber bei der RKI-Methode verzerren die angegebenen "Neuinfektionen" den Blick auf die aktuelle Situation.

Wer mag, kann sich diese "wahren" Werte aus der Datenbank aus AnzahlMelFall bei (NeuerMelFall=1) holen. Am 22.4. 21 hätte man dann genau 30000 statt der angegebenen 29518 gehabt. Welchen Weg die Landkreise bei ihren Angaben gewählt haben, müsste man jeweils überprüfen. Wichtig ist jedoch, dass die RKI-Inzidenzwerte auf Basis der Meldedaten von diesen "Rechenspielen" nicht betroffen sind.

Die älteste Korrektur der RKI-Veröffentlichung vom 22. April stammt übrigens aus Osnabrück mit Meldedatum vom 18.3.2020 – und auch dieser Oldtimer beeinflusst die am 22. April 2021 angegebene Zahl der Neuinfektionen. Zwischen 100 und 800 Korrekturen sind es derzeit pro Tag, rund 300 waren es im Schnitt in den letzten zwei Monaten. Okay, dass fällt bei 30.000 Meldungen nicht allzu sehr ins Gewicht.

Mitunter fließen auch andere Dinge als Korrektur ein, etwa eine Änderung in der Falldefinition: So wurde der COVID-19-Fall als solcher erst im Juni 2020 eindeutig definiert, seitdem werden bis auf wenige Ausnahmen nur noch PCR-bestätigte Fälle akzeptiert – da fielen von einem Tag auf den anderen andere, etwa eindeutig per Lungen-CT ermittelte Fälle einfach heraus. So sanken die Fallzahlen allein in München um rund 400.

Fazit

Als Fazit bleibt festzuhalten: Was eine Inzidenz ist, das entscheidet das RKI, das ist so wie die gute (alte) Abseitsregel beim Fußball: Abseits ist, wenn der Schiedsrichter pfeift. Doch wenn man schon die Sieben-Tage-Inzidenz als Grundlage für sehr einschneidende Entscheidungen macht, sollte man jene sehr sorgfältig erfassen und kontrollieren und auch dafür sorgen, dass die Daten frühzeitig und vollständig an das RKI übermittelt werden und dass etwa ein Softwareupdate nicht gleich zum Ausfall führt.

Notfalls schickt man eben einen USB-Stick per Intercity-Express nach Berlin. Von solchen (leider recht häufigen) Störmöglichkeiten steht im Gesetz nichts. Aber es kann doch nicht sein, dass, nur weil in Düsseldorf ein Kabel kaputt war (oder so), man die Daten dann stückchenweise nachliefert und dadurch die Inzidenzwerte künstlich erhöht, man in Köln abends nicht auf die Straße darf oder die Schulkinder zu Hause bleiben müssen.

