Wie war der Verlauf des Infektionsgeschehens in Deutschland?

Analysen und Gedanken zum neuartigen Coronavirus - Teil 2

Der Verlauf des Infektionsgeschehens ist eine entscheidende Größe: Kann das Infektionsgeschehen realitätsnah abgebildet werden, lassen sich die Ausbreitungsgeschwindigkeit einer Infektionskrankheit und mögliche Einflussfaktoren auf das Infektionsgeschehen besser abschätzen. Damit können die potenzielle Belastung des Gesundheitssystems in der Zukunft und der Nutzen von Eindämmungsmaßnahmen besser beurteilt werden.

Abschätzung über das Meldedatum der Neuerkrankungen

Es ist naheliegend die täglichen Meldungen der Neuinfektionen als Maß für das Infektionsgeschehen heranzuziehen (Abbildung 1 nach RKI1). Dies wurde bereits früh im Pandemieverlauf gemacht und scheint für viele Länder immer noch die meistgenutzte Methode zu sein.

Abbildung 1. Grafik: Screenshot RKI

Das Meldedatum ist in Deutschland das Datum, an dem das Gesundheitsamt über die Labore oder Ärzte Kenntnis über einen positiven Fall erlangt und diesen elektronisch erfasst. Da Labore und Ärzte am Wochenende zum Teil nicht arbeiten, gehen die Meldungen zurück und steigen zu Beginn der neuen Woche sprunghaft an. Der mittlere Meldeverzug schwankte in Deutschland zwischen 5 und 10 Tagen2 und dürfte international ebenfalls Schwankungen unterliegen, was die Vergleichbarkeit zwischen verschiedenen Ländern stark reduziert. Selbst wenn der Meldeverzug bekannt ist und das genaue Datum des PCR-Tests eruiert werden kann, kann daraus nicht auf das Erkrankungsdatum geschlossen werden.

Des Weiteren gibt es einen Übermittlungsverzug an das RKI, so dass kürzlich zurückliegende Meldungen durch die Gesundheitsämter erst verspätet beim RKI eingehen. Das führt dazu, dass die neuesten Meldedaten in den Folgetagen nach oben nachkorrigiert werden müssen. Die Infektionszahlen der kürzlich zurückliegenden Tage sind daher von geringem Nutzen.

Abschätzung über das Erkrankungsdatum der Neuerkrankungen

Deutlich zuverlässiger ist es den Tag des Erkrankungsbeginns zu nutzen, da hiermit etwaige Meldeverzüge und die unklare Latenz zwischen Erkrankungsbeginn und PCR-Test ausgeschlossen sind. Übermittlungsverzüge treten hier allerdings ebenfalls auf. Für die Infizierten, bei denen sich der Erkrankungsbeginn nicht eruieren ließ bzw. die gar nicht erkrankten, hat das RKI eine Schätzmethode (Imputation) entwickelt (Abbildung 2 nach RKI3 ).4

Abbildung 2. Grafik: Screenshot RKI

Zu beachten ist hier, dass es sich um eine geglättete Kurve handelt. Wie den Rohdaten des RKI zu entnehmen ist, ergibt sich beispielsweise die Zahl der Neuerkrankungen am 19.03. aus dem Mittelwert vom 16. - 19.03.5 Verzichtet man auf die Glättung, hat die Kurve nicht nur einen raueren Verlauf, sondern verschiebt sich auch um 1,5 Tage ((3+2+1+0)/4 = 1,5)) nach links. Um ein möglichst exaktes Maß für den Infektionsverlauf zu erhalten, sollten die Zahlen der Neuerkrankten ohne Glättung verwendet werden. Da die durchschnittliche Inkubationszeit 5-6 Tage beträgt, liegt das Ansteckungsdatum der im Diagramm dargestellten Infektionsfälle nochmals 5-6 Tage früher.6

Obwohl diese Daten deutlich geeigneter als die Meldedaten sind, bestehen einige wichtige Schwächen. Aus serologischen Studien ist bekannt, dass mit den durchgeführten PCR-Tests nur ein Bruchteil der tatsächlich Infizierten erfasst wird. Die offizielle Zahl der Neuinfektionen kann daher nur dann ein gutes Surrogat für den Pandemieverlauf sein, wenn die Stichprobe der Getesteten nach gleich bleibenden Kriterien untersucht wird und die Testkapazitäten jederzeit und überall ausreichend sind. Diese Kriterien sind allerdings nicht erfüllt.

Hinsichtlich der Testzahlen und Testkapazitäten gibt es für den Zeitraum vor KW 11 keine wöchentlichen Daten (Tabelle 17). Gerade in diesem Zeitraum ist aber von einem sehr dynamischen Infektionsgeschehen auszugehen, wie unter anderem der lokale Ausbruch in Heinsberg zeigt, der auf eine Karnevalssitzung am 15.02. (KW 7) zurückgeht.8 Der Wintersportort Ischgl hatte sich spätestens Ende Februar (KW 9) unbemerkt zu einem Infektionsschwerpunkt entwickelt.9 So trugen viele deutsche Reiserückkehrer das Virus unbemerkt nach Deutschland.

Tabelle 1
KW Anzahl Testungen Positiv getest Anzahl übermittelnde Labore
Bis einschl. 10 124.716 3.892 (3,1%) 90
11 127.457 7.582 (5,9%) 114
12 348.619 23.820 (6,8%) 152
13 361.515 31.414 (8,7%) 151
14 408.348 36.885 (9,0%) 154
15 379.233 30.728 (8,1%) 163
16 330.027 21.993 (6,7%) 167
17 357.876 17.974 (5,0%) 175
18 317.979 12.143 (3,8%) 169
Summe 2.755.770 186.331 (6,8%)

Andererseits waren die wöchentlichen Testkapazitäten zumindest seit KW 11 zu keinem Zeitpunkt ausgeschöpft (Tabellen 1 und 2, Daten nach RKI10). So gab es z.B. in KW 11 bei 127.457 durchgeführten Tests eine tägliche Testkapazität von 31.010. Demnach wurden in KW 11 also nur 59% der Kapazitäten ausgeschöpft (127.457 / (31.010 x 7)).

Tabelle 2
KW, in der Angabe für die Folgewoche erfolgt ist KW 10 KW 11 KW 12 KW 13 KW 14 KW 15 KW 16 KW 17 KW 18
Anzahl übermitelnde Labore 28 93 11 13 132 112 126 133 137
Testkapazität pro Tag 7.115 31.010 64.725 103.515 116.655 123.304 136.064 141.815 153.698
Neu ab KW15: wöchentliche Kapazität anhand von Wochenarbeitstagen - - - - - 730.156 818.426 860.494 964.962

Es ist daher anzunehmen, dass zumindest ab Woche 11 tatsächlich Viele der nach den RKI - Kriterien zu Testenden auch getestet wurden. Diese Kriterien waren zunächst sehr streng, um die befürchtete Überlastung der Labore zu vermeiden. So wurden zunächst hauptsächlich Personen getestet, die typische Symptome hatten und aus einem Risikogebiet kamen. In den folgenden Wochen haben sich die Testkriterien dann mehrfach geändert. Dies dürfte unter anderem durch die bessere Verfügbarkeit der Tests und die zunehmend gesicherte Kostendeckung durch die Krankenkassen erklärt sein. Es ist anzunehmen, dass durch die geänderten Testkriterien in zunehmendem Maße Personen mit einem geringeren Risiko für eine Infektion getestet wurden. Parallel wurden unabhängig von den offiziellen RKI-Kriterien in zunehmendem Maße auch asymptomatische Personen (z.B. vor Krankenhausverlegungen) aus infektionspräventiven Aspekten heraus getestet. Hierdurch dürfte die Prätestwahrscheinlichkeit weiter gesunken sein. Trotzdem stieg die Testpositiventrate bis Woche 14 (9,0%) deutlich an, was auf eine dynamische Entwicklung des Erkrankungsgeschehens hindeutet und gegen ein Maximum weit vorher der KW 14 spricht. Zu beachten ist hierbei allerdings, dass der Zeitpunkt der Testdurchführung nicht dem Infektionszeitpunkt entspricht und dieser deutlich vorher gelegen haben kann.

Da unklar bleibt, in welchem Maße die Ausweitung der Testzahlen ab KW 12 das tatsächliche Infektionsgeschehen verzerrt hat, lohnt ein Vergleich mit den Todeszahlen nach Sterbedatum. Da die Todesfälle gut dokumentiert wurden und die hohe Vigilanz für COVID-19 innerhalb der Krankenhäuser zu einer großzügigen Testung Schwerkranker führte, könnte die Kurve der täglichen Todeszahlen ein gutes Maß für das Infektionsgeschehen sein. Zur besseren Vergleichbarkeit wurde in Abbildung 8 (Daten nach RKI11) die Zahl der Todesfälle auf das Niveau der Neuerkrankungen angepasst (Faktor 21).

Neben der natürlichen Latenz zwischen Erkrankungsbeginn und Tod zeigt sich als wesentlicher Unterschied, dass die Kurve der Neuerkrankungen steiler ansteigt, was eine Überschätzung des Infektionsgeschehens im Zuge der ausgeweiteten Testzahlen ab KW 12 nahelegt. Der frühe Anstiegsbereich der Kurve vor dem 03.03.2020 wird hingegen aufgrund fehlender Daten gar nicht erfasst.

Abbildung 3. Grafik: Wolf Hinrich Wallis

Abschätzung über die Reproduktionszahl R

Eine andere Darstellungsmethode für das Infektionsgeschehen bietet die Reproduktionszahl R. Sie kann aus der Zahl der täglichen Neuerkrankungen berechnet und in eine Kurve übertragen werden. Der Logik nach müsste R seinen höchsten Wert dann haben, wenn die Zahl der Neuinfektionen am stärksten ansteigt und unter 1 fallen, wenn die Zahl der Neuinfektionen rückläufig ist. Die genauere Betrachtung der R-Bestimmung zeigt jedoch, dass der R-Wert dem Infektionsgeschehen um ca. 9 Tage hinterherhinkt: Um beispielsweise das R für den 21.03. nach der vom RKI verwendeten 4-Tages-Methode zu berechnen, werden die Neuerkrankten vom 18.-21.03. mit jenen vom 14.-17.03. verglichen.12 Diese Neuerkrankten haben sich im Durchschnitt 5-6 Tage vorher angesteckt. Es werden also Ansteckungen vom 08./09.-11./12.03. mit jenen vom 12./13.-15./16.03. verglichen (Abbildung 4). Der Abbildung wird zur vereinfachten Darstellung eine Inkubationszeit von 5 Tagen statt 5-6 Tagen zugrunde gelegt.

Abbildung 4. Grafik: Wolf Hinrich Wallis

Das R vom 21.03. wäre daher geeignet, das Infektionsgeschehen um den 12.03. herum darzustellen. Insofern bildet die R-Kurve das aktuelle Infektionsgeschehen nur dann auf den Tag genau ab, wenn sie um 9 Tage vorverlegt wird (Abbildung 5; Daten nach RKI13).

Abbildung 5. Grafik: Wolf Hinrich Wallis

Die für die Kurve der Neuerkrankungen dargelegten Schwächen treffen in gleichem Maße auch auf die daraus abgeleitete R-Kurve zu. Es ist daher anzunehmen, dass das tatsächliche Maximum aufgrund fehlender Daten gar nicht erfasst wurde und dass die Infektionsdynamik im Zuge der Ausweitung der Testzahlen überschätzt wurde.

Abschätzung über das Meldedatum der Todesfälle

Um die Schwächen der oben dargestellten Methoden zu umgehen, könnte die Verwendung der Todeszahlen deutlich stabiler sein, da schwer Erkrankte großzügig getestet werden und Todesfälle in den meisten Ländern zuverlässig dokumentiert werden. Auch für die Todesfälle werden oft nur Kurven veröffentlicht unter Zugrundelegung der Meldedaten mit entsprechendem Meldeverzug. Diese zeigen ähnlich wie die Neuerkrankungen nach Meldedatum einen wellenförmigen Verlauf im Wochenrhythmus.14 Da der Meldeverzug auch hier nicht konstant ist, ist diese Methode ungeeignet, das Infektionsgeschehen retrospektiv auf den Tag genau abzubilden und Länderdaten untereinander zu vergleichen. Ebenso wie bei den Neuinfektionen gibt es auch hier einen Übermittlungsverzug.

Abschätzung über das Sterbedatum der Todesfälle

Für einige Länder einschließlich Deutschlands (Abbildung 6; Daten nach RKI15) werden mittlerweile auch Daten zum Sterbedatum veröffentlicht, was die Vergleichbarkeit untereinander deutlich verbessert.16 Aufgrund eines teilweise großen Übermittlungsverzuges sollten hier nur Daten berücksichtigt werden, die älter als zwei Wochen sind94.

Abbildung 6. Grafik: Wolf Hinrich Wallis

Um von den Sterbedaten auf das Infektionsgeschehen zu schließen, ist die durchschnittliche Latenz zwischen Infektion und Tod entscheidend. Die Zeit zwischen Infektion und Erkrankungsbeginn (Inkubationszeit) liegt bei durchschnittlich 5-6 Tagen.17 Die durchschnittliche Zeit zwischen Erkrankungsbeginn und Tod ist schwieriger zu ermitteln. Die meisten Studien stammen aus China, wo Werte zwischen 17 und 22 Tagen gefunden wurden18. Niedrigere Werte sind oft dadurch zu erklären, dass nicht alle Patienten einen Endpunkt erreicht hatten und keine Trunkierung angewendet wurde oder dass nur ein Median angegeben wurde, der einige Tage unter dem Mittelwert liegt. Ein Problem bei fast allen Studien ist, dass sie sich größtenteils auf im Krankenhaus behandelte Patienten beziehen, die eher jünger sind und vermutlich eine intensivere Versorgung erfahren. Patienten, denen eine Krankenhausbehandlung verwehrt blieb bzw. die palliativ behandelt wurden, sterben möglicherweise früher. So ergab eine Untersuchung unter palliativ behandelten Patienten im Median eine Zeit von 9 Tagen bis zum Tod (ein Mittelwert wurde nicht angegeben). Eine Studie aus UK modellierte unter Berücksichtigung von >3000 sowohl stationär als auch ambulant behandelter Verstorbener eine mittlere Zeit von 21 Tagen19, der verwendete Datensatz war jedoch möglicherweise nicht repräsentativ, so dass Unsicherheiten bleiben.

Für nachfolgende Berechnungen wird in Übereinstimmung mit einer viel zitierten Studie aus Wuhan eine Zeit von 18,5 Tagen angenommen.20 Zuzüglich der Inkubationszeit resultiert eine Zeit von 24 Tagen. Bezogen auf Deutschland mit seiner guten Ausstattung an Intensivbetten und vergleichsweise geringen Betroffenheit von Pflegeheimen könnte die reale Zeit etwas darüber liegen. Für stärker betroffene Länder in Europa könnte die Zeit mit zunehmender Überlastung des Krankenhaussektors gesunken sein und zeitweise darunter liegen.

Eine weitere Schwäche ist, dass die Kurve lediglich die Ansteckungsrate derjenigen Bevölkerungskohorte widerspiegelt, welche später im Zusammenhang mit dem Virus verstirbt. Bekanntermaßen haben sich zu Beginn der Pandemie vor allem jüngere Menschen bei sozialen Events wie dem rheinischen Karneval oder dem Après-Ski in den Alpen infiziert. Erst mit einiger Latenz - zu einem Zeitpunkt als das Infektionsgeschehen als Ganzes möglicherweise schon wieder rückläufig war - wurde das Virus in vulnerablere Bevölkerungsgruppen getragen. So lag das Durchschnittsalter der nachgewiesen Infizierten in KW 11 bei 43 Jahren, um bis KW 15 auf 52 Jahre zu steigen.21 Das Maximum der Infektionen unter Pflegeheimbewohnern liegt etwa 6 Tage später als der Durchschnitt22, ähnliche Beobachtungen wurden in UK gemacht, wo der Abstand 9 Tage betrug.23 Vereinzelte Ausbrüche in Pflegeheimen wurden auch bei bereits wieder rückläufigem Infektionsgeschehen gemeldet und dürften die Todesfälle daher relativ lange auf einem hohen Niveau gehalten haben.

Zuletzt kann es dadurch zu Verzerrungen kommen, dass die Zeit von Erkrankungsbeginn bis zum Tode keiner Normalverteilung folgt, weswegen auch der Mittelwert über dem Median liegt.24

Verschiebt man die Kurve aus Abbildung 6 mit den Todeszahlen um 24 Tage nach vorne und trägt diese zusammen mit der Kurve der Neuerkrankungen auf, ergibt sich tatsächlich eine gewisse Deckungsgleichheit (Abbildung 7; Daten nach RKI25).

Abbildung 7. Grafik: Wolf Hinrich Wallis

Äquivalent zu den Daten der Neuerkrankungen kann auch aus den Todeszahlen eine R-Kurve generiert werden. Damit diese das Infektionsgeschehen auf den Tag genau abbildet, wird sie für die Latenz von Erkrankungsbeginn bis zum Tod zunächst um 18,5 Tage (der vereinfachten Darstellung halber hier 19 Tage) und dann wie weiter oben dargelegt um weitere 9 Tage vorverlegt. Diese Kurve kann dann mit der R-Kurve nach Neuerkrankungen verglichen werden (Abbildung 8; Daten nach RKI26 und eigenen Berechnungen).

Wie oben dargelegt, unterliegen beide Darstellungsmethoden einigen Schwächen. Zumindest als gesichert kann aber gelten, dass die R-Kurve nach Neuerkrankungen aufgrund des starken Anstiegs der Testzahlen in den ersten Tagen zu weit rechts verläuft. Die R-Kurve nach Todeszahlen verläuft in den ersten Tagen ebenfalls eher zu weit rechts, da jene Infizierten, die im Verlauf verstarben, später im Pandemieverlauf erkrankten. Darüber hinaus wird die Schnelligkeit des Rückgangs Anfang bis Mitte März vermutlich unterschätzt, da der Eintrag von Infektionen in vulnerablere Bevölkerungsgruppen wie Pflegeheimbewohner die Zahl der Todesfälle hochgehalten hat. Ab Mitte März validieren sich beide Kurven gegenseitig und dürften der Realität daher nahekommen.

Für stark betroffene Länder ist zu berücksichtigen, dass während der Überlastung des Krankenhaussektors die Latenz zwischen Infektion und Tod möglicherweise <24 Tage lag, so dass die R-Kurve hier um wenige Tage zu weit links verläuft.

Abbildung 8. Grafik: Wolf Hinrich Wallis

Fazit

Die Abschätzung des Infektionsverlaufs über die Zahl der Neuinfektionen nach Meldedatum ist ungeeignet, da die Zeit zwischen Erkrankungsbeginn und Meldedatum variiert und nicht immer bekannt ist. Zudem ist der Erkrankungsbeginn hieraus nicht ableitbar. Die Verwendung des bekannten bzw. geschätzten Erkrankungsdatums ist deutlich zuverlässiger. Zu beachten ist hierbei aber, dass durch fehlende Testungen das Infektionsgeschehen zunächst übersehen und durch schnelle Ausweitung der Testzahlen dann überschätzt wurde. Da es neben Deutschland kaum Länder gibt, die Zahlen nach Erkrankungsdatum veröffentlicht haben, ist ein Ländervergleich anhand der Neuinfektionen nicht zuverlässig möglich.

Die Berechnung über die Todeszahlen nach Meldedatum ist ungeeignet, da die Zeit zwischen Todesdatum und Meldedatum variiert und nicht immer bekannt ist. Die Verwendung der Todeszahlen nach Sterbedatum ist deutlich zuverlässiger. Allerdings wird hiermit nur das Infektionsgeschehen der vulnerablen Bevölkerungsgruppen widergespiegelt, welche sich eher später infiziert haben. Hinzu kommen variable Latenzen zwischen Erkrankungsbeginn und Tod, die innerhalb eines Landes und zwischen verschiedenen Ländern variieren können. Nichtsdestotrotz bieten diese Zahlen die beste Methode zum Vergleich verschiedener Länder, sofern entsprechende Daten vorliegen.