Dashboard zur Covid-19 Epidemie in Deutschland
Dr. Florian Nill
Stand: 16.04.2020

Statistik der Zuwachszahlen

Als erstes werfen wir einen Blick auf die täglichen Zuwachszahlen aus dem RKI-Dashboard. Hierbei ist zu beachten, dass das RKI die täglich neu eintreffenden Zahlen nicht dem möglicherweise stark verzögertem Zustelldatum zuordnet, sondern dem sog. Meldedatum"das Datum, an dem das lokale Gesundheitsamt Kenntnis über den Fall erlangt und ihn elektronisch erfasst hat" – s. Disclaimer des RKI.

Das räumt zwar schon mal eine Fehlerquelle aus, nämlich die Reisezeit der Meldung vom Gesundheitsamt bis zum RKI, aber leider bleibt hier trotzdem noch sehr viel Unschärfe übrig. Viel besser wäre natürlich, man würde jede Meldung dem Datum, an dem der Abstrich beim Patienten genommen wurde, zuordnen können, oder noch besser sogar dem Datum, an dem der Patient seine ersten Beschwerden hatte. In der Tat, in seinen Lageberichten erfasst das RKI teilweise auch solche Daten. Sie werden dort jedoch leider nur als Grafiken angezeigt, so dass für das normale Volk hieraus keine Auswertungen gefahren werden können.

Update 18.04.2020: Das RKI hat ab KW11 begonnen, Testlaborabfragen durchzuführen, um sowohl die Anzahl der Testungen als auch den Anteil positiver Tests tabellarisch zu dokumentieren. Erstmals erwähnt wurde dies im Lagebericht des RKI vom 26.03.2020. Eine Zusammenstellung der Ergebnisse findet sich jetzt auch im Tagesspiegel vom 17.04.2020

 

Dashboard_Daily
Fig 1: Verlauf der täglichen Zuwächse. Die Einschnitte bilden die Sonntage ab.
 Die gestrichelte Kurve gibt die gleitenden Durchschnitte über (heute + 3 Tage zurück + 3 voraus) wieder.

Kommen wir zu den Fakten: In Fig 1 erkennt man deutlich, dass Gesundheitsämter (und vielleicht auch Testlabore?) an Wochenenden nicht arbeiten. Da wir hier aber nicht die Arbeitszeiten Deutscher Beamten ausspionieren wollen, empfiehlt es sich, zur Anonymisierung der Wochenenden und somit besseren Modellierung der Realität (Viren haben keine 5-Tage-Woche!) gleitende Durchschnitte über jeweils 7 Tage (heute + 3 zurück + 3 voraus) zu bilden. Das Ergebnis ist die braun gepunktete Kurve. Sieht doch schon viel gefälliger aus, oder nicht?

Demnach hatten wir also schon zu Beginn von KW 14 die Trendwende? Nur für den Fall dass da jemand meinen Auswertungen nicht traut: Mein Excel war es nicht, das füttere ich immer sehr hingebungsvoll und regelmäßig 😉.

Nun könnte man noch einwenden, dass solche Aussagen ja grundsätzlich auch durch Veränderungen in der Anzahl der Testfälle pro Woche verursacht sein könnten. Auf Basis der Testlaborabfragen des RKI ist jedoch sichergestellt, dass die Kapazitäten der Testlabore in Deutschland schon seit einiger Zeit hochgefahren werden.

Update 18.04.2020: Im Lagebericht des RKI vom 15.04.2020 wird versucht, den tatsächlichen Verlauf der Anzahl von bereits erfolgten COVID-19- Erkrankungen durch ein sogenanntes Nowcasting zu modellieren. Auf Basis dieses Modells sei ein Rückgang der Neuinfektionen ab dem 04.04.2020 sichtbar (das wäre dann Ende KW 14).

Fig 1 hinterlässt uns noch eine zweite Erkenntnis: KW 15 war die Karwoche! Auch da kriechen zwar die Viren nicht zu Kreuz, aber das Wochenende war halt länger als normal. Also lasst uns besser noch eine Woche den Zahlen beim Sammeln zuschauen, bevor wir die frohe Botschaft vom Abwärtstrend verkünden dürfen.

In Fig 2 nun dazu passend die pro Kalenderwoche gemeldeten Neuinfektionen. Die Woche beginnt für den Zweck dieser Auswertung immer am So. Es bestätigt sich das Bild aus Fig 1. Auch hier bleibt abzuwarten, ob der Rückgang in KW 15 um 25% nicht doch nur den Feiertagen geschuldet ist.

Dashboard weekly Germany
Fig 2: Verlauf der wöchentlichen Zuwächse pro KW.
Der Trend der gleitenden Durchschnitte bestätigt sich.

Statistik der Gesamtzahlen

In Fig 3 zeigen wir die kumulierte Summe aller Infizierten beginnend ab 20.03. (blaue Linie) und zeichnen die von Excel berechnete lineare Trendkurve für den Zeitraum 20.03. - 09.04. dazu (gestrichelt violett). Mit einem Pearson Korrelationskoeffizienten R2 = 0,9968 ist diese Approximation sehr gut, was auch augenscheinlich bestätigt werden kann. Aus der Steigung der Trendkurve errechnet man ca 4.890 Neuinfektionen am Tag. Am 09.04. (das ist der Gründonnerstag!) biegt der lineare Anstieg ziemlich abrupt nach unten, was gut mit einerseits gut zu Fig 1 passt, andereseits aber auch nur ein faules Osterei sein kann, s. Argumente oben.

Dashboard total linear
Fig 3: Verlauf der Gesamtzahl ab 20.03. mit linearem Trend bis zum 09.04. 

Wenn man genau hinsieht, erkennt man in Fig 3 aus den leichten Wellenlinien auch wieder die Sonntagsruhezeiten in Fig 1: Immer sonntags ist die blaue Linie flacher und zur Wochenmitte wieder steiler.

Als Hinweis für Leute, die es noch genauer wissen wollen: Die Gesamtzahl zum Tag X wird in Fig 3 immer kumulativ durch Summation der täglichen Zuwächse über alle Vortage (inkl. X ) aus der blauen Kurve in Fig 1 ermittelt (für Mathe-Freaks: Die blaue Kurve in Fig 3 ist ein Intergral der blauen Kurve in Fig 1). Da, wie schon oben erläutert, das RKI die täglichen Meldungen der Neuinfektionen immer rückwirkend meldedatumsbezogen zuordnet, erhält man somit eine deutlich präzisere Historisierung, als wenn man einfach nur den täglich gemeldeten Gesamtzahlen folgte. Mit andern Worten: Mit jeder täglichen Neumeldung einer Gesamtzahl verändern sich rückwirkend auch die vormals gemeldeten Gesamtzahlen, da die neuen Fälle nicht alle nur dem vergangenen Tag zuzuordnen sind.

Fig 4 zeigt im Prinzip die gleichen Daten wie Fig 3, nur als Balkendiagramm. Zusätzlich sind hier aber auch die Daten vom 02.03. - 19.03. als gelbe Balken vorangestellt. In diesem Bereich ist ein eindeutiges exponentielles Wachstumsverhalten zu erkennen. Die orange Exponentialkurve mit Verdoppelungszeit T = 2,6 Tage  approximiert die Daten außerordentlich gut (zufällig mit einem auf den ersten 4 Nachkommastellen gleichen Wert R2 = 0,9968 des Pearson Korrelationskoefizienten).

 

Dashboard Total Germany ab 02.03.
Fig 4: Verlauf der tägl. Gesamtzahlen in Deutschland.
Gelbe Balken markieren die Phase exponentiellen Wachstums, blaue Balken markieren den Rückgang zum linearen Wachstum.
Die violette Linie hat die gleiche Bedeutung wie in Fig 3, die orange Linie zeigt den exponentiellen Fit an die gelben Balken.

Man sieht nun, dass Prof. H. Lesch in seiner Terra-X  Sendung am 20.03. noch nicht ahnen konnte, dass ausgerechnet ab diesem Tag das exponentielle Wachstum beendet sein würde. Seine Vorhersage der 40.000 Neuinfektionen bis spätestens Ende März wäre nach der Prognose der orangen Linie in Fig 4 bereits am 27.03. eingetreten, er hat also sogar noch konservativ gerechnet.

In Fig 5 wird der gleiche Sachverhalt in einer logarithmischen Skala der y-Achse dargestellt. Eine logarithmische Skala ist wie eine Art "Gleitsichtlupe": Sie vergrößert kleine Zahlen, die man sonst unter der Strichdicke der Kurve gar nicht mehr erkennen kann, und sie verkleinert große Zahlen, die sonst schon durch die Decke schießen würden. Durch diesen Trick erscheinen Exponentialkurven im Log-Diagramm geradlinig. Im Gegenzug wird die lineare Trendkurve logarithmisch nach unten gebogen. Man erkennt den scharfen Übergang von exponentiell (=geradlinig) nach linear (=gebogen ) in dieser Darstellung noch deutlicher.

Dashboard Total Germany Log
Fig 5: Gleiches Diagramm in logarithmischer Skala.
Hierbei wird der exponentielle Trend zu einer Geraden und der
lineare Trend zu einer logarithmischen Kurve.
Der Übergang zum linearen Verlauf ist ziemlich genau um den 20.03.20 datierbar.

Übrigens errechnet man aus der Steigung m der "exponentiellen Geraden" in dieser Darstellung die zugehörige Verdoppelungszeit T wie folgt (Details im Kapitel  Verdoppelungszeiten)

T = Log (2) / m

Je flacher also die "exponentielle Gerade" in logarithmischen Diagrammen, desto größer ihre Verdoppelungszeit.

Wachsende Verdoppelungszeiten

Kommen wir nun zu meinem Lieblingsopfer, den wachsenden Verdoppelungszeiten. Nachdem gemäß Fig 4 und Fig 5 die Verdoppelungszeit über fast 3 Wochen konstant bei ca.  T = 2,6 Tage  geblieben war, läuteten natürlich zurecht überall die Alarmglocken. Bei einer weiteren Verdoppelung der Infiziertenzahlen ca. alle 2-3 Tage drohte die Apokalypse!

Aber dann schienen sich ab dem 20.03. die Verdoppelungszeiten auf allen Kanälen plötzlich täglich zu vergrößern (z.B. Fig 6 und Fig 7).

Verdopplzeiten SZ
Fig 6: Verdoppelungszeiten laut SZ. Die Grafik wurde erst am 09.04. mit dieser Begründung vom Netz genommen.
 
VerdopplZeiten Deutschlandfunk
Fig 7: Verdoppelungszeiten laut Deutschlandfunk/JHU. Die Grafik stand am 17.04. immer noch online.

Wie konnte das sein, da wir hier doch unzweifelhaft nur noch lineares Wachstum beobachten können, s. oben? Nun, möglicherweise war die Redakteurs-Gilde einfach nur beseelt, endlich verstanden zu haben, wie man sowas ausrechnet, auch wenn es gar keinen Sinn macht. Auch kommerzielle Statistik-Agenturen  hatten wohl vor lauter Exponential-Hype und Aufmerksamkeitsökonomie vergessen, dass es noch andere Methoden gibt, als grundsätzlich nur noch exponentielle Fits zu fahren.

Wie auch immer, Fig 8 illustriert, wie lächerlich es aussieht, wenn man auf Coronateufelkommraus eine Gerade durch eine Folge flacher werdender Exponentialkurven "approximieren" will:

Wachsende Verdopplzeiten
Fig 8: Exponentielle "Fits" zur Umschreibung linearen Wachstums mithilfe wachsender "Verdoppelungszeiten".
Die Kurven wurden aus jeweils zwei nebeneinandner liegenden Datenpunkten gewonnen.
Die Verdoppelungszeiten der Kurven haben nichts mit der tatsächlichen Verdoppelungszeit der blauen Datenbalken zu tun.

Hierzu muss man wissen, dass jede Exponentialkurve bereits durch nur 2 Punkte auf ihrem Verlauf eindeutig bestimmt ist. (Wer's nicht glaubt: Im Log-Diagramm verwandeln sich Exponentialkurven in Geraden, s. Fig. 5. Und Geraden sind bekanntlich durch 2 Punkte festgelegt. Alles klar? ...). Also kann ich durch jeweils 2 benachbarte Werte der blauen Balken eine eigene Exponentialkurve zeichen. Schwups, schon habe ich eine Serie ansteigender Verdoppelungszeiten zu jedem linearen Verlauf gebastelt. Dass die Verdoppelungszeiten dieser Kurven nichts mit der echten Verdoppelungszeit meiner Daten zu tun haben, wen stört's? Merkt doch sowieso keiner ... Dumm ist nur, mit dieser Methode merkt man halt auch nicht, dass die Origiginaldaten womöglich durch einen linearen Fit viel besser beschrieben gewesen wären.

Nun gibt es auch Zeitungen, die jüngst versuchen, einen Schritt weiter zu denken. Um dem Wochenendtiefschlaf der Zuwachszahlen aus Fig 1 zu entgehen, wird dort über jeweils 5 Werktage gemittelt und daraus Verdoppelungszeiten berechnet (z.B. SZ und NDR, der RBB24 mittelt jetzt sogar über 8 Tage).

In obigem Bild bedeutet das, die Kurven statt durch zwei nebeneinander liegende Punkte durch Punkte im Abstand von 5 (oder 8) Tagen laufen zu lassen. Wie das in der Log-Darstellung von Fig 5 aussieht, zeigt Fig 9.

Wachsende Verdopplzeiten Log
Fig 9: In der Log-Skala sind die Exponentialkurven geradlinig und der lineare Verlauf (blaue Balken) logarithmisch gebogen.
Die beiden flacheren "Exponentialgeraden" interpolieren die blauen Balken im Abstand von 5 Tagen.

Die Approximation der blauen Balken durch die "Exponentialgeraden" sieht jetzt zwar etwas angeschmiegter aus, aber meine Grundkritik bleibt. Von Wissenschaftsjournalisten sollte man auch in hektischen Zeiten wie diesen erwarten können, dass eine offensichtlich lineare Wachstumskurve als solche erkannt und nicht durch komplizierte mathematische Konstruktionen praktisch völlig vernebelt wird.

Update 18.04.2020: Das RKI hatte in seinen täglichen Lageberichten nach meiner Kenntnis noch nie auf Verdoppelungszeiten hingewiesen. Stattdessen wird ab dem Lagebericht vom 07.04.2020 nunmehr regelmäßig über die Reproduktionsrate R als die epidemiologisch wichigere Kennzahl berichtet. Sie wird über statistische Modellverfahren geschätzt und gibt die Anzahl der Personen an, die von einem Fall angesteckt werden. Damals lag sie noch bei 1,3, am 14.04. erstmals auf 1,0 und laut Lagebericht vom 16.04. nunmehr auf 0,7. Dies wird seitdem von den Medien unisono als erstes Anzeichen für ein Stagnieren der Corona-Epidemie gewertet.

In diesem Zusammenhang setzt sich nun zunehmend auch die Erkenntnis durch, das Verdoppelungszeiten in so einer Situation doch keinen mehr Sinn ergeben. Als erstes hatte ja bereits die SZ nach meinem offenen Brief vom 02.04. am 09.04. auf diese Zahlen verzichtet. Nachgezogen hat jetzt zum Beispiel der Deutschlandfunk am 16.04. (mit Verweis auf die Vorlage der SZ, meinen offenen Brief vom 13.04. hat er bis dato nicht beantwortet), und der Tagesspiegel vom 18.04.

Außerdem habe ich heute auch Kenntnis über 2 Videos vom 08.04 von Prof Dr. Moritz Kaßmann, Mathematikprofessor der Universität Bielefeld, erhalten, der meine Argumente unabhängig und etwas ausführlicher im Stil einer ordentlichen Mathematikvorlesung vorträgt. Mit Verweis auf Kaßmann haben dann z.B. auch die Braunschweiger Zeitung am 13.04. und die Stuttgarter Nachrichten am 13.04.  anerkannt, dass steigende Verdoppelungszeiten nicht mehr zur Beschreibung der aktuellen Situation verwendbar sind.

© April 2020, Dr. Florian Nill

Home Impressum & Datenschutz