Corona-Reproduktionszahl: sensitiv, stabil, komplex, instantan ... und primitiv

Die vielen Gesichter der Reproduktionszahl R. Ein Rückblick auf das Thema in der vergangenen Woche.

19.05.2020, 06:36 Uhr

Lesezeit: 14 Min.

Von

Andreas Stiller

Ja zugegeben, schon etwas spät, aber die letzte Woche hatte es in sich, da lohnt ein Blick zurück. Sie begann am Sonntag, dem 10.5, mit etlichen besorgten Meldungen über den Wiederanstieg der effektiven Reproduktionszahl, hier kurz R-Wert genannt. Im Situationsbericht des Robert-Koch-Instituts (RKI) vom Sonntag-Abend war nämlich dieser Wert mit R = 1,13 (95%-Prädiktionsintervall: 0,94-1,35) beziffert worden. Dass das Unruhe auslösen würde, war klar, hatte doch Kanzlerin Merkel im April in ihrer Regierungserklärung nicht nur den Reproduktionsfaktor R hübsch erklärt (als promovierte Physikerin weiß sie, wovon sie spricht), sondern auch vorgerechnet, dass schon beim einem R-Wert von 1,2 im Juli die Belastungsgrenze der Krankenhäuser überschritten wird.

Kurzfristige Ausschläge

Um hier die Wogen zu glätten, gab es dann am Dienstag eine Sonderpressekonferenz des RKI mit Prof. Schaade, der erklärte, warum der R-Wert recht sensitiv mit kurzfristigen Ausschlägen auf Cluster-Infektionen reagiert, vor allem wenn Infizierten-Mengen so geballt kommen, wie bei den Schlachthof-Mitarbeitern. Allein im baden-württembergischen Birkenfeld kamen in den letzten Tagen 130, im Landkreis Osnabrück 92 und im bayrischen Straubing-Bogen 59 Infizierte hinzu, inzwischen sind es insgesamt gut 1100 infizierte Werksvertragsarbeiter, die die Statistik nun stark beeinflussen.

Um diese Sprunghaftigkeit zu relativieren, führte das RKI daher zusätzlich zu dem bisherigen "sensitiven R-Wert" noch einen "stabilen R-Wert" ein, der sich als gleitender 7-Tages-Mittelwert aus den nicht geglätteten Nowcast-Werten berechnet, und der auch einen Tag weiter als der sensitive Kollege zurückgeschoben wurde, also nun die Werte für Erkrankungstermine bis maximal vier Tage vor "now" abschätzt. Der sensitive R-Wert geht bis zu drei Tage vor "now".

Wankelmütig vs. stabil

Was Prof. Schaade indes nicht erwähnte, ist, dass die R-Wert-Berechnung durch die ihr innewohnenden Schätzungen ohnehin recht "wankelmütig" ist – das kann man bereits an der relativ großen Schwankungsbreite im 95%-Prädiktionsintervall (0,94 bis 1,35) ablesen. Weiterhin ließ er auch aus, dass schon am Tag der Pressekonferenz mit den nachträglich aktualisierten Meldezahlen der per Nowcast berechnete sensitive Wert von 1,13 auf etwas weniger bedrohliche 1,03 heruntergestuft wurde. Nichtsdestotrotz wurde ab Donnerstag dann der neue "stabile", über 7 Tage gemittelte R-Wert eingeführt. Mit dem liegt man dann mit dem Datenstand von Donnerstag rückwirkend berechnet, bei einem beruhigenden Wert von nur noch 0,93. Alle Wertangaben beziehen sich dabei auf einen Erkrankungstermin vom 6. beziehungsweise 5. Mai.

t

Nowcast ist eine vom RKI entwickelte Berechnungsmethode, bei der nicht das Meldedatum, sondern das Erkrankungsdatum als Bezugstermin verwendet wird und bei der noch zu erwartende Nachmeldungen zu diesem Termin ebenfalls mit statistischen Methoden abgeschätzt werden. Da aber nur ein Teil der Fallmeldungen Erkrankungstermine enthält, wird der Termin der restlichen mithilfe einer sogenannten Imputation geschätzt. Dabei verwendet das RKI als Verteilung zwischen Erkrankungs- und Meldetermin die Weibull-Distribution, die besser als die Gauß-Verteilung für dynamische Prozesse geeignet ist. Das Ganze muss man nicht selber ausrechnen, inzwischen werden die Nowcast-Werte auch vom RKI zum Download angeboten, allerdings nur für ganz Deutschland. Die Statistiker an der Ludwig Maximilian Universität haben derweil eine eigene Nowcast- und Reproduktionszahlberechnung für Bayern und München eingeführt und das LGA in Baden-Württemberg nutzt die RKI-Methode für badisch-schwäbische R-Werte.

Fehlende Erkrankungstermine

Blöd nur, dass die Grundlage für die verwendete Imputation, die tatsächlich gemeldeten Erkrankungstermine, immer mehr entschwindet. Waren Anfang April, als die Methode vorgestellt wurde, noch etwa 60 Prozent der Falldaten für ganz Deutschland mit Erkrankungsterminen versehen, so fiel dieser Wert Anfang Mai auf nur noch etwa 50 Prozent, Tendenz weiter abnehmend. Das ist eigentlich ein gutes Zeichen, zeigt es doch an, dass offenbar immer mehr Tests an nichtsymptomatischen Personen erfolgen, bei denen man folglich keinen Erkrankungstermin eintragen kann. Insgesamt geht die Trefferquote bei den Tests deutlich nach unten, inzwischen hat man auch genug Testkapazitäten frei, um Messungen an denselben Personen häufiger zu wiederholen. So lag die Zahl der positiv ausgegangenen Testungen am Ende von KW19 um rund 27.000 höher als die Zahl der gemeldeten Fälle. Lustig nur, dass in KW13 deutlich mehr positive Fälle beim RKI verzeichnet waren, als bei den Tests als infiziert herausgekommen waren – das könnte ein Zahlendreher sein, oder auch der Diskrepanz zwischen Test- und den Meldeterminen geschuldet sein.

Tests In Deutschland
Woche	Tests	Positive Tests	in Prozent	Labore	Positiv Getestete	Erkrankung bis Meldung (Tage)
Bis einschl. 10	124716	3892	3,1%	90	1064	4,7
11	127457	7582	5,9%	114	6377	4,4
12	348619	23820	6,8%	152	22396	5,4
13	361515	31414	8,7%	151	34018	7,1
14	408348	36885	9,0%	154	36057	7,3
15	379233	30728	8,1%	163	27150	6,8
16	330027	21993	6,7%	167	17312	7
17	360443	18015	5,0%	176	12380	6,8
18	325259	12585	3,9%	174	7431	6,5
19	382154	10187	2,7%	173	6192	6,5
	3147771	197101	100,0%		170377	6,7
Quelle: Spalten A-E: RKI-Situationsbericht vom 13.5.2020, F, G: Ermittelt aus RKI-Zahlen mit Datenstand 18.5.2020

Noch mehr R-Werte

Am Mittwoch veröffentlichte dann das Helmholz-Zentrum für Infektionsforschung (HZI) in Zusammenarbeit mit dem Ifo-Institut eine interessante Studie, die sowohl die virologisch-epidemiologische, also auch die wirtschaftliche Situation ins Kalkül zieht und als Quintessenz eine begrenzte schrittweise Öffnung zur Lockerung der pandemiebedingten Beschränkungen empfiehlt. Ausgehend vom Stichtag 20.4.2020 werden bis zum angenommenen Termin für einen breit verfügbaren Impfstoff ab dem 1. Juli 2021 mit anschließender Erholphase die volkswirtschaftlichen Kosten berechnet. Wie die Autoren einräumen, wurden dabei soziale, psychische und sonstige gesundheitliche Beeinträchtigungen durch den Shutdown ausgeblendet. Die lassen sich derzeit auch schlecht in Kosten umrechnen. Aber ihre Berücksichtigung, so die Autoren der Studie weiter, stärkt die Argumentation für eine umsichtige Lockerung der Einschränkungen.

Existenzängste, posttraumatische Belastungsstörungen und so weiter könnten jedenfalls langfristige seelische und kostspielige Folgen haben. So kommt die Quarks-Redaktion nach Sichtung einer Überblicksarbeit über 24 Studien zu diesem Thema zu dem qualitativen Schluss: "Darum ist zu lange Quarantäne keine gute Idee".

Wertschöpfungsverlust

Die Szenarien der HZI/ifo-Studie rechnen den Kostenverlauf für verschiedene Reproduktionszahlen (0,1, 0,5, 0,75 und 1,0) durch und damit kommen die Autoren zu dem Schluss, dass ein R-Wert von 0,75 für die nächsten Wochen den besten Kompromiss darstellt. Bliebe es beim R-Wert vom 20. April (0,627), so läge der Wertschöpfungsverlust bei 333 Milliarden Euro. Eine leichte Lockerung auf R=0,75 würde 26 Milliarden ersparen. Weitere Lockerungen etwa auf R=0,9 brächten für die Wirtschaft aber kaum noch was, würden aber deutlich mehr Todesopfer bedeuten. R=0,5 kostet 77 Milliarden mehr, R= 0,1 gar 277 Milliarden. Virologe Prof. Christian Drosten würdigte in seinem NDR-Podcast die Studie seiner Kollegen Prof. Michael Meyer-Hermann vom HZI (eigentlich ein studierter Elementarteilchenphysiker) und des Volkswirtschaftlers und ifo-Präsidenten Prof. Clemens Fuest und empfahl jedem, der die Zeit hat, sie zu lesen. "Das ist von der qualitativen Aussage her ein sehr wichtiger Beitrag der Wissenschaft."

Der beste Kompromiss: leichte Lockerungen die mit einem R-Wert von 0,75 (nach HZI-Berechnung) verknüpft sind, verschlimmern nur wenig die epidemiologische Situation, ersparen aber 26 Milliarden Euro.

(Bild: ifo)

HZI-zu RKI-Konverter

Aber auch hier gibt es wieder ein großes "blöd nur" – nämlich, dass die HZI-R-Berechnung eine völlig andere ist als die vom RKI. Die HZI-Reproduktionszahl bezieht sich auf die Meldedaten und arbeitet in sehr komplexer Weise Erfahrungswerte aus China und Italien mit ein. Die Unterschiede sind zum Teil deutlich: für den Stichtag 20. April hat das HZI einen R-Wert von 0,627 bestimmt, für diesen Tag hatte das RKI damals 0,9 im Lagebericht angegeben, inzwischen, mit Datenstand vom 18. Mai 0:00 liegt der nachträglich korrigierte "sensitive" RKI-R-Wert bei 0,89, der neue 7-Tage-Wert bei 0,79. Da muss man also jetzt irgendwie von 0,75 HZI auf xx-RKI umrechnen. Die Autoren der Studie geben hierfür nur indirekt eine Hilfestellung. Das wohl wichtigste Szenario, das sie durchgerechnet haben, geht davon aus, dass die Gesundheitsämter bis zu 300 neue Fälle durch Kontaktnachverfolgung und Isolation kontrollieren können. Ab dem Zeitpunkt, ab dem nur noch 300 neue Fälle auftreten, reicht es dann aus, mit einem R-Wert von 1, dieses Niveau zu halten. Etwa 59 Tage (Median-Wert) ab dem Ausgangsdatum, dem 20 April, würde es bei einem HZI-R-Wert von 0,75 dauern, bis dieses Ziel erreicht ist – also bis zum 18. Juni.

Nimmt man mal als Ausgangspunkt am Meldetag, dem 20. April, den 7-Tages -Mittelwert von 2492 Neuinfizierten (die Autoren beziffern den Ausgangswert leider nicht) und mit der beim RKI angenommenen Generationszeit von 4 Tagen wäre dann der Zielwert von 300 bei einem konstanten, stabilen RKI-R-Wert von 0,87 ebenfalls in 59 Tagen erreicht. Und siehe da, das passt gut, denn das ist just der 7-Tages-R-Wert aus dem RKI-Lagebericht von letztem Sonntag.

Inzwischen sind wir beim 19. Mai angekommen. Der aktuelle stabile Mittelwert (vor ein paar Tagen) lag bei rund 800 Neuinfektionen pro Tag. Er hätte ohne das Schlachthof-Problem mit etwa 650 Neuinfektionen/Tag gut in obiger Linie gelegen, nun müsste man den 7-Tage-RKI-R-Wert auf 0,83 drücken, um das 300er-Ziel am 18. Juni zu erreichen.

Ansonsten mäandert die HZI-R-Kurve bislang ein gutes Stück unterhalb derjenigen vom RKI, so dass man guter Dinge sein kann, das gesteckte Ziel doch noch in einem Monat zu erreichen. Aktuelle Werte für die HZI-R-Wert-Berechnung für Deutschland und die einzelnen Bundesländer samt Beschreibung findet man auf der umfangreichen Github-Seite des verantwortlichen HZI-Wissenschaftlers Dr. Sahamoddin Khailaie.

R für R-Wert

Es gibt auch noch zahlreiche andere hübsche Interpretationen der Reproduktionszahl, etwa diejenige, die die Statistiker der Universität Ilmenau in Zusammenarbeit mit den Kollegen der Uni Bielefeld vorgestellt haben. Ihr Berechnungsmodell bezieht sich wie beim HZI zunächst auf den Meldetermin. Hier fehlt jegliche Mittelung, so dass der sogenannte "instantane R-Wert" im Wochenverlauf insbesondere in Deutschland kräftig zwischen 0,3 und 1,25 schwankt. Für Deutschland holen sich die Wissenschaftler dabei die Daten vom RKI, für die Auswertung anderer Länder via Github von der Johns-Hopkins-Universität. Um den Meldeverzug auszugleichen, verschieben sie dann das Bezugsdatum um eine Woche. Das stimmt nach meinen Rechnungen auch recht gut mit dem Mittelwert der Zeitunterschiede zwischen Erkrankungs- und Meldetermine überein (sofern angegeben), der bei 6,7 Tagen für Deutschland liegt.

Meldeverzug

Größere Unterschiede zeigen sich aber bei den Bundesländern: Bayern ist hier das Schlusslicht mit 7,5 Tagen, Sachsen liegt bei 4,8 Tagen. Diesen Verzug darf man aber nicht mit dem Meldeverzug verwechseln, der zwischen dem Meldetermin des Testergebnisses beim Gesundheitsamt und der irgendwann erfolgenden Meldung über die Landesgesundheitsbehörde zum RKI liegt. Bei diesem Meldeverzug sind Saarland, Bremen, Schleswig Holstein und Rheinland Pfalz vorbildlich, sie lieferten zumindest in der untersuchten letzten Woche meist noch am selben Tag. Selbst Nordrhein-Westfalen als eines der großen "Epizentren" ist mit nur 0,7 Tage Verzug noch gut im Rennen. Das andere Epizentrum Baden-Württemberg hängt demgegenüber mit 6,3 Tagen ziemlich weit zurück, Bayern liegt in der Mitte dazwischen und rätselhaft bleibt, was in Hamburg los ist – die Hanseaten hängen über einen halben Monat hinterher ... Diese mittleren Verzugswerte wurden aus den Falldaten für Neuinfizierte in KW20 aus der RKI-Datenbank bei npgeo ermittelt.

Beim "instantanen" R-Wert rechnen die Statistiker und Gesundheitswissenschafler der Unis Ilmenau und Bielefeld die Meldeverzögerungen nicht weg ...

(Bild: Bild mit der quelloffenen Software der Wissenschaftler erzeugt )

Das Schöne an dem Berechnungsmodell der Universitäten ist, dass sie die komplette Software dazu auf Github zum Download zur Verfügung stellen. Und wie es sich für "ordentliche" statistische Software gehört, ist sie in R programmiert, was sich ja allein schon vom Namen her für den R-Wert anbietet. Mit den üblichen kleinen Anpassungsschwierigkeiten (das passende Pandoc und Plotly muss man für Ubuntu 18.04 noch etwas mühevoll aufsuchen und manuell installieren) und nach gefühlt stundenlanger Kompilationszeit, holt sich das Programm dann die aktuellen Daten vom RKI und von der JHU (Github) und erzeugt komplette Reports als HTML-Dateien mit den Plots (samt "Hoover" über die Daten). Um die Werte besser vergleichen zu können, hab ich dann aber doch mal die Daten vorab über 7 Tage gemittelt und dann darauf das Programm losgelassen. Dann sind die Ilmenauer R-Werte zwar nicht mehr so instantan, liegen aber gut im Bereich der Schwankungsbreite der RKI-Werte.

... es sei denn, man macht's selber. hier die mit dem gleitenden 7-Tage-Mittelwert berechnete R-Kurve

(Bild: Bild mit der quelloffenen Software erzeugt)

Einer geht noch ...

Und wenn nun schon jeder seine eigenen R-Werte präsentiert, darf auch mein Vorschlag nicht fehlen, der weit einfacher als die aufwendigen akademischen Berechnungen gestrickt ist und der nur mit einer Schätzung (Generationszeit von 4 Tagen) auskommt und der dennoch in der Schwankungsbreite der RKI-Werte liegt. Und der lässt sich viel leichter von jedermann er- und auch leichter vermitteln, als all die anderen.

Vier verschiedene Berechnungsmethoden für den R-Wert im Vergleich. Bei sich nur mäßig ändernden Infektionswerten unter R=1 reicht offenbar eine einfache Berechnung (braune Kurve) aus, die auf den geglätteten Werten von Zeit Online beruht.

(Bild: Andreas Stiller)

Dieser Primitiv-R-Wert ergibt sich aus dem Quotienten des gleitenden 7-Tage-Mittelwerts der Neuinfektionen vor vier Tagen mit dem aktuellen 7-Tage-Mittelwert. Er verwendet dazu aber nicht die Trödeldaten vom RKI, sondern die etwa zwei Tage aktuelleren, die die Zeit-Online-Redaktion mehrmals täglich von den über 400 Gesundheitsämtern abholt und veröffentlicht. Bleibt zu hoffen, dass das nicht mehr allzu lange nötig ist, wenn denn irgendwann mal das seit Urzeiten geplante Deutsche Elektronische Melde- und Informationssystem (DEMIS) da ist, wo es eigentlich längst schon sein sollte. Dann bräuchte man keine in den Gesundheitsämtern "Seuchenfaxe" genannten Übertragungswege mehr und könnte wohl auch die Brieftauben in Rente schicken.

(as)