Wie wirksam sind die Covid-19-Impfstoffe?

Ob die Wirksamkeit "bis 95 Prozent" oder nur um ein Prozent beträgt, ist abhängig von der Risikomessgröße sowie der relativen oder absoluten Risikoreduktion

Wirksamkeit und Sicherheit sind die beiden wichtigsten Kriterien zur Beurteilung und Bewertung der vier inzwischen in Deutschland vom Paul-Ehrlich-Institut zugelassenen Covid-19-Impfstoffe.

Dabei handelt es sich um den Comirnaty genannten Impfstoff von Biontech-Pfizer und den Covid-19-Impfstoff Moderna, zwei mRNA-Vakzine, und die beiden Vektor-Impfstoffe Vaxzevria vom Pharmakonzern Astrazeneca und dem Covid-19-Impfstoff Janssen von Johnson & Johnson. Nachdem sich mein letzter Telepolis-Artikel mit der Sicherheit dieser Impfstoffe beschäftigt hat1, geht es im vorliegenden Text um die Wirksamkeit dieser Vakzine gegen Covid-19.

Bei der Antwort auf die im Titel formulierte Frage könnte man es sich leicht machen und auf die entsprechenden Ergebnisse der Phase-III-Studien verweisen, die bei der Zulassung von den Herstellern vorgelegt worden sind. Für Comirnaty bzw. den Covid-19-Impfstoff Moderna wurden eine Wirksamkeit von 95 Prozent bzw. 94,1 Prozent angegeben2, während die Hersteller für Vaxzevria eine Wirksamkeit von zunächst 70,4 Prozent und dann 66,7 Prozent3 und für den Covid-19-Impfstoff Janssen eine von zunächst 66,9 Prozent4 errechnet haben.

Vor einigen Tagen hat nun Florian Rötzer die hohen Prozentangaben für die Wirksamkeit der Impfstoffe in Frage gestellt.5 Er hat darauf hingewiesen, dass nur die vielversprechenden und kaum vergleichbaren Zahlen für die relative Risikoreduktion (RRR) von 90 Prozent und mehr verbreitet werden und nicht die Zahlen der absoluten Risikoreduktion (ARR), die sich um ein Prozent bewegen. Was ist von dieser Kritik zu halten?

Relative und absolute Risikoreduktion und "number needed to treat"

Die evidenzbasierte Medizin beschäftigt sich mit der Messung von Behandlungseffekten bei der Arzneimitteltherapie.6 Zur Beurteilung der Wirksamkeit einer Behandlung werden randomisierte und kontrollierten Interventionsstudien durchgeführt, die sogenannten RCTs. Dazu gehören auch die Phase-III-Studien der oben genannten Impfstoffe. In den meisten dieser Arbeiten werden die Ergebnisse als relative Risikoreduktion (RRR) angegeben. Hier finden sich meist Prozentwerte im zweistelligen Bereich.

Seit mehr als 20 Jahren besteht jedoch Übereinstimmung darüber, dass nicht die RRR, sondern nur die absolute Risikoreduktion (ARR) für die Beurteilung der Wirksamkeit in quantitativer Hinsicht ein geeigneter Parameter ist. Deren reziproker Wert als "number needed to treat" (NNT) bringt die Effizienz anschaulich zum Ausdruck.

Verstorbene (Anzahl) Ereignisrate RRR  ARR NNT 
Studie KG IG KG IG 5 Jahre 1 Jahr
A 3000 2000 30 % 20 % 33 % 10 % 10 50
B 300 200 3 % 2 % 33 % 1 % 100 500
C 30 20 0,3 % 0,2 % 33 % 0,1 % 1000 5000
Tabelle 1: Ereignisraten, RRR, ARR und NNT in drei verschiedenen Studien A, B und C mit jeweils 10.000 Patienten in der Kontrollgruppe (KG) und der Interventionsgruppe (IG), bezogen auf eine Studiendauer von 5 Jahren.

Zur Illustration der Zusammenhänge zwischen den Messgrößen RRR und ARR sind in Tabelle 1 die Behandlungsergebnisse von drei hinsichtlich des Ausgangsrisikos unterschiedlichen Interventionsstudien (A, B und C) dargestellt (siehe auch die Legende).7

Die erste Spalte der Tabelle zeigt die Zahlen der Verstorbenen pro jeweils 10.000 Patientinnen und Patienten in der KG und der IG während der Studiendauer von 5 Jahren an. Diese Zahlen sind zu Demonstrationszwecken so gewählt, dass sie in den drei Studien um jeweils eine Zehnerpotenz abnehmen. Die zweite Spalte zeigt die entsprechenden Ereignisraten in Prozent.

In der dritten Spalte ist dargestellt, dass in den verschiedenen Studien A, B und C trotz abnehmender Ereignisrate in der KG (Ausgangsrisiko) die relative Risikoreduktion (RRR) bei 33 Prozent unbeeinflusst bleibt, wohingegen die absolute Risikoreduktion (ARR) in der vierten Spalte von klinisch bedeutsamen zehn Prozent (Studie A) auf bedeutungslose 0,1 Prozent (Studie C) absinkt.

Ärztinnen und Ärzte finden es häufig ungewohnt, mit diesen relativ abstrakten Risikomessgrößen umzugehen und sie auf ihre Patienten anzuwenden. Als Hilfestellung wurde ein neuer Begriff entwickelt, der sich unmittelbar aus der ARR ableitet und eine intuitiv eingängige Vorstellung über die Wichtigkeit des beobachteten Effekts vermittelt.8

Es ist die "number needed to treat" (NNT), die in der fünften Spalte aufgeführt ist und sich einfach als Kehrwert der ARR errechnet. Die NNT gibt die Anzahl der Patienten an, die behandelt werden muss, um ein Ereignis, hier einen Todesfall, zu verhindern. Sie steigt von 10 in Studie A auf 1000 in Studie C an. Trotz dieses geringen Behandlungseffektes beträgt auch in der Studie C die RRR unverändert 33 Prozent.

Der Vergleich von Studienergebnissen ist dann schwierig, wenn die Studiendauer sich deutlich unterscheidet. Zur Orientierung kann dann die Berechnung auf die gleiche Dauer, zum Beispiel ein Jahr, erfolgen. Diese "fiktiven" NNT-Werte sind ebenfalls in der fünften Spalte von Tabelle 1 aufgeführt.

Insgesamt soll diese Darstellung demostrieren, dass die Wirksamkeit einer Behandlungsmaßnahme nur mit der absoluten Risikoreduktion (ARR) und der "number needed to treat" (NNT) verlässlich beurteilt werden kann. Im Gegensatz dazu ist die RRR kein geeigneter Parameter für vergleichende Untersuchungen der Wirksamkeit von Behandlungseffekten, da diese Messgröße unabhängig von der Ereignisrate ist und meist beeindruckende Prozentzahlen im zweistelligen Bereich ergibt.

Deshalb wird sie mit großer Vorliebe von der pharmazeutischen Industrie zur Beschreibung der Wirksamkeit von Maßnahmen herangezogen und trägt daher auch den Spitznamen "Marketingzahl", während die ARR als absolute Zahl den "wirklichen Effekt" reflektiert und die NNT die "klinische Zahl" darstellt.9

Am Rande sei hier angemerkt, dass in der Veröffentlichung, aus der die oben angeführte Tabelle stammt, zum ersten Mal gezeigt werden konnte, dass bei Patienten mit einer koronaren Herzkrankheit (Herzkranzgefäßeinengung) Lebensstiländerungen zur Sekundärprävention wie die Beendigung des Rauchens, eine gesunde Ernährung, regelmäßige körperliche Aktivität und Stressabbau in der Summe die Wirksamkeit einer kombinierten medikamentösen Therapie deutlich überschreiten.10 Die Grundlage für diese Analyse war die Feststellung der ARRs und NNTs in den vorliegenden einschlägigen RCTs.

Absolute Risikoreduktion und "number needed to vaccinate"

Was bedeuten diese Erkenntnisse für die Beurteilung der Ergebnisse der Impfstudien? Zu diesem Thema ist am 20.4.2021 eine bedenkenswerte Veröffentlichung mit dem Titel "Covid-19 vaccine efficacy and effectiveness—the elephant (not) in the room" in der renommierten Wissenschaftszeitschrift The Lancet Microbe zur Diskussion gestellt worden.11

"The elephant in the room" (der Elefant im Raum)" ist eine im englischen Sprachraum häufig gebrauchte Metapher, die ein offensichtliches Problem bezeichnet, das zwar im Raum steht, aber dennoch von den Anwesenden aus verschiedenen Gründen nicht angesprochen wird. Die Gründe für das Schweigen können vielfältiger Natur sein, beispielsweise die Angst vor persönlichen Nachteilen.

Zunächst wird in dem besagten Artikel darauf hingewiesen, dass inzwischen in wissenschaftlichen Fachzeitschriften die Zwischenergebnisse einer Reihe von Studien über die vier oben genannten Impfstoffe und den russischen Impfstoff Sputnik V vom Gamaleya-Institut in Moskau veröffentlicht worden sind. Weiterhin seien Auszüge aus diesen Resultaten über die Medien weitverbreitet und zum Teil auch missverständlich dargestellt worden.

Wie oben schon erwähnt, wird die Wirksamkeit der Impfstoffe allgemein als relative Risikoreduktion (RRR) angegeben. Diese errechnet sich aus dem relativen Risiko (RR), das heißt, dem Verhältnis der Erkrankungsraten mit und ohne Impfstoff, und wird dann ausgedrückt als 1 minus RR.

Ein Beispiel: Wenn in der Phase-III-Studie beim Einsatz von Comirnaty 162 Erkrankungen ohne Impfstoff und 8 Erkrankungen mit Impfstoff festgestellt wurden, dann beträgt die RRR 1 entsprechend 100 Prozent minus 5 (8:170) Prozent gleich 95 Prozent12.

Aus der gemeldeten Wirksamkeit in Form der RRR wird ein Ranking der Impfstoffe abgeleitet, wobei die mRNA-Vakzine von Biontech-Pfizer und Moderna von 95 bzw. 94 Prozent ganz oben stehen. Dann folgen Sputnik V mit 90 Prozent und zuletzt die Impfstoffe von Johnson & Johnson und AstraZeneca mit 67 Prozent (siehe Abbildung 113).

Abb. 1: RRR- und der NNV-Werte (mit 95-prozentigen Vertrauensbereich) für die fünf Covid-19-Impfstoffe.

Die Autoren stellen fest, dass die RRR jedoch vor dem Hintergrund des Risikos gesehen werden muss, mit Covid-19 infiziert zu werden und zu erkranken. Dieses Risiko variiert hinsichtlich seiner Häufigkeit von Bevölkerung zu Bevölkerung in den verschiedenen Ländern und in Abhängigkeit vom Zeitpunkt des Infektionsverlaufs.

Während die RRR nur Teilnehmer berücksichtigt, die von dem Impfstoff profitieren könnten, weil sie sich infiziert haben und erkrankt sind, berücksichtigt die absolute Risikominderung (ARR) - das ist die Differenz zwischen den Erkrankungsraten mit und ohne Impfstoff - die gesamte Population.

ARRs werden jedoch in der Regel ignoriert, schreiben die Autoren des Lancet-Artikels, weil sie eine viel weniger beeindruckende Effektgröße als die RRRs ergeben: 1,3 Prozent für den Impfstoff für AstraZeneca, 1,2 Prozent für den von Moderna, 1,2 Prozent für den von Johnson & Johnson und 0,93 Prozent für Sputnik V und 0,84 Prozent für den Impfstoff von Biontech-Pfizer.

Wie oben bei der Bestimmung der NNT dargestellt, kann analog aus der ARR auch eine Zahl abgeleitet werden, um die Wirksamkeit des Impfstoffs realistisch einschätzen zu können. Diese Zahl heißt "number needed to vaccinate" (NNV). Sie bedeutet die Anzahl der Impfungen, die erforderlich sind, um eine weitere Erkrankung mit Covid-19 zu vermeiden, und errechnet sich, wie oben dargestellt, aus dem Kehrwert der ARR, d. h. aus 1/ARR.

NNVs bringen eine andere Perspektive: 76 für den Impfstoff von Moderna, 78 für den von Astrazeneca, 80 für das Gamaleya-Vakzin, 84 für das von Johnson & Johnson und 117 für den Impfstoff von Biontech-Pfizer (siehe auch Abbildung 1). Je niedriger die Zahl ausfällt, desto stärker ist die Wirksamkeit.

Die Erklärung für diese Unterschiede liegt in der Kombination von Impfstoffwirksamkeit und den unterschiedlichen Hintergrundrisiken von Covid-19 in den zugrunde liegenden Studien. ARR (und NNV) reagieren empfindlich auf das Hintergrundrisiko - je höher das Risiko, desto höher die Wirksamkeit.

Aus der Art und Weise, wie Studien durchgeführt und Ergebnisse präsentiert werden, können also viele Lehren gezogen werden, meinen die Autoren. Mit der Verwendung von RRR und unter Auslassung von ARRs kommt es zu einem Bias, einer Verzerrung der Berichterstattung, die die Interpretation der Wirksamkeit von Impfstoffen beeinflusst.

Bei der Kommunikation über die Wirksamkeit von Impfstoffen, insbesondere bei Entscheidungen im Bereich der öffentlichen Gesundheit, wo es z. B. um die Wahl des zu kaufenden und einzusetzenden Impfstoffs geht, ist ein vollständiges Bild davon, was die vorliegenden Daten tatsächlich zeigen, wichtig.

Auch muss sichergestellt sein, dass Vergleiche zwischen den Vakzinen auf allen vorliegenden Daten basieren und nicht ein wesentlicher Teil der Ergebnisse ausgespart wird. Dazu gehören die Messgrößen ARR und NNV, auch wenn sie nicht allen gefallen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier eine externe Buchempfehlung (Amazon Affiliates) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Amazon Affiliates) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.