Studie zur Wirkung des Nichtraucherschutzgesetzes in Deutschland ist fragwürdig

Grafik: James D. Sargent, Eugene Demidenko, David J. Malenka, Zhongze Li, Helmut Gohlke, Reiner Hanewinkel (2012): Smoking restrictions and hospitalization for acute coronary events in Germany. In: Clin Res Cardiol (2012) 101:227-235

Das Ergebnis der von der DAK geförderten Studie, dass schon ein Jahr nach dem Rauchverbot ein deutlicher Rückgang von Herzerkrankungen zu beobachten sei, wurde von vielen Medien unkritisch verbreitet

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Dass nicht alles Gold ist, was glänzt, ist eine Binsenwahrheit. Was aber, wenn etwas, das kein Gold ist, von kaum jemandem als Fälschung erkannt wird? Oder gar ein Konsens darüber herrscht, dass man das Glänzende nicht zu hinterfragen hat, wenn es "der guten Sache" dient? Wird dann nicht doch Gold daraus?

Ein ähnlicher Mechanismus scheint im Medienbetrieb am Werke zu sein, und zwar immer dann, wenn eine wissenschaftliche Studie Ergebnisse zutage fördert, die sowohl mit der öffentlichen Meinung der Bevölkerungsmehrheit, der veröffentlichen Meinung in den Medien, als auch mit der Stoßrichtung einer überparteilich getragenen Politik kongruent gehen. Und wenn jene Ergebnisse dann auch noch so ganz und gar dem "gesunden Menschenverstand" entsprechen, wer wollte da annehmen, dass es sich bei dem Glänzenden vielleicht doch nicht um Gold handelt?

Das jüngste Beispiel hierfür ist die Berichterstattung zu einer Studie, die herausgefunden haben will, dass die Einführung der Nichtrauchergesetze in Deutschland ursächlich für einen Rückgang der Herzerkrankungen verantwortlich sei. Sowohl Telepolis als auch Spiegel Online glänzen hier wie fast alle in- und ausländischen Medien nicht gerade durch kritische Distanz zur DAK, auf deren Patientendaten die Studie basiert und die mit unnachahmlicher Brillanz bilanziert: "Weniger Qualm bedeutet weniger Herzerkrankungen - eine einfache Formel für die Gesundheit."

Nun ist es mit der Eindeutigkeit der Studienbefunde leider nicht so weit her, wie es einem die DAK und das Medienecho nahelegen möchte - denn um genau zu sein: es gibt gar keine Befunde.

Scheinkausalität

So stützt sich die Argumentation der Studie auf eine Zeitreihe, die auf Aggregatdaten basiert, nämlich den Quoten der Krankenhauseinweisungen aufgrund von Angina pectoris oder Herzinfarkt von je einer Million Versicherten. Nun ist es jedoch so, dass der Schluss von einem Aggregatphänomen auf ein Individuum - etwa auf das individuelle Risiko, eine solche Erkrankung zu erwerben - nicht ohne weiteres möglich ist: Ohne eine Validierung auf der Individualebene führt ein solches Vorgehen zu einem ökologischen Fehlschluss. Dies bedeutet, dass zwei Größen, die auf der Aggregatebene scheinbar einen kausalen Zusammenhang aufweisen, keineswegs auch tatsächlich ursächlich zusammenhängen müssen.

Nur weil etwa die CDU in einem Gebiet mit 40% christlicher und 60% atheistischer Bevölkerung ein Wahlergebnis von 40% erzielt, heißt dies noch lange nicht, dass die Wähler der CDU mehrheitlich christlich sind. Ohne die Überprüfung der beiden Merkmale Konfession und Wahlentscheidung auf der Individualebene ist keine valide Aussage über die konfessionelle Zusammensetzung der Wählerschaft möglich - die CDU in besagtem Gebiet könnte auch eine rein atheistische Wählerschaft aufweisen.

Ein bekanntes Bespiel aus der Sozialstrukturforschung für eine ähnliche Scheinkausalität, wie sie die Studie zu den Auswirkungen der Nichtraucherschutz-Gesetze aufweist, ist der sogenannte "Pillenknick". Als Ende der 1960er Jahre die Geburtenrate in Deutschland plötzlich rapide abnahm, war die Schuldige hierfür schnell gefunden: das Kontrazeptivum, das landläufig als "Anti-Baby-Pille" bekannt wurde. Dass die Geburtenrate, die auf intendierter Reproduktion basierte, bereits seit dem späten 19. bzw. frühen 20. Jahrhundert rückläufig war, dass der "Babyboom" der 1950er und frühen 1960er Jahre vor allem eine nachholende Reproduktion (eine sog. demographische Kompression/Dekompression) nach dem Weltkrieg in einer nun prosperierenden Wirtschaft war, und dass der "Pillenknick" auch dort zutage trat, wo die Pille noch gar nicht eingeführt worden war (z.B. in der DDR), all dies konnte der populären Mär vom "Pillenknick" nichts anhaben.

Für die zutreffende, jedoch leider auch weitaus komplexere Erklärung des Phänomens, deren Hauptargument eine säkulare Veränderung der Sozialstruktur in entwickelten Industriegesellschaften ist, die die Opportunitätskosten für eine höhere Kinderanzahl erhöht, hatte offenbar niemand so recht ein offenes Ohr. Auch hier gingen Politik, traditionelle Moralvorstellungen, der kollektive "gesunde Menschenverstand" und die Medienberichterstattung eine seltsame Koalition ein, was schließlich dazu geführt hat, dass der "Pillenknick" seinen Namen behielt - wenn auch nun in Anführungszeichen.

Statistisches Rauschen

Doch zurück zur Studie, um die es hier eigentlich gehen soll. Sowohl der Medienrezipient als auch die medialen Agenturmeldungsverbreiter würden nun vielleicht anbringen wollen, dass die Studie in einer internationalen Fachzeitschrift erschienen sei und ihre Ergebnisse zudem eine statistische Signifikanz aufweisen würden. Was hat es also auf sich mit dieser Signifikanz, die als Gütekriterium vorgetragen wird und bei DAK und Medien den Mut, sich des eigenen Verstands zu bedienen, offenbar etwas erlahmen lässt? In der Tat liegt die Fehlerwahrscheinlichkeit für den Unterschied der beiden Regressionskoeffizienten (vor und nach der Einführung des Rauchverbots, vgl. Abbildung) bei weniger als 0,01%, weshalb dieser als signifikant bezeichnet werden darf.

Was die Argumentation der Autoren jedoch vorenthält, ist die Tatsache, dass es sich hierbei allein um eine Funktion der extrem hohen Fallzahl (bei hohen Fallzahlen wird bereits der kleinste Effekt überzufällig) und des gewählten Zeitraums handelt: Die Schwankungen der Trends um die Regressionsgeraden sind so dramatisch, dass es beispielsweise bei der Herzinfarktquote genügt hätte, den Beobachtungszeitraum um ca. zwei bis drei Monate zu verkürzen (also bis zum Zeitpunkt neun bis zehn Monate nach der Einführung der Rauchverbote), um eine Regressionsgerade zu produzieren, die auf eine Erhöhung der Erkrankungsrate hindeutet: Neun bis zehn Monate nach der Einführung der Rauchverbote erreicht der Trend schließlich sein absolutes Maximum.

Ein solches Vorgehen, bei dem zwei unterschiedlich lange Zeiträume miteinander verglichen werden, ist an sich schon einigermaßen fragwürdig. Dem Verdacht jedoch, statistisches Rauschen (das sich in kürzeren Zeiträumen stärker auswirkt als in längeren) mittels Fallzahl zur Signifikanz aufzublasen, hätten die Autoren durchaus entgehen können, wenn sie bei ihren Berechnungen angegeben hätten, wie viel Varianz die Regressionsgeraden aufzuklären vermögen. Dies geschieht normalerweise durch die Angabe eines Determinationskoeffizienten (R²), an dem ablesbar ist, wie gut das statistische Modell die empirische Wirklichkeit beschreiben kann - offenbar nicht allzu gut in diesem Fall.

Doch selbst wenn diese Gütekriterien wissenschaftlichen Arbeitens berücksichtigt worden wären, bliebe festzuhalten, dass es das Studiendesign selbst ist, das die Studie jeglicher Aussagekraft beraubt. Ohne die Überprüfung auf der Individualebene, ob diejenigen, für die die Nichtraucherschutzgesetze vornehmlich ihre Wirksamkeit entfalten könnten (beispielsweise für Restaurantbesucher und Kneipengänger) auch diejenigen sind, bei denen eine geringere Erkrankungsquote festzustellen ist (und dies auch bei Berücksichtigung weiterer Risikofaktoren), bleiben die Ergebnisse wertlos. Denn selbst wenn sich der Knick im Erkrankungstrend als "wahr" und nicht nur als statisches Rauschen herausstellen sollte, könnte keine valide Aussage darüber getroffen werden, ob nun die Nichtraucherschutzgesetze oder die Veränderung eines anderen Faktors für den neuen Trendverlauf verantwortlich sind.

Dass dieses Feld der Wissenschaft grundsätzlich zugänglich ist, beweisen unzählige Studien, die sich des Themas annehmen und die Gefahren des Passivrauchens methodisch sauber auf der Individualebene untersuchen. Hier zeigt sich indes, dass zwar tatsächlich ein verstärkender Effekt des Passivrauchens auf die Wahrscheinlichkeit besteht, eine ischämische Herzkrankheit zu erwerben, doch ist dieser Effekt erst nach einer Exposition von täglich mehr als vier Stunden, über einen Zeitraum von mehr als fünf Jahren auch statistisch signifikant. Dass eine solche Expositions-Konstellation vor allem auf den häuslichen Bereich zutrifft, liegt auf der Hand. Und hier kann die Nichtraucherschutzgesetzgebung keine direkte Wirkung entfalten.

Ein solches Ergebnis ist politisch natürlich eher schlecht verwertbar. Will man mittels symbolischer Politik, z.B. über Verbote, politische Handlungsfähigkeit beweisen, muss ein solcher Politikstil natürlich nach Kräften vermeiden, zu wirken wie… na ja, wie symbolische Politik. Von dieser Warte aus betrachtet, sind Studien wie die hier kritisierte von überaus großem Wert: Nur Institutionen, die der Nimbus politischer Unabhängigkeit umgibt - und auf (natur-)wissenschaftliche Einrichtungen mag dies noch am ehesten zutreffen -, können politischen Maßnahmen glaubhaft deren Wirksamkeit attestieren. Und wenn keiner daherkommt, der daran zweifelt, dass es sich bei dem glänzend' Ding um Gold handelt - umso besser.

Einen durchaus positiven Effekt werden die Rauchverbote vermutlich dennoch entfalten, wenn auch nur einen indirekten, nämlich über den informellen Druck, der sich über eine sich etablierende Nichtraucher-Norm auf die Raucher entfaltet, wie Studien bereits jetzt nachweisen. Und es bestehen auch darüber hinaus gute Chancen, dass sich der Trend zum Rauchverzicht in Zukunft fortsetzt: So verliert das Rauchen bei Jugendlichen ohnehin mehr und mehr seinen Reiz, insofern sie nun von einer medialen Welt sozialisiert werden, in der nicht mehr der aufbegehrende Rebell und die geheimnisvolle Femme fatale an der Zigarette ziehen, sondern hässliche Bösewichte und das Mattscheiben-Prekariat.

Das unkritische Verbreiten fragwürdiger Studienergebnisse oder Artikel, die teils auf bloßer Meinung basieren, könnten hingegen einer solchen Entwicklung, die vermutlich tatsächlich zu einer Verringerung von tabakrauchassoziierten Erkrankungen führen wird, eher einen Bärendienst erweisen.