Kopiert statt gelesen

Aufgrund einer statistischen Analyse lesen nur 20 Prozent der Wissenschaftler die Quellen, auf die sie in wissenschaftlichen Artikeln verweisen

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Ganz entscheidend für die Wissenschaftler ist geworden, wie oft sie von anderen in wissenschaftlichen Arbeiten zitiert werden. Mit jedem Hinweis steigt das Ansehen. Und in der Aufmerksamkeitsgesellschaft wird die akkumulierte Prominenz auch als Quote im Science Citation Index notiert (Jenseits von Geld und Information). Allerdings ist die von Wissenschaftlern dem Zitierten geschenkte Aufmerksamkeit nicht unbedingt hoch. Viele kopieren nämlich die zitierten Veröffentlichungen einfach aus anderen Artikeln - mit denselben Fehlern, wie zwei Wissenschaftler herausgefunden haben. Wenn man sich mit Prominenz umgibt, dann kann auch der eigene Aufmerksamkeitsmarktwert steigen und der Inhalt an Glaubwürdigkeit gewinnen.

Mikhail Simkin und Vwani Roychowdhury vom Department of Electrical Engineering der University of California in Los Angeles glauben festgestellt zu haben, dass viele Wissenschaftler nicht einmal die Artikel wirklich gelesen haben, die sie zitieren. Darauf gestoßen sind sie, weil im Science Citation Index Literaturverweise häufig fehlerhaft sind - und weil sich die Fehler in der Schreibweise erstaunlich oft identisch wiederholen. Hätten sie allerdings nicht bei den Naturwissenschaftlern, sondern bei den Sozial- und Geisteswissenschaftlern nachgeforscht, deren Publikationen oft genug mit einem Heer an Literaturverweisen aufwarten, wären ihre Ergebnisse sicherlich noch wesentlicher eindeutiger ausgefallen. Schließlich müssen "weiche" Wissenschaften noch mehr in Aufmerksamkeit investieren.

Gelehrig wie Wissenschaftler sind, auch wenn sie aus Elektrotechnik stammen, verweisen die Autoren auf die Psychoanalyse von Freud, und zwar auf dessen Buch "Zur Psychopathologie des Alltagslebens" (und behaupten überdies, wie New Scientist berichtet, alle zitierten Arbeiten, also auch das Buch, gelesen zu haben). Freud habe entdeckt, dass Fehlleistungen wie Verschreiben oder Versprechen etwas über die Psyche eines Menschen offenbaren und nicht nur reiner Zufall sind. Schreibfehler bei wissenschaftlichen Literaturangaben sollten dann in Analogie etwas über den Prozess des wissenschaftlichen Schreibens verraten, wenn schon nicht über die Person des Wissenschaftlers.

Das Prinzip der geringsten Anstrengung

Um die Fehlerwahrscheinlichkeit zu demonstrieren, dient die Angabe einer Seitenzahl mit vier Stellen als Beispiel, bei der eine Zahl falsch gedruckt wurde. Insgesamt gibt es 10 hoch 4 Möglichkeiten für die Verwechslung einer Ziffer: "Die Wahrscheinlichkeit, den Druckfehler eines Anderen zu wiederholen, liegt bei 10 hoch -4. Es dürfte praktisch keine wiederholten Druckfehler durch Zufall geben. Die Schlussfolgerung ist, dass wiederholte Druckfehler sich dem Kopieren der Zitatangabe eines Anderen verdanken, ohne dass der fragliche Artikel selbst gelesen wurde."

Wie wissenschaftlich üblich gingen die Autoren also von der Hypothese der Nichtzufälligkeit der Schreibfehler aus und unterzogen diese einer statistischen Analyse - mit dem erstaunlichen Ergebnis, dass vermutlich nur 20 Prozent der Zitierenden das Original, auf das sie verweisen, wirklich gelesen haben sollen. Ihrer Untersuchung legten sie einen bekannten Artikel von M Kosterlitz und D. Thouless zugrunde, der im Journal of Physics C 1973 erschienen ist und den später nach den beiden Wissenschaftlern benannten Phasenübergang beschreibt. Insgesamt wurde der Artikel 4.300 Mal zitiert. Bei den Literaturverweisen fanden sich 196 Fehler, was den Band, die Seitenzahl oder das Jahr betraf. Trotz der gewaltigen Zahl an Verwechslungsmöglichkeiten einer Zahl fanden sie aber nur 45 unterschiedliche Druckfehler. Der häufigste Fehler trat gar 78 Mal auf.

Wie die Autoren vermuten, haben 45 Wissenschaftler einen Fehler in ihren Literaturangaben auf den Kosterlitz-Thouless-Artikel hineingebracht, der dann von 151 weiteren Wissenschaftlern übernommen wurde, weil sie den Literaturverweis nicht dem Original entnahmen, sondern aus einem der 45 Artikel kopierten. Das würde heißen, dass mindestens 77 Prozent von denjenigen, bei denen ein Fehler auftaucht, den Originalartikel nicht gelesen haben. Um vorschneller Kritik zu entgehen, bezeichnen die beiden Autoren einen "Leser" als jemanden, der für die Literaturliste zumindest in einer vertrauenswürdigen Quelle, dem Originalartikel oder einer vielbenutzten Datenbank, nachgeschaut hat.

Wer Fehler macht, die sich wiederholen, fällt auf, weswegen sich mit statistischen Methoden auch die Abschreiber bei Tests entdecken lassen. Das aber muss nicht heißen, dass diejenigen, die richtig zitieren, auch im Original nachgeschaut haben müssen. Nach der "Evolution der Fehlerverteilung" könne die gefundene Fehlerzahl nur zustande kommen, wenn 78 Prozent der Literaturhinweise, wozu natürlich auch die richtigen gehören, aus einer Sekundärquelle kopiert wurden. Und diese Zahl würde auch dem "Prinzip der geringsten Anstrengung" oder dem "Zipfs Prinzip" gehorchen.

Wer - zufällig - einen korrekten Literaturverweis kopiert, hat nur Glück gehabt, nicht unmittel- und nachweisbar als Kopierer aufzufallen. Ähnliche Fehlerverteilungen würden sich auch bei anderen Artikeln finden. Möglicherweise gehen Wissenschaftler davon aus, dass ihre Wissenschaftlerkollegen verlässlich sind und genau arbeiten, tragen aber mit diesem irrigen Urvertrauen in ihre eigene Klasse zur Ausbreitung von Fehlern bei, die sich wie eine memetische Ansteckung ausbreiten können. Die Möglichkeit, dass Wissenschaftler den Literaturhinweis aus der Sekundärliteratur nehmen, aber dennoch das Original lesen könnten, setzen die Autoren jedenfalls wohl zu recht als ziemlich unwahrscheinlich an.

"Cut-and-Paste"-Kultur in der Wissenschaft

Ihrem Artikel haben Simkin und Roychowdhury den auffordernden Titel: "Lies, bevor du zitierst!" gegeben. Sie glauben überdies, dass das Internet erheblich zur Ausbreitung von Fehlern durch "cut and paste" beiträgt und noch beitragen wird. Internetnutzer wären dazu verführt, noch mehr Inhalte aus zweiter Hand zu kopieren, ohne diese zu überprüfen. In der Vor-Internetzeit hätte es noch dieselbe Mühe gekostet, einen Literaturhinweis zu kopieren, als ihn selbst abzutippen, weswegen es kaum Sinn gemacht hätte, diesen zu kopieren, wenn man Zugang zum Original hatte.

"Im letzten Jahrzehnt ist mit der Ankunft des Internet genauso leicht möglich geworden, dass Nichtleser etwas von unzuverlässigen Quellen kopieren, als dass Leser Zugang zum Original haben, aber es gibt für diejenigen, die das Original lesen, keine wachsende Belohnung gegenüber jenen, die wörtlich kopieren, besonders wenn sie dies aus unzuverlässigen Quellen machen."

Sollte es stimmen, was Simkin und Roychowdhury nach ihrem Modell ausgerechnet haben, dann verfährt Wissenschaft eben auch strikt nach dem Gesetz der Aufmerksamkeit, nachdem das prominenter wird, was bereits schon Prominenz erworben hat. Für Quellen oder Wissenschaftler, die bereits zitiert wurden, stiege also die Wahrscheinlichkeit, dass sie weiter zitiert werden, weil die Autoren sich mit Prominenz aufwerten oder absichern wollen. Dafür aber ist nicht notwendig, das Original selbst in seiner Bedeutung zu überprüfen, weil die Zitathäufigkeit selbst schon die kollektive Wertschätzung belegt - und dabei kann man sich vermutlich eher weniger blamieren, als wenn man sich auf das eigene Urteil verlässt und womöglich aus unbekannten Quellen zitiert.

Und ganz genauso verfährt bekanntlich die Suchmaschine Google, die jene Suchergebnisse am besten bewertet und damit als zuerst angibt, die von den meisten Menschen angeklickt wurden und/oder auf die am meisten Links verweisen. Dass sich die Masse nicht irrt, war allerdings gerade nicht das Prinzip des wissenschaftlichen Denkens. Aber auch Wissenschaftler sind Menschen, die oft genug den Weg des geringsten Widerstands mit dem Versprechen auf höchste Effizienz einschlagen.