Verfälschte Tabellen: Excel bereitet Genforschern Probleme

Laut einem aktuellen Artikel weisen Tabellen von durchschnittlich 20 Prozent der Veröffentlichungen zur Genforschung Fehler auf. Sie entstehen durch das automatische Konvertieren von Daten durch Excel.

In Pocket speichern vorlesen Druckansicht 706 Kommentare lesen
Verfälschte Tabellen: Excel bereitet Genforschern Probleme

Auch vor der Dominanz von Excel ging es in der Forschung nur bedingt übersichtlich zu.

(Bild: Pieter Bruegel der Ältere / Philipp Galle, Gemeinfrei)

Lesezeit: 2 Min.

Laut einem Artikel der drei Wissenschaftler Mark Ziemann, Yotam Eren und Assam El-Osta weisen durchschnittlich etwa 20 Prozent der Tabellen in Veröffentlichungen zur Genforschung Fehler auf. Konkret handelt es sich um Daten, die Artikeln in Zeitschriften anhängen und die in Microsofts Dateiformaten .xls und .xlsx vorliegen. Dabei bereitet Excel den Forschern Schwierigkeiten, da die Tabellenkalkulation bestimmte Daten automatisch umwandelt. So setzt sie MARCH1 mit dem 1. März gleich und tauscht 2310009E13 gegen 2.31E+13 aus.

Dass Wissenschaftler, die die Daten der Tabellen anschließend weiterverwenden wollen, sich so häufig nicht auf das Dokument verlassen können oder sollen, liegt auf der Hand. Allerdings habe sich das Problem in den vergangenen Jahren deutlich verschlimmert – in den letzten fünf Jahren haben die Forscher einen Anstieg an falschen Daten um jährlich 15 Prozent beobachtet. Außerdem variiert das Ausmaß je nach Zeitschrift erheblich: zwischen etwa 5 und 30 Prozent.

Dennoch darf man sich fragen, ob die Schuld nicht vielmehr die Wissenschaftler selbst trifft. Immerhin könnte der Befund genauso darauf hindeuten, dass sie dem Programm blind vertrauen und die Daten nicht genau überprüfen würden. Die Verfasser des Artikels heben jedoch hervor, dass Excel diese Änderungen ohne Zutun des Nutzers vornehme und er diese Funktion zudem nicht dauerhaft entfernen könne. Erschwerend komme hinzu, dass Microsoft bereits vor über zehn Jahren erstmals auf das Problem hingewiesen wurde und seitdem nichts an dem Verhalten geändert habe.

Entsprechend handelt es sich um keine neue Erkenntnis. Ziemann, Eren und El-Osta wollen mit ihrem Artikel jedoch Aufmerksamkeit für das Problem generieren. Zur Ehrenrettung von Microsoft geben sie außerdem an, dass LibreOffice Calc und Apache OpenOffice Calc Daten genauso umwandeln würden. Einzig Google Sheets würde die originalen Eingaben unverändert übernehmen. Zum Erheben der Fehler haben die Wissenschaftler ein Bash-Skript verwendet, Details zur Methode können Interessierte im Abstract des Artikels nachlesen. (fo)