iX 9/2016
S. 70
Report
Reproducible Research
Aufmacherbild

Mit Open-Source-Werkzeugen Struktur in die Forschung bringen

Nachvollziehbar

Open-Source-Tools zur Automatisierung und Qualitätssicherung gehören bei professionellen IT-Anwendern längst zum Alltag. Doch Git, Docker und knitR können auch Forschung reproduzierbar machen.

Zu Forschung gehört die systematische Suche nach neuen Erkenntnissen ebenso wie deren Dokumentation und Veröffentlichung. Oft beschränkt sich die Dokumentation auf ein Methoden-Kapitel zwischen Einleitung und Ergebnis-Kapitel von wissenschaftlichen Aufsätzen. Im besten Fall enthält dieses Kapitel ein klares Rezept mit nachvollziehbaren Schritten, das es anderen Wissenschaftlern erlaubt, die Ergebnisse zu reproduzieren. Es gelingt jedoch nicht immer, die gesamte Komplexität und die einzelnen Schritte samt Begründung in dieses eine Kapitel zu pressen. Viel Wissen verbleibt beim Autor: in dessen Schublade oder auf dessen Festplatte.

Wissenschaftler können oft wichtige Fragen zum Vorgehen bereits kurz nach Abschluss eines Projekts nicht mehr beantworten: In welchem Verzeichnis liegen die relevanten Daten? Mit welchem Skript wurde die Grafik erstellt? Wie lauteten die Parameter? Noch schwerer haben es Dritte, die versuchen, Ergebnisse zu reproduzieren. Ihnen steht lediglich die Beschreibung in Form eines Aufsatzes oder Buchkapitels zur Verfügung. Aus der Aufgabe, die Ergebnisse zu reproduzieren, wird unter Umständen ein größeres Projekt. Zusätzlich lässt sich nur schwer feststellen, ob Fehler Teil der Ursprungsstudie waren oder ob sie durch fehlerhaftes Reproduzieren eingeführt worden sind. Heutzutage ist Wissenschaft datengetriebener als früher. Dementsprechend fällt den verwendeten Algorithmen, der Software und den Daten eine wichtigere Rolle zu.