Neue Datenschutzprobleme in der Genomik

Dass der Forschung Gendaten von mehr und mehr Individuen zur Verfügung stehen, hilft nicht nur, es fördert auch neuartige Datenschutz-Probleme zutage

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Studien, die Daten von sehr vielen Menschen erheben und über Jahre hinweg miteinander vergleichen, sind aus der Forschung nicht wegzudenken. Anders sind Erkenntnisse darüber, welche Einflüsse sich langfristig wie auf die Gesundheit auswirken, kaum zu bekommen. Noch mehr Wissenszuwachs erhoffen sich die Wissenschaftler aus der Möglichkeit, auch mit möglichst vielen Gen-Datensätzen der beteiligten Probanden arbeiten zu können.

Mit diesem Versprechen entstand zum Beispiel das gemeinschaftlich geführte 1000-Genome-Projekt, das die DNA-Sequenz von über 1000 Menschen analysieren will. Getreu dem Creative-Commons-Gedanken werden all diese Daten kostenfrei für jedermann im Internet zur Verfügung stehen. Das ist einerseits sinnvoll und vielversprechend. In der Forschung hat sich längst gezeigt, dass kein einzelnes Team in der Lage ist, die Vielzahl mit modernen Mitteln erhobener Daten auf jede erdenkliche Weise zu analysieren.

Nur wenn der Datenberg ohne Zugangsbeschränkungen bereitsteht, lässt er sich effizient aufbereiten, indem man ihn beispielsweise mit anderen Daten kombiniert, an die die Erzeuger der Ursprungs-Datensätze nie gedacht haben.

Als etwa der Gesundheitsdienst der Vereinigten Staaten 1948 begann, über 5.000 Bürger der Stadt auf freiwilliger Basis im Zweijahresrhythmus physisch und psychisch zu untersuchen, ging es zunächst um die Ursachen von Herzkrankheiten - mit dem 1960 durchaus noch überraschenden Ergebnis, dass Rauchen das Herz schädigt. Die Daten, die inzwischen in dritter Generation erhoben werden, dienten aber auch dazu, die Verteilung von Glück in dem sozialen Netzwerk der Probanden zu analysieren.

Allerdings dürfte es kaum möglich sein, einen Menschen anhand seiner Blutdruck-Werte zu identifizieren, selbst wenn die entsprechenden Daten gemeinfrei zur Verfügung stehen. Anders sieht das aus, wenn es um die Speicherung der DNA-Sequenz geht. Das ist keine völlig neue Erkenntnis - doch bisher gab es die großen Gen-Datenbanken noch nicht, auf die sich Forscher in Zukunft Zugriff erhoffen.

Neue Anforderungen an den Datenschutz

Im Wissenschaftsmagazin Science zeigt ein Team amerikanischer und israelischer Forscher nun, warum es dafür ganz neue Datenschutz-Betrachtungen braucht. Den Wissenschaftlern ist nämlich gelungen, was sich sicher kein Teilnehmer des 1000-Genome-Projekts gewünscht hat: Die Anonymität der Probanden aufzuheben.

Dazu verknüpften die Wissenschaftler eine Auflistung signifikanter Abschnitte auf dem Y-Chromosom mit einer weiteren Datenbank, die die Verteilung solcher Abschnitte unter Menschen mit bestimmten Familiennamen beschreibt. Den nächsten Schritt erlaubten dann genealogische Datenbanken - so dass schließlich die Identitäten von insgesamt 50 Probanden ermittelt werden können. Die unmittelbare Datenschutz-Lücke, so man davon sprechen kann, ließ sich schnell schließen: Die für die Identifizierung nötige Altersinformation ist in einer der benutzten Datenbanken nun nicht mehr öffentlich zugänglich.

Vermutlich ließen sich künftige derartige Schwachstellen ähnlich ausbessern. Dazu müssen sie allerdings erst einmal genutzt werden. Die wichtigere Frage, meinen die Forscher, ist aber, ob es ein wünschenswerter Weg ist, Forschungsdaten vor der Allgemeinheit zu verschließen. Die Probanden, die ihre Daten zur Verfügung stellen, hätten nicht nur ein Recht auf Privatsphäre, sondern auch eines darauf, dass diese Daten effizient genutzt werden.

Studien zeigen jedoch, dass offen zugängliche Datenbanken mit Forschungsergebnissen weit, weit häufiger durch die Wissenschaft genutzt werden als solche, die nur bestimmten Nutzern zur Verfügung stehen.