Warum das Teilen von Gendaten ein solches Dilemma ist​

In den letzten zwei Jahrzehnten erlebt die Verbreitung von Gendaten einen Boom. Doch damit gehen auch einige Risiken einher.

In Pocket speichern vorlesen Druckansicht 52 Kommentare lesen
200 Megabyte Daten in DNA gespeichert
Lesezeit: 6 Min.
Von
  • Dr. Scott Thiebes
  • Prof. Ali Sunyaev
Inhaltsverzeichnis

This article is also available in English.

In den vergangenen zwei Jahrzehnten erlebt die Verbreitung und Verarbeitung von Gendaten, also digitalen Repräsentationen der genetischen Sequenz eines Organismus, aufgrund enormer wissenschaftlicher und technologischer Fortschritte einen rapiden Anstieg. Heutzutage ist der Zugang zu Gendaten nicht mehr ausschließlich der Forschung vorbehalten, sondern hat längst Einzug in verschiedene Lebensbereiche gehalten, darunter das Gesundheitswesen, die Strafverfolgung und auch in den Endverbrauchermarkt.

Unternehmen wie 23andMe oder Ancestry bieten im weltweiten Endverbrauchermarkt "Direct-to-Consumer Gentests" für Ahnenforschung, Vaterschaftstests und die Generierung von Gesundheitsberichten an. Dabei gewinnen Genddaten auch für Hacker und andere bösartige Akteure zunehmend an Attraktivität. Erst Anfang Oktober wurde bekannt, dass Hacker die Stammbaumdaten von Millionen von Kundinnen und Kunden von 23andMe, einem der prominentesten Anbieter von Gentests für Endverbraucher, erbeuteten und online zum Verkauf anboten.

In der Gesundheitsversorgung werden Gendaten beispielsweise regelmäßig genutzt, um präsymptomatische Angehörige von Krebspatientinnen und -patienten auf spezifische, krankheitsverursachende genetische Mutationen zu untersuchen. In der Strafverfolgung sind Gentests zur Identifikation von Straftätern bei schwerwiegenden Delikten wie Mord oder Vergewaltigung längst zur Routine geworden.

Was Gendaten so spannend für die genannten Anwendungsfälle sowie für Personen mit unlauteren Absichten macht, sind ihre besonderen Eigenschaften. Insbesondere ermöglichen Gendaten Schlussfolgerungen über die Gesundheit und das Verhalten von Individuen. Ein erhöhtes Risiko für Brustkrebs kann beispielsweise durch bestimmte genetische Mutationen in den Genen BRCA1 und BRCA2 identifiziert werden. Im Gegensatz zu vielen anderen gesundheitsbezogenen Daten, wie einmal erfassten Vitaldaten, nimmt der Informationsgehalt genetischer Daten im Laufe der Zeit nicht ab. Vielmehr steigt ihr Informationsgehalt, da unser Verständnis der menschlichen DNS wächst und genetische Analyseverfahren immer ausgefeilter werden.

Darüber hinaus ist die Gensequenz einer Person relativ einzigartig und unterliegt im Laufe der Zeit nur wenigen Veränderungen. Die Wahrscheinlichkeit, dass zwei Personen die exakt gleiche genetische Sequenz besitzen, tendiert gegen Null. Selbst eineiige Zwillinge können genetische Unterschiede aufweisen. Gendaten dienen daher als eindeutige Identifikationsmerkmale über einen langen Zeitraum. Gleichzeitig teilen wir einen Teil unserer genetischen Sequenz mit unseren Blutsverwandten. Dies ermöglicht direkte Rückschlüsse auf Verwandtschaftsbeziehungen und die Gesundheit unserer Verwandten anhand unserer eigenen Gendaten.

All diese Eigenschaften bedeuten, dass das Teilen genetischer Daten neben den potenziell positiven Aspekten, wie sie beispielsweise für die Forschung oder die Diagnose und Behandlung schwerer Krankheiten von Bedeutung sind, auch erhebliche Datenschutzrisiken birgt.

Ein prominentes Beispiel für die vielfältigen Datenschutzrisiken, die sich aus dem Teilen genetischer Daten ergeben, ist der Fall des berüchtigten Golden State Killers, Joseph James DeAngelo. Zwischen 1976 und 1986 verübte DeAngelo mehrere Vergewaltigungen und Morde an der amerikanischen Westküste. Obwohl die Ermittler DNA-Proben des Mörders an einigen Tatorten vorfanden, konnten sie diese damals nicht DeAngelo zuordnen.

Die Wende kam erst im Jahr 2017, als Ermittler DNA-Proben von Tatorten auf die öffentlich zugängliche Gendaten-Webseite GEDmatch hochluden. Dort identifizierten sie eine Reihe von entfernten Verwandten, die zuvor offenbar ihre eigenen Gendaten auf derselben Webseite geteilt hatten. Nach umfangreichen Ermittlungen ermöglichte dies schließlich im Jahr 2018 die Identifikation und Verurteilung von DeAngelo – mehr als 30 Jahre nach seinen letzten bekannten Straftaten und ohne, dass er jemals selbst seine eigenen Gendaten öffentlich zugänglich gemacht hatte.

Obwohl es sicherlich positiv zu bewerten ist, dass DeAngelos entfernte Verwandte durch das Teilen ihrer eigenen Gendaten unbeabsichtigt zur Ergreifung und Verurteilung eines schweren Straftäters beigetragen haben, wirft der Fall des Golden State Killers und die zunehmende Verbreitung genetischer Daten dennoch viele Fragen hinsichtlich des genetischen Datenschutzes auf. Diese Fragen betreffen dabei keineswegs nur einen kleinen Teil der Gesellschaft. Eine im Jahr 2018 in der Fachzeitschrift Science veröffentlichte Studie kommt etwa zu dem Schluss, dass 60 Prozent der weißen US-amerikanischen Bevölkerung durch eine anonymisierte DNA-Probe re-identifiziert werden könnten, selbst wenn sie ihre eigenen Gendaten noch nie mit einer Ahnenforschungsdatenbank oder einer Behörde geteilt haben.

Genetische Daten spielen eine unverzichtbare Rolle in der modernen biomedizinischen Forschung und haben bereits zu zahlreichen wissenschaftlichen Durchbrüchen verholfen. Ein breiterer Zugang zu genetischen Daten einer diverseren Population weckt Hoffnungen auf weitere medizinische Fortschritte in der Zukunft. Daher erscheint die im Patientendaten-Schutz-Gesetz vorgesehene Möglichkeit zur Datenspende, speziell im Zusammenhang mit Gendaten, richtig und wichtig. Allerdings benötigt es nicht viel Vorstellungskraft, um zu erkennen, dass solche Informationen und speziell Gendaten für Cyberkriminelle und andere bösartige Akteure zunehmend interessant werden.

Offen bleibt, ob der Zweck, nämlich Fortschritte in der medizinischen Forschung, die Mittel, nämlich die Spende von Gendaten, heiligt. Paradoxerweise liegt diese Entscheidung wohl in der Hand jeder potenziellen Spenderin und jedes potenziellen Spenders, obwohl diese Entscheidung auch direkte Auswirkungen auf Verwandte haben kann. Neben technologischen Schutzmaßnahmen ist daher eine umfassende Aufklärung potenzieller Spender über mögliche Risiken unerlässlich. Dies schließt nicht nur die Tatsache ein, dass Gendaten nur schwer effektiv anonymisiert werden können, sondern insbesondere auch, dass das Teilen Datenschutzrisiken für Verwandte mit sich bringt.

Dr. Scott Thiebes vom Karlsruhe Institute of Technology (KIT) hat sich in seiner Dissertation mit dem Dilemma von Gendaten-Spenden (PDF) befasst und auf der DAFTA einen Preis für seine Arbeit erhalten. Professor Ali Sunyaev leitet am KIT die Forschungsgruppe Critical Information Infrastructures (cii)

(mack)