Leichtes Spiel für Gen-Detektive

US-Forscher konnten in einer Studie zeigen, dass vermeintlich anomysierte Genome in öffentlichen Forschungsdatenbank ohne großen Aufwand konkreten Personen zugeordnet werden können.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Lesezeit: 5 Min.
Von
  • Susan Young

US-Forscher konnten in einer Studie zeigen, dass vermeintlich anomysierte Genome in öffentlichen Forschungsdatenbank ohne großen Aufwand konkreten Personen zugeordnet werden können.

Wer das eigene Genom in den Dienst der Wissenschaft stellt, vertraut wohl selbstverständlich darauf, dass seine Daten anonymisiert werden. Doch die Privatsphäre muss deshalb nicht zwangsläufig gewahrt bleiben: Forscher des Whitehead Institute for Biomedical Research am MIT haben herausgefunden, dass mit im Netz verfügbaren Informationen und ein wenig detektivischem Aufwand Genomsequenzen wieder konkreten Personen zugeordnet werden können.

Frei zugängliche Datensätze sind heute ein wichtiger Bestandteil der Genomforschung, um genetischen Ursachen von Krankheiten auf die Spur zu kommen. Das 1000 Genomes Project etwa hält einen Katalog über genetische Variationen bereit, der öffentlich einsehbar ist. Das Projekt versucht, Krankheitsrisiken über Gen-Mutationen zu bestimmen. Solche offenen Datenbanken würden wesentlich häufiger von Wissenschaftlern genutzt als Quellen mit Zugangskontrolle, stellen die National Institutes of Health (NIH) in einer Stellungnahme zu der neuen Studie fest. Beide sind vergangenen Freitag im Wissenschaftsjournal Science veröffentlicht worden.

„Natürlich wollen wir nichts weniger, als solche Ressourcen hinter Firewalls verschwinden zu lassen“, betont Yaniv Erlich, Genetiker am Whitehead Institute for Biomedical Research und Hauptautor der Studie. „Wir sind dafür, dass Daten öffentlich geteilt werden. Aber wir müssen darüber nachdenken, wie sie missbraucht werden könnten, und dies auch klar benennen.“

In den USA bietet der Genetic Information Nondiscrimination Act von 2008 einen gewissen Schutz: Arbeitgeber und Krankenversicherungen dürfen Bürger nicht nach ihrer genetischen Disposition beurteilen. Für Lebens- und Unfallversicherungen gilt diese Einschränkung jedoch nicht.

„Wir haben kein umfassendes Gesetz für die genetische Privatsphäre“, sagt Jeremy Gruber, Anwalt und Präsident des Council for Responsible Genetics, und fordert: „Die Menschen müssen noch viel besser über mangelnden Datenschutz bei Gendaten informiert werden.“

Langfristig sei es besser, dass dieses Problem von wohlgesonnenen Ermittlern aufgedeckt werde als von Dritten, die aus den Daten einen Vorteil ziehen wollten, sagt Erlich. „Das würde das Vertrauen der Öffentlichkeit untergraben.“ In Deutschland verbietet das Gendiagnostikgesetz, das am 1. Februar 2010 in Kraft trat, Versicherungen, genetische Daten anzufordern, doch gibt es hierbei Ausnahmen.

Es ist nicht das erste Mal, dass die Datenschutzprobleme von Genom-Datenbanken aufgedeckt werden. Andere Gruppen konnten bereits zuvor zeigen, wie mit Hilfe einer zweiten DNA-Probe die vermeintliche Anonymität von Datenbanken geknackt werden könnte. In der jetzigen Studie hat Erlichs Gruppe jedoch nur so genannte genetische Marker und Internet-Abfragen verwendet, um die Identität von 50 Personen in öffentlichen Datenbanken aufzudecken.

Erfahrung bringt Erlich aus seiner früheren Tätigkeit als IT-Sicherheitsforscher für die Industrie mit. Datenbanken mit Familienstammbäumen, die ein Detail des Y-Chromosoms, ein „Tandem Repeat“, einem Nachnamen zuordnen, genügten ihm für den Hack. Welche biologische Funktion diese Tandem Repeats haben, ist bislang nicht bekannt. Sie werden aber in der Ahnenforschung verwendet, weil ihre Anzahl und Länge sich von Vätern an Söhne vererbt. Um die Identität wasserdicht zu machen, mussten Erlich und seine Kollegen dann nur noch demografische Daten wie den Geburtstag- und ort heranziehen sowie öffentliche Register, in dem Spender von Genomdaten festgehalten sind.

Die Studie habe Sicherheitslücken in Forschungsprojekten offengelegt, räumt Eric Green, Direktor des National Human Genome Research Institute, ein. In Zukunft wolle man Altersangaben aus dem öffentlichen Teil von Genom-Datenbanken entfernen und nur über eine Zugangskontrolle nutzbar machen, hat Green gemeinsam mit Mitarbeitern der NIH in Science angekündigt.

Man könne sich nicht nur darauf verlassen, dass Spender von Genom-Daten den Nutzen entsprechender Forschungsprojekte über die Risiken stelle, sagt auch der Harvard-Genetiker George Church, Gründer des Personal Genome Project, das selbst eine offene Datenbank betreibt. Wichtig sei auch ein besserer rechtlicher Schutz. Denn jede Schutzmaßnahme würde am Ende nur mit einem Gegenmaßnahme gekontert. „Auf dieses Spiel sollten wir uns nicht einlassen“, so Church. Zu einem besseren „Sicherheitsprotokoll“ gehöre auch, Studienteilnehmer besser über die Sachlage aufzuklären.

Für Wylie Burke, Genetiker an der University of Washingtion in Seattle, bedeutet die Studie auch, die Öffentlichkeit stärker in die Kontrolle der Datenbanken einzubinden. Dazu gehöre, auf Verlangen jederzeit angeben zu können, welche Sicherheitsvorkehrungen bestünden, für welche Forschungszwecke die Daten erhoben würden, welche Ergebnisse es bereits gebe und auch, ob es schon zu Datenmissbrauch gekommen sei. „Ohne einen solchen Ansatz dürfte das Misstrauen gegen die Forschung zunehmen“, warnt Burke.

Die Studie:

Gymrek, Melissa et al.: "Identifying Personal Genomes by Surname Inference", Science 18.1.2013, (Abstract)

(nbo)