Gen-Puzzle der Menschheit: Genom-Karte will alle genetischen Variationen zeigen

Eine neue Karte des menschlichen Genoms wird als Pangenom bezeichnet und könnte jene DNA-Abschnitte erklären, die jeden von uns einzigartig machen.

In Pocket speichern vorlesen Druckansicht 13 Kommentare lesen

(Bild: gopixa/Shutterstock.com)

Lesezeit: 8 Min.
Von
  • Antonio Regalado
Inhaltsverzeichnis

Kennen Sie den schon? "Es wurde schon oft abgeschlossen, aber nie wirklich abschließend." So geht ein in Fachkreisen häufig zitierter Witz über das Humangenomprojekt. Das erste Mal verkündete US-Präsident Bill Clinton in 2000 bei einer Zeremonie im Weißen Haus die "erste Vermessung des gesamten menschlichen Genoms" und bezeichnete sie als "die wichtigste und wundersamste Karte, die je von der Menschheit erstellt wurde".

Aber die Arbeit war noch nicht ganz getan. Ein Jahr später wurde der Triumph erneut verkündet, diesmal mit der offiziellen Veröffentlichung eines "Entwurfs" des "genetischen Bauplans für einen Menschen". 2003 nahmen Forscher einen weiteren Anlauf und verkündeten den "erfolgreichen Abschluss" des Projekts, wobei sie sich auf ein höheres Maß an Genauigkeit beriefen. Neunzehn Jahre später verkündeten sie 2022 erneut den Sieg, dieses Mal für eine wirklich vollständige Sequenz eines Genoms, von Anfang bis Ende, ohne jegliche Lücken. Großes Ehrenwort.

Kürzlich haben Wissenschaftler um den Computerbiologen Benedict Paten von der University of California in Santa Cruz (UCSC) im Fachjournal Nature eine weitere Version des menschlichen Genoms vorgestellt, in der sie die vollständige DNA von 47 verschiedenen Individuen – darunter Afrikanern, amerikanischen Ureinwohnern und Asiaten – zu einem riesigen genetischen Atlas zusammenfassen, der die überraschende genetische Vielfalt unserer Spezies besser widerspiegeln soll. Deshalb wird die neue DNA-Karte auch Pangenom genannt (die Vorsilbe "pan" bedeutet soviel wie "ganz" oder "mit allen Beteiligten").

Es hat zehn Jahren gedauert, sie zu erstellen. Passend zum Witz ist auch sie noch nicht fertig. Sie soll den beteiligten Forschern zufolge weiter wachsen, indem die DNA von weiteren 300 Menschen aus der ganzen Welt hinzufügt wird, damit ein noch umfassenderes Bild des Genoms entsteht. "Wir verstehen jetzt, dass eine Karte eines einzelnen menschlichen Genoms nicht die gesamte Menschheit angemessen repräsentieren kann", sagt Karen Miga, eine UCSC-Kollegin von Paten.

Grundsätzlich ähneln sich Genome verschiedener Menschen weitgehend. Es gibt allerdings Hunderttausende von kleinen Unterschieden, manchmal tatsächlich nur ein einzelner DNA-Buchstabe (eine Base), die uns alle einzigartig machen. Das neue Pangenom soll diese Vielfalt detaillierter als je zuvor beobachten und sogenannte evolutionäre Hotspots sowie Tausende von überraschend großen Unterschieden aufzeigen helfen: zum Beispiel gelöschte, in ihrer Basenfolge umgekehrte und gedoppelte Gene, die in herkömmlichen Studien nicht zu beobachten sind.

Das Pangenom beruht auf einem mathematischen Konzept, einem Graphen, den man sich wie eine riesige Version des Spiels "Verbinde die Punkte" vorstellen kann. Jeder Punkt ist ein Abschnitt der DNA. Um das Genom einer bestimmten Person zu zeichnen, beginnt man, die nummerierten Punkte zu verbinden. Dabei kann die DNA jeder Person einen etwas anderen Weg nehmen, indem sie einige Nummern überspringt und andere hinzufügt.

Die praktischen Anwendungen des neuen Pangenoms sind nicht leicht zu benennen. Ein Vorteil könnte darin bestehen, dass sich seltene Krankheiten besser diagnostizieren lassen. Zudem hoffen die Wissenschaftler, dass es ihnen vor allem Einblicke in die "dunkle Materie" des Genoms verschaffen kann, die bisher nur schwer zu finden war. Dazu gehören zum Beispiel seltsame Chromosomenregionen, die DNA-Abschnitte miteinander teilen und austauschen.

Vorerst werden sich die meisten Biologen und Ärzte an das bestehende Referenzgenom halten, das 2001 erstmals in Entwurfsform erstellt und nach und nach verbessert wurde. Es beantwortet die meisten Fragen, an denen Forscher interessiert sind, und alle ihre Computerwerkzeuge funktionieren damit.

Ein Referenzgenom ist deshalb immer noch wichtig, weil bei der Sequenzierung des Genoms einer neuen Person diese Sequenz auf das Referenzgenom projiziert wird, um die neuen Daten zu organisieren und zu entziffern. Da das aktuelle Referenzgenom jedoch nur ein mögliches Genom ist, in dem Teile fehlen, die andere Menschen besitzen, können einige Informationen nicht analysiert werden und werden normalerweise ignoriert. Forscher nennen diesen Effekt "Referenzverzerrung" oder einfacher ausgedrückt das Straßenlaternen-Problem. Wo man nicht hinschaut, sieht man auch nichts.

"Es ist schwer, die Bedeutung der aktuellen Referenz zu schätzen zu wissen. Wir verwenden sie wie ein Koordinatensystem oder eine Landkarte, und wir beziehen uns ständig darauf, wenn wir über Gene sprechen", sagt Paten. "Aber sie ist sowohl unvollständig als auch nicht vielfältig genug. Es fehlen die Dinge, die uns anders machen – mit anderen Worten, die interessanten Teile."

Beamte der Gesundheitsbehörde NIH (National Institutes of Health) hoffen, dass die neue Aktualisierung der Genomkarte die Genforschung "gerechter" machen wird. Denn je mehr sich unser Genom von der aktuellen Referenz unterscheidet, desto mehr Informationen über uns könnten verloren gehen. Die bestehende Referenzkarte besteht größtenteils aus der DNA eines afroamerikanischen Mannes, obwohl sie auch Segmente von mehreren anderen Menschen enthält.

"Wenn das Genom, das Sie analysieren wollen, Sequenzen enthält, die nicht in der Referenz enthalten sind, werden sie bei der Analyse übersehen", sagt Deanna Church, Beraterin beim Gründerzentrum General Inception, die früher bei den NIH eine Schlüsselrolle bei der Verwaltung des Referenzgenoms innehatte. "In Wirklichkeit ist die Vorstellung, dass es ein 'menschliches Genom' gibt, das eigentliche Problem", sagt sie. "Die aktuelle Version ist das einfachste Modell, das man machen kann. Als wir anfingen, war es sinnvoll. Aber jetzt brauchen wir bessere Modelle."

Das Pangenom, das sich noch im Entwurfsstadium befindet, wurde mit Hilfe zweier neuer Technologien erstellt. Zum einen half eine Sequenziermaschine, die sehr lange DNA-Abschnitte in einem Durchgang auslesen kann. Bei den meisten Sequenzierungsverfahren wird die DNA in winzige Stücke von weniger als 200 Buchstaben zerhackt. Die neuen Geräte des Unternehmens Pacific Biosciences hingegen können 10.000 Buchstaben auf einmal auslesen. Solche "Long Reads", wie sie von den Forschern genannt werden, sind wie extragroße Puzzleteile, die sich viel leichter in der richtigen Reihenfolge im Genom einer Person anordnen lassen.

Dieser Prozess des Zusammenpuzzelns, die sogenannte Genomassemblierung, ist der andere Bereich, in dem die Forscher nach eigenen Angaben mit neuen Berechnungswerkzeugen Fortschritte erzielt haben. Dennoch bleibt das Organisieren und Vergleichen von 47 Genomen auf einmal (jedes mit etwa sechs Milliarden DNA-Buchstabenpaaren) ein kniffliges Problem.

"Es gibt eine riesige Menge an wirklich interessanter Computerwissenschaft, die in nicht so glamourösen Zeitschriften veröffentlicht wurde", sagt Paten, der mehr als zehn Jahre am Pangenom mitgearbeitet hat.

Paten räumt auch ein, dass außer Fachleuten niemand ihre Datenvisualisierungstools ansehen will, die die alternativen Anordnungen der DNA als komplizierte Schleifen und Knoten, die sogenannten "Spaghetti-Diagramme", darstellen. Ein wirklicher Erfolg wird sich erst einstellen, wenn das Pangenom in den Hintergrund tritt und zum neuen Sanitärsystem des genetischen Zeitalters wird, das Forscher nutzen können, ohne es jemals zu sehen.

Nach Ansicht von Experten ist es noch zu früh, um abzusehen, ob das klappt. "Ich hoffe es, aber es wird ein harter Weg sein", sagt Church. "So viele unserer Werkzeuge und Infrastrukturen basieren auf einer linearen Darstellung, dass es schwer sein wird, die Menschen zu einem Umdenken zu bewegen."

Eines ist sicher, sagt Erik Garrison, ein Computerbiologe an der Universität von Tennessee und ebenfalls einer der Leiter des Projekts. Das menschliche Genom ist nicht fertig und wird es auch nie sein.

"Sobald man anfängt, von einem Pangenom zu sprechen, wird es immer unvollständig sein, und es wird nie enden. Jedes Individuum wird ein anderes Genom haben, es ist also ein unendlicher Prozess", sagt Garrison. "Jede Population und jede Generation könnte ihr eigenes Pangenom haben.

(jle)