Genregulation verstehen: Google Deepmind eröffnet laut Studie neue Möglichkeiten
Das KI-Modell AlphaGenome soll das Verständnis verbessern, wie Gene Prozesse im Körper steuern. Es liefert ein größeres und höher aufgelöstes Bild als bisher.
(Bild: Shutterstock)
Es ist fast anderthalb Jahre her, dass der Nobelpreis für Chemie für die Entwicklung des KI-Modells „AlphaFold“ von Google Deepmind vergeben wurde. Das Modell gilt als Durchbruch bei der Vorhersage komplexer Proteinstrukturen. Jetzt legt das Unternehmen eine Studie in Nature zum Modell „AlphaGenome“ vor. Das Modell, soll helfen, die Funktionen unserer Gene besser zu verstehen. Präsentiert wurde es schon im Juni 2025.
Zwar gilt das menschliche Genom seit 2022 als komplett entschlüsselt, doch welche Prozesse etwa für bestimmte Krankheiten oder Reaktionen auf Umweltfaktoren verantwortlich sind, ist oft unklar.
Ein besonders großes Rätsel ist, welche Funktion DNA-Abschnitte haben könnten, die nicht für Proteine codieren, die also nicht direkt auf die Biochemie des Körpers wirken. Diese lange auch als „Junk-DNA“, als „Müll-DNA“ bezeichneten DNA-Abschnitte machen mehr als 98 Prozent des menschlichen Erbguts aus.
Videos by heise
Es sei entscheidend zu wissen, wie die Anweisungen des Genoms auf molekularer Ebene gelesen werden und was passiere, wenn eine kleine DNA-Variation auftrete, schreibt das Forschungsteam. „Das ist noch immer eines der größten Rätsel der Biologie.“
Bis zu einer Million Basenpaare
Mit einer Auflösung bis zu einzelnen Basenpaaren kann das neue Modell laut Studie für eine Sequenz von bis zu einer Million Basenpaaren Tausende molekulare Eigenschaften vorhersagen. Unter anderem, wo bestimmte Gene – also DNA-Abschnitte – in verschiedenen Zell- und Gewebetypen beginnen und enden, die Menge der produzierten RNA und auch, welche DNA-Basen zugänglich sind, nahe beieinander liegen oder an bestimmte Proteine gebunden sind.
Trainiert wurde AlphaGenome mit Daten aus öffentlich zugänglichen Plattformen wie ENCODE, GTEx, 4D Nucleome und FANTOM5, die wichtige Aspekte der Genregulation mit Hunderten menschlicher und Maus-Zelltypen und Geweben experimentell ermittelt haben.
Das Modell arbeitet laut Unternehmen mit sogenannten Faltungsschichten neuronaler Netzwerke, um Muster in der Genomsequenz zu erkennen. Transformatoren wiederum helfen, Informationen über alle Positionen in der Sequenz hinweg zu kommunizieren. Weitere Schichten im Modell sorgen dafür, die erkannten Muster in Vorhersagen für verschiedene Aspekte der Genreuglierung umzuwandeln.
Größeres Bild mit höherer Auflösung
Grob gesagt, liefert das neue Modell ein größeres Bild mit einer höheren Auflösung. Bisherige, nur auf einzelne Genaspekte fokussierte Methoden erforderten „einen Kompromiss zwischen der Länge der Eingabesequenz und der Vorhersageauflösung, wodurch ihr Anwendungsbereich und ihre Leistungsfähigkeit eingeschränkt werden“, schreiben die Autoren.
Das neue Modell „erreicht oder übertrifft in 25 von 26 Bewertungen der Vorhersage von Varianteneffekten die leistungsstärksten verfügbaren externen Modelle.“ Über eine Programmierschnittstelle (API) können auch andere Forschende auf das Modell zugreifen.
Verbesserung, aber kein Durchbruch
Unabhängige Forschende äußern sich dem Science Media Center gegenüber überwiegend positiv. Kritik gibt es unter anderem an der hohen Komplexität und Parameterzahl des Modells, die viel Rechnerleistung erfordert. In Einzelaspekten sei das Modell zudem nicht besser als schon vorhandene Werkzeuge, heißt es. Und obgleich eine Sequenz von bis zu einer Million Basenpaaren viel ist: Der Weg zum kompletten Genom mit über drei Milliarden Basenpaaren ist noch weit.
Jan Korbel vom European Molecular Biology Laboratory (EMBL), Heidelberg, zieht folgendes Fazit: „Insgesamt stellt AlphaGenome einen wichtigen Fortschritt innerhalb der Genomik dar, ohne einen paradigmatischen Umbruch zu markieren. Es verdeutlicht die zunehmende Rolle datengetriebener KI-Modelle in der Biologie und zeigt zugleich, wie komplex die Regeln der Genregulation noch sind.“
Dieser Beitrag ist zuerst auf t3n.de erschienen.
(jle)