Genome googeln

Ein neues Werkzeug von zwei Alphabet-Töchtern soll dabei helfen, Ergebnisse von schnellen DNA-Sequenzierungsmaschinen zuverlässig zu interpretieren. Es könnte eine bedeutende Lücke in der Medizin schließen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 3 Min.
Von
  • Will Knight
Inhaltsverzeichnis

Google hat ein neues Werkzeug namens DeepVariant veröffentlicht. Mit den neuesten Techniken aus dem Bereich künstlicher Intelligenz (KI) soll es dabei helfen, auf der Grundlage von groben Sequenzierungsdaten ein genaueres Bild des Genoms von Menschen zu erstellen. Die Software identifiziert anhand der Ergebnisse von schnellen Sequenziermaschinen automatisch kleine Insertions- und Deletionsmutationen sowie Mutationen in einzelnen Basen-Paaren.

Sequenzierung mit hohem Durchsatz hat ab dem Jahr 2000 an Verbreitung gewonnen und die Analyse von Genomen leichter zugänglich gemacht. Allerdings liefern diese Systeme nur begrenzte, fehlerträchtige Schnappschüsse vom Genom. Dadurch fällt es Wissenschaftlern oft schwer, kleine Mutationen von zufälligen Fehlern zu unterscheiden, die beim Sequenzierungsprozess entstehen, vor allem in wiederholten Teilen des Genoms. Diese Mutationen können direkt mit Krankheiten wie Krebs zusammenhängen.

Mehr Infos

Für die Interpretation der Ergebnisse gibt es bereits eine Reihe von anderen Werkzeugen, darunter GATK, VarDict und FreeBayes. Allerdings arbeiten die meisten davon mit relativ einfachen Statistik- und Maschinenlern-Verfahren, um echte Mutationen von Lesefehlern zu unterscheiden.

"Eine der Herausforderungen liegt in schwierigen Teilen des Genoms. Hier hat jedes der Werkzeuge seine eigenen Stärken und Schwächen", sagt Brad Chapman, Forscher an der School of Public Health der Harvard University, der eine frühe Version von DeepVariant getestet hat. "Diese schwierigen Bereiche werden für die klinische Sequenzierung immer wichtiger, und es ist wichtig, unterschiedliche Methoden zu haben."

DeepVariant wurde von Forschern im Team Google Brain entwickelt, das sich mit Entwicklung und Anwendung von KI beschäftigt. Ebenfalls beteiligt waren Forscher von Verily, einer weiteren Alphabet-Tochter, die sich auf Life Sciences konzentriert.

Die Forscher arbeiteten mit Millionen von Hochdurchsatz-Sequenzierungsergebnissen und vollständig sequenzierten Genomen aus dem Projekt Genome in a Bottle (GIAB), einer öffentlich-privaten Initiative zur Förderung des Einsatzes von Werkzeugen und Techniken zur Genom-Sequenzierung. Diese Daten speisten sie dann in ein Deep-Learning-System ein und veränderten die Parameter des Modells immer weiter, bis es gelernt hatte, sequenzierte Daten mit hohem Genauigkeitsgrad zu interpretieren.

Im vergangenen Jahr gewann DeepVariant den ersten Platz bei der Precision DNA Truth Challenge, einem Wettbewerb der US-Gesundheitsbehörde FDA. "Wichtig an dem Erfolg von DeepVariant ist, dass es zeigt, dass sich Deep-Learning in der Genomik nutzen lässt, um automatische Systeme zu trainieren, die bessere Daten liefern als komplizierte mit der Hand geschriebene Systeme", sagt Brendan Frey, CEO von Deep Genomics.

Deep Genomics ist eines von mehreren Unternehmen, die KI-Ansätze wie Deep-Learning nutzen wollen, um die genetischen Ursachen von Krankheiten und mögliche Medikamente dagegen zu identifizieren. Laut Frey wird KI irgendwann noch viel mehr leisten, als bei der Sequenzierung von Genom-Daten zu helfen. "Derzeit gibt es eine Lücke in der Medizin: unsere Unfähigkeit, genetische Variationen exakt auf Krankheitsmechanismen abzubilden und dieses Wissen zu nutzen, um schnell lebensrettende Therapien zu identifizieren", sagt er.

Die Veröffentlichung von DeepVariant ist das jüngste Anzeichen dafür, dass Maschinenlernen den Fortschritt in der Genomik beschleunigen könnte; es soll auch auf der Google Cloud Platform zugänglich gemacht werden. Auch Konkurrenten von Google nehmen immer mehr Maschinenlern-Funktionen in ihre Cloud-Plattformen auf, um Nutzer anzulocken, die von den neuesten KI-Techniken Gebrauch machen wollen.

(sma)