"Wozu ist das gut?" KI-System sagt Verwendbarkeit beliebiger Enzyme voraus

Ein KI-gestütztes "Enzyme-Substrate-Prediction"-Modell (ESP) gibt blitzschnell Auskunft darüber, ob ein Enzym sich eignet, um gewünschte Moleküle zu gewinnen.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
KI-gestütztes Modell zur Vorhersage von Enzymfunktionen

Das vom internationalen Forscherteam um Martin Lercher entwickelte KI-gestützte ESP-Modell sagt voraus, welche Substrate ein Enzym zu welchen Zielmolekülen verarbeitet.

(Bild: HHU Düsseldorf – Paul Schwaderer)

Lesezeit: 4 Min.

Ein internationales Team mit Bioinformatikern der Heinrich-Heine-Universität Düsseldorf (HHU) hat gewissermaßen eine Leib-und-Magen-Aufgabe für künstliche Intelligenz gefunden: Es geht darum, für beliebige noch gar nicht vorliegende Enzyme festzustellen, ob diese bestimmte Ausgangsstoffe verarbeiten und gewünschte Ergebnisse liefern können. Das neu entwickelte KI-gestützte ESP-Modell ("Enzyme Substrate Prediction") trifft diese Vorhersage mit annehmbarer Genauigkeit.

In Pflanzen- und Tierzellen, nicht zuletzt auch im menschlichen Körper, dienen Enzyme als Biokatalysatoren, also winzige Molekülfabriken. In gewaltiger Vielfalt liefern sie miteinander kombiniert aus Grundbausteinen ("Substraten") alle für den jeweiligen Organismus wichtigen Moleküle. Längst stellt etwa die pharmazeutische Industrie, aber auch manch andere Branche künstliche Enzyme her. Sie dienen dazu, Wirkstoffe zu gewinnen, Abfallmaterial zu verarbeiten oder Reinigungsverfahren in Gang zu setzen.

Wer zum Anstoßen gewünschter Reaktionen geeignete Enzyme sucht, steht vor einem gewaltigen Problem: In der DNA von Organismen lassen sich zwar Gene, die Enzyme kodieren, ziemlich leicht als solche erkennen. Was aber ein solchermaßen erzeugtes Enzym genau tut, ist in mehr als 99 Prozent aller Fälle unbekannt. Durch die Versuch-und-Irrtum-Methode experimentell herauszufinden, welche Ausgangsmoleküle ein bestimmtes Enzym konkret in was umwandelt, bedeutet enormen Aufwand.

Anhand eines Computermodells ohne Experimentieraufwand mit hoher Wahrscheinlichkeit vorauszusagen, wozu ein Enzym dienen kann, stellt einen enormen Fortschritt dar. Künstliche Intelligenz ist zur Lösung einer solchen Aufgabe anders als fest programmierte algorithmische Analysesysteme wie geschaffen: Ein KI-gestütztes System lernt die Zusammenhänge von Struktur und Funktion von Enzymen und kann das Gelernte dann auch auf solche Enzyme anwenden, die im Training nicht vorkamen. Auf diese Weise ist es dem Team um Prof. Dr. Martin Lercher von der Arbeitsgruppe Computergestützte Zellbiologie an der HHU gelungen, eine universell verwendbare Methode zur Enzymbeurteilung zu finden. An der Entwicklung waren Kollegen aus Schweden und Indien beteiligt. Die Ergebnisse haben die Forscher nun in der Fachzeitschrift "Nature Communications" vorgestellt.

Lercher betont die Bedeutung des jetzt gefundenen allgemeinen Modells: Es ist "nicht auf einzelne, spezielle Enzyme und ihre nahen Verwandten beschränkt [...], wie dies in bisherigen Ansätzen der Fall war. Unser allgemeines Modell kann mit jeder Kombination aus einem beliebigen Enzym und über 1.000 verschiedenen Substraten arbeiten."

Das ESP beruht auf einem Deep-Learning-Modell, entwickelt von Alexander Kroll, dem Erstautor der Studie. In diesem Modell sind die Daten von Enzymen und Substraten in numerischen Vektoren kodiert. Die Vektoren von rund 18.000 experimentell bekannten Enzym-Substrat-Kombinationen dienten als Trainingsmaterial fürs Deep Learning. Kroll zufolge hat das Team das solchermaßen trainierte Modell dann auf einen unabhängigen Testdatensatz angewandt, für den die korrekten Ergebnisse bereits bekannt waren. Die Trefferquote des ESP habe für diese Ergebnisse bei 91 Prozent gelegen.

An einem so treffsicheren System zur Beurteilung geeigneter Enzyme ist unter anderem die Arzneimittelforschung interessiert. Aber auch in der Biotechnologie kann es viel Experimentierarbeit sparen. Lercher umreißt die Bedeutung: "So können Forschung und Industrie aus einer großen Menge an möglichen Kombinationen diejenigen eingrenzen, die am vielversprechendsten sind, um damit neue Medikamente, Chemikalien oder auch Biokraftstoffe enzymatisch herzustellen." Kroll zufolge macht die Vorhersagetechnik zudem bessere Modelle möglich, um den Stoffwechsel in Zellen zu simulieren. Darüber lasse sich die Physiologie verschiedener Organismen – von Bakterien bis zum Menschen – verstehen.

(psz)