Sprachanalyse-Modell sagt kritische Virenmutationen voraus

Ein adaptiertes Maschinenlern-System schließt aus den Veränderungen darauf, ob sie die Keime infektiös halten und ihnen bei der Flucht vorm Immunsystem helfen.

In Pocket speichern vorlesen Druckansicht 11 Kommentare lesen

Coronavirus im Elektronenmikroskop – allerdings nicht SARS-CoV-2, sondern ein Erkältungsvirus.

(Bild: Photo by CDC on Unsplash)

Lesezeit: 3 Min.
Von
  • Veronika Szentpetery-Kessler

Viren wie die Grippe- und HIV-Erreger mutieren so oft, dass es schwer ist, Impfstoffe gegen sie zu entwickeln. Die genetischen Veränderungen erlauben den Keimen oft, sich durch veränderte Oberflächenproteine den Antikörpern der Immunabwehr zu entziehen, ohne dabei ihre Infektiosität einzubüßen. Forscher vom Massachusetts Institute of Technology (MIT) haben nun ein neues Verfahren entwickelt, um die wahrscheinlichsten Proteine auf einem Virus für solche Fluchtmanöver (viral escape) vorauszusagen.

Wie Bonnie Berger, Bryan Bryson und Erstautor Brian Hie Mitte Januar im Fachjournal Science schreiben, adaptierten sie ein ursprünglich für die Analyse von natürlicher Sprache (natural language processing, NLP) entwickeltes Maschinenlern-Modell. Solche Modelle prüfen Sprachmuster, zum Beispiel wie häufig bestimmte Worte zusammen benutzt werden. Anschließend schlagen sie mögliche Ergänzungen für Sätze wie "Sally hatte Rühreier zum…" vor, in diesem Fall etwa "Frühstück" oder "Mittagessen".

Die MIT-Forscher sahen eine Parallele zwischen der Sprachvorhersage, bei der sowohl die Grammatik als auch die Bedeutung (Semantik) des Satzes stimmen muss, und der biologischen Prognose von Mutationen, bei der die veränderten Gene funktionstüchtige Proteine ergeben (grammatische Korrektheit) und diese eine sinnvolle Fluchtmöglichkeit bieten müssen (Semantik).

Sprachanalysemodelle seien sehr gut darin, aus Wortsequenz-Variationen auf die Bedeutung zu schließen, sagte Erstautor Brian Hie den "MIT News". Deshalb seien sie auch gut dafür geeignet, aus Erbgutsequenzen auf die Funktionalität von Proteinen zu schließen. Denn die Basensequenz bestimmt die Reihenfolge der Aminosäuren und diese Bausteine wiederum bestimmen, wie sich das Protein faltet und ob es das Virus weiterhin für infektiös hält.

Die Forscher trainierten ihr Modell mit 60.000 HIV-, 45.000 Grippe- und 4000 Coronavirus-Erbgutsequenzen und ließen es nach Mustern suchen, die auf funktionsfähige Proteinänderungen schließen lassen. Das hat den Vorteil, dass man nur die Erbgutsequenzen braucht, die leichter zu bestimmen sind als die Proteinstruktur selbst.

Mehr Infos rund um das Coronavirus

Anschließend ließen die Wissenschaftler ihr Modell Vorhersagen für das Grippevirus, den HIV-Erreger sowie die neuen SARS-CoV-2-Varianten aus Großbritannien und Südafrika machen. Beim Grippe-Erreger ergab die Analyse, dass der Stengelteil der Hämagglutinin-Proteine am wenigsten so mutieren kann, dass es dem Virus Vorteile bringt. Es wäre also ein gutes Ziel für einen Universal-Grippeimpfstoff. Gegen dieses Protein bildet der Körper meist keine Antikörper. Beim neuen Coronavirus wiederum sei eine S2 genannte Untereinheit am Spike-Protein eine wenig variable Stelle. Die SARS-Cov-2-Impfstoffe setzen an diesem Eiweiß an und sollen auch gegen die neuen, ansteckenderen Varianten schützen.

Künftig wollen die Forscher nicht nur für Virenimpfstoffe geeignete Ziele suchen, sondern auch für Vakzine gegen Krebs. Zudem könnte es auch geeignet sein, Wirkstoffe gegen Krankheiten wie Tuberkulose zu designen. (vsz)