zurück zum Artikel

Proteine statt Picasso: Von DALL-E inspirierte KI soll neue Medikamente erfinden

Will Douglas Heaven

Proteinkomplexe.

(Bild: GENERATE BIOMEDICINES)

Zwei Forschergruppen planen leistungsstarke generative KI-Modelle, die neue Proteine entwerfen können, die in der Natur nicht vorkommen – etwa für die Medizin.

Text-zu-Bild-KI-Modelle wie DALL-E 2 von OpenAI [1] werden immer besser. Sie sind darauf trainiert, Bilder von fast allem zu generieren, was man sich vorstellen kann. Das hat in der Kreativbranche – von der Mode bis zum Film – für Furore gesorgt, da die Technik auf Anfrage Bilder liefert, die so seltsam wie wunderbar sein können.

Die gleiche Technologie, die hinter diesen Algorithmen steht, scheint auch für Biotech-Labors interessant zu sein. Sie haben damit begonnen, die neue Art von generativer KI, die als sogenanntes Diffusionsmodell bekannt ist, zu verwenden, um ganz andere Dinge zu tun: neue, in der Natur nicht vorkommende Proteinarten, die für Medikamente verwendet werden können, zu entwickeln.

Anfang Dezember zeigten zwei Labors unabhängig voneinander, wie das praktisch aussehen kann: Generate Biomedicines, ein in Boston ansässiges Start-up, stellte ein Programm namens Chroma [2] vor, das das Unternehmen als das "DALL-E 2 der Biologie" bezeichnet. Parallel dazu hat ein Team an der University of Washington unter der Leitung des Biologen David Baker ein ähnliches Programm namens RoseTTAFold Diffusion [3] entwickelt. In ihrem Preprint zeigen Baker und seine Kollegen, dass ihr Modell präzise Entwürfe für neuartige Proteine generieren kann, die sich dann im Labor zum Leben erwecken lassen. "Wir generieren Proteine, die keinerlei Ähnlichkeit mit vorhandenen Proteinen haben", sagt Brian Trippe, einer der Mitentwickler von RoseTTAFold.

Mehr zu Medizin

Diese Protein-Generatoren können so gesteuert werden, dass sie Designs für Proteine mit bestimmten Eigenschaften – wie Form, Größe oder Funktion – erzeugen. Auf diese Weise ist es möglich, neue Proteine zu entwickeln, die bei Bedarf bestimmte Aufgaben erfüllen. Die Forscher hoffen, dass dies schließlich zur Entwicklung neuer und – deutlich – wirksamerer Medikamente führen wird. "Wir könnten in Minuten entdecken, wofür die Evolution Millionen von Jahren gebraucht hat", sagt Gevorg Grigoryan, CTO von Generate Biomedicines. "Das Bemerkenswerte an dieser Arbeit ist die Generierung von Proteinen nach vorab gewünschten Bedingungen", sagt Ava Amini, Biophysikerin bei Microsoft Research in Cambridge, Massachusetts, die die Arbeiten kennt.

Proteine sind die grundlegenden Bausteine der meisten Lebewesen. Bei Tieren helfen sie bei der Verdauung von Nahrung, kontrahieren Muskelen, detektieren Licht, steuern das Immunsystem und vieles mehr. Wenn Menschen krank werden, spielen Proteine eine zentrale Rolle. Sie sind daher bevorzugtes Ziel von Medikamenten. Und viele der neuesten Therapien basieren selbst auf Proteinen. "Die Natur verwendet Proteine für fast alles", sagt Grigoryan. "Die Möglichkeiten, die sich daraus für therapeutische Eingriffe ergeben, sind wirklich immens."

Allerdings müssen die Entwickler von Medikamenten derzeit auf eine Liste von Inhaltsstoffen zurückgreifen, die aus natürlichen Proteinen bestehen. Das Ziel der Proteingenerierung ist es, diese Liste um einen nahezu unendlichen Pool von am Computer entworfenen Eiweissen zu erweitern. Solche Techniken sind nicht neu. Bisherige Ansätze waren jedoch langsam und nicht besonders gut geeignet, um große Proteine oder sogenannte Proteinkomplexe zu entwerfen – molekulare Maschinen, die aus mehreren miteinander verbundenen Proteinen bestehen. Genau diese Proteine sind oft entscheidend für die Behandlung von Krankheiten.

Die nun angekündigten KI-Systeme sind nicht die erste Nutzung von Diffusionsmodellen für die Proteinentwicklung. Eine Handvoll Studien, die Amini und andere in den letzten Monaten durchgeführt haben, hatten gezeigt, dass das Verfahren vielversprechend ist. Dennoch liegen bisher ausschließlich Proof-of-Concept-Prototypen vor. Chroma und RoseTTAFold Diffusion bauen auf diesen Arbeiten auf und sind die ersten "echten" Programme, die präzise Designs für eine Vielzahl von Proteinen erstellen können.

Namrata Anand, die im Mai 2022 eines der ersten Diffusionsmodelle für die Proteingenerierung mitentwickelt hat, glaubt, dass die große Bedeutung von Chroma und RoseTTAFold Diffusion darin besteht, dass die Systeme deutlich umfangreicher sind und mit mehr Daten und mehr Computerleistung trainiert werden. "Man könnte sagen, dass es sich hier um eine Art DALL-E handelt, weil sich die Dinge so vergrößert haben", sagt sie.

Diffusionsmodelle sind neuronale Netzwerke, die darauf trainiert sind, "Rauschen" – zufällige Störungen, die den Daten hinzugefügt werden – aus ihren Eingaben zu entfernen. Bei einem zufälligen Durcheinander von Pixeln versucht ein Diffusionsmodell, daraus ein erkennbares Bild zu machen. In Chroma wird das Rauschen hinzugefügt, indem die Aminosäureketten, aus denen ein Protein besteht, aufgedröselt werden. Bei einer zufälligen Anhäufung dieser Ketten versucht Chroma, sie zu einem Protein zusammenzusetzen. Angeleitet von bestimmten Vorgaben, wie das Ergebnis aussehen soll, kann Chroma neuartige Proteine mit spezifischen Eigenschaften erzeugen.

Bakers Team hingegen verfolgt einen anderen Ansatz, obwohl die Endergebnisse ähnlich sind. Sein Diffusionsmodell beginnt mit einer noch stärker "verworrenen" Struktur. Ein weiterer wesentlicher Unterschied besteht darin, dass RoseTTAFold Diffusion Infos darüber verwendet, wie die Teile eines Proteins zusammenpassen, die von einem separaten neuronalen Netzwerk bereitgestellt werden, das für die Vorhersage der Proteinstruktur trainiert wurde (wie dies auch bei AlphaFold von DeepMind [19] der Fall ist). Dies leitet den gesamten Generierungsprozess an.

Sowohl Generate Biomedicines als auch das Team von Baker konnten bereits eine beeindruckende Reihe von Ergebnissen präsentieren. Sie sind nach eigener Angabe in der Lage, Proteine mit verschiedenen Symmetriegraden zu generieren – einschließlich Proteinen, die kreisförmig, dreieckig oder sechseckig sind. Um die Vielseitigkeit ihres Programms zu veranschaulichen, hat Generate Biomedicines Proteine in Form der 26 Buchstaben des lateinischen Alphabets und der Zahlen 0 bis 10 erzeugt. Beide Teams können auch nur Teile von Proteinen generieren, indem sie neue Teile an bestehende Strukturen anpassen.

Die meisten dieser Demonstrationsstrukturen würden in der Praxis zwar keinen Zweck erfüllen. Da aber die Funktion eines Proteins durch seine Form bestimmt wird, ist die Möglichkeit, bei Bedarf gewünschte Strukturen unterschiedlicher Art zu erzeugen, von entscheidender Bedeutung. Es ist eine Sache, lustige Bilder am Computer zu erzeugen. Das Ziel der Proteinprojekte ist es, diese Entwürfe in echte Proteine zu verwandeln. Um zu testen, ob Chroma Designs erzeugen kann, die auch praktisch hergestellt werden können, nahm Generate Biomedicines die Sequenzen für einige seiner Designs – die Aminosäurenketten, aus denen das Protein besteht – und ließ sie durch ein anderes KI-Programm laufen. Sie fanden heraus, dass 55 Prozent der generierten Proteine sich in die von Chroma erzeugte Struktur falten würden, was darauf schließen lässt, dass es sich um Entwürfe für lebensfähige Eiweisse handelt.

Bakers Team führte einen ähnlichen Test durch. Aber Baker und seine Kollegen sind bei der Bewertung ihres Modells sogar noch viel weiter gegangen als Generate Biomedicines. Sie haben einige der Designs von RoseTTAFold Diffusion direkt in ihrem Labor hergestellt. (Generate Biomedicines sagt, dass es ebenfalls Labortests durchführt, aber noch nicht bereit ist, die Ergebnisse zu veröffentlichen.) "Dies ist mehr als nur ein Konzeptnachweis", sagt Trippe. "Wir nutzen unser System, um wirklich große Proteine herzustellen."

Für Baker ist das wichtigste Ergebnis die Herstellung eines neuen Proteins, das sich an das Parathormon bindet, das den Kalziumspiegel im Blut kontrolliert. "Wir haben dem Modell im Grunde genommen nur das Hormon vorgegeben und ihm gesagt, es solle ein Protein herstellen, das daran bindet", sagt er. Als sie das neue Protein im Labor testeten, stellten sie fest, dass es fester an das Hormon bindet als alles, was mit anderen Berechnungsmethoden hätte erzeugt werden können – natürlich auch fester als bestehende Medikamente. "Dieses Proteindesign kam aus dem Nichts", sagt Baker.

Grigoryan räumt ein, dass die Erfindung neuer Proteine nur der erste Schritt von vielen ist. "Wir sind ein Arzneimittelhersteller", sagt er. "Am Ende des Tages kommt es darauf an, ob wir Medikamente herstellen können, die wirken oder nicht." Denn Medikamente auf Proteinbasis müssen in großen Mengen hergestellt, dann im Labor und schließlich am Menschen getestet werden. Das kann Jahre dauern. Aber er glaubt, dass sein Unternehmen und die Konkurrenten Wege finden werden, auch diese Schritte zu beschleunigen. "Das Tempo des wissenschaftlichen Fortschritts verläuft in Schüben", sagt Baker. "Aber im Moment befinden wir uns in einem Prozess, den man nur als technologische Revolution bezeichnen kann."

[20]

(jle [21])


URL dieses Artikels:
https://www.heise.de/-7366851

Links in diesem Artikel:
[1] https://www.heise.de/meinung/Wie-KI-Bildgeneratoren-mehr-Diversitaet-foerdern-koennen-7287322.html
[2] https://generatebiomedicines.com/chroma
[3] https://www.bakerlab.org/2022/11/30/diffusion-model-for-protein-design/
[4] https://www.heise.de/news/Opioid-Krise-in-den-USA-Impfungen-soll-Todesfaelle-durch-Fentanyl-verhindern-9303690.html
[5] https://www.heise.de/hintergrund/Wie-laesst-sich-Zahnschmelz-regenerieren-9298295.html
[6] https://www.heise.de/hintergrund/Wie-eine-Biotech-Firma-Dopamin-Zellen-ins-Gehirn-einschleusen-will-9292785.html
[7] https://www.heise.de/hintergrund/Embryonale-Stammzellen-Wie-ist-der-Stand-nach-25-Jahren-Hype-9239608.html
[8] https://www.heise.de/hintergrund/Gehirnerkrankungen-verstehen-Wie-Ratten-mit-menschlichen-Gehirnzellen-helfen-7307567.html
[9] https://www.heise.de/hintergrund/Musik-setzt-Insulin-frei-9292080.html
[10] https://www.heise.de/hintergrund/Neue-Gentherapie-auf-Antikoerperbasis-wird-am-Menschen-getestet-7250837.html
[11] https://www.heise.de/hintergrund/Neues-Mittel-koennte-Zaehne-neu-wachsen-lassen-9221029.html
[12] https://www.heise.de/hintergrund/Genetisch-veraenderte-Schweineherzen-in-hirntote-Menschen-implantiert-7181456.html
[13] https://www.heise.de/hintergrund/Kuenstliche-Maeuse-Embryonen-mit-schlagenden-Herzen-erzeugt-7244501.html
[14] https://www.heise.de/hintergrund/Scheisse-macht-jung-Mit-Transplantationen-des-Darminhalts-rueckt-die-Jugend-naeher-7098528.html
[15] https://www.heise.de/hintergrund/Unser-Mikrobiom-altert-mit-uns-und-das-ist-ein-Problem-7366807.html
[16] https://www.heise.de/hintergrund/Elektronische-Nase-Implantat-soll-Geruchssinn-zurueckbringen-7323329.html
[17] https://www.heise.de/hintergrund/Wohlfuehl-Kontrolle-Wie-Apps-die-Stimmungslage-von-Schuelern-kontrollieren-9237010.html
[18] https://www.heise.de/hintergrund/Wearables-statt-Schlaflabor-Die-Technik-fuer-einen-gesunden-Schlaf-7489262.html
[19] https://www.heise.de/hintergrund/Proteinfaltung-AlphaFold-laesst-Biologie-und-KI-verschmelzen-7097683.html
[20] https://www.instagram.com/technologyreview_de/
[21] mailto:jle@heise.de