c't 12/2024
S. 38
Aktuell
Genschere

Scharfschütze

Bio-IT: Open-Source-Genschere mit KI

Bisherige Erbguteditoren sind buggy und verhaspeln sich schon mal. Weil Schreibfehler im Genom dramatische Folgen haben können, spannen Wissenschaftler nun die KI ein, um sie zu entwanzen.

Von Dušan Živadinović

Unter den Methoden zum Editieren des Erbguts haben die in Mikroben entdeckten CRISPR-Cas-Systeme die größte Bekanntheit erlangt, weil sie als Genscheren Detailarbeiten am Genom ermöglichen. Doch ihre Genauigkeit hängt von der Zielsequenz und den erwünschten Änderungen ab, sodass man für manche Anwendungen kaum geeignete CRISPR-Cas-Varianten findet.

Die Genschere CRISPR-Cas kommt in Mikroben in diversen Varianten vor. Firmen wie Innovative Genomics zeigen auf Smartphones, wie sich Wissenschaftler dieses dreidimensionale Molekül vorstellen., Bild: Innovative Genomics
Die Genschere CRISPR-Cas kommt in Mikroben in diversen Varianten vor. Firmen wie Innovative Genomics zeigen auf Smartphones, wie sich Wissenschaftler dieses dreidimensionale Molekül vorstellen.
Bild: Innovative Genomics

Weil sich viele Erbkrankheiten nur über Korrekturen der Gene grundlegend behandeln lassen, will man CRISPR-Cas trotz der Schwächen auch im medizinischen Bereich anwenden. Entsprechend sind die Zulassungshürden sehr hoch. Bisher muss man für jeden Ansatz belegen, dass der Editor nur die erwünschte Stelle im Genom bearbeitet. Deshalb ist die Zahl der Anwendungen noch gering (ct.de/y2nj).

Manche Forschungsteams erhoffen sich genauere Editoren von neuen Mikroben und suchen etwa in heißen Quellen oder Mooren, doch bisher ohne Erfolg. Andere Teams setzen auf die generative KI, die neue CRISPR-Cas-Sequenzen im Schnelldurchlauf erfindet.

Dafür entwickeln sie Protein-Language-Modelle und trainieren sie mit vielen bekannten Proteinsequenzen. So lernen sie etwa, welche Bausteine in der Sequenz (Aminosäuren) oft aufeinander folgen oder wie Gruppen von Aminosäuren Module bilden, um etwa molekulare Strukturen wie Taschen zu formen. Dann kombiniert die KI die Bauelemente immer wieder neu und erzeugt so neue Sequenzen.

Anfang 2024 haben gleich zwei Arbeitsgruppen KI-Erfolge vermeldet (ct.de/y2nj). Das Team von Brian Hie an der Uni Stanford und Patrick Hsu vom Arc Institute in Palo Alto in Kalifornien hat ihre generative KI mit 80.000 Genomen von verschiedenen Mikroorganismen trainiert (zusammen 300 Milliarden Zeichen). Die Ergebnisse sind im Februar auf bioRxiv.org erschienen, aber noch nicht fachlich gegengelesen (Peer Review). Einige simulierte 3D-Strukturen erscheinen vielversprechend, weil sie dem natürlichen CRISPR-Cas9 ähneln. Experimentelle Belege für die Tauglichkeit stehen noch aus.

Einige Schritte weiter scheint die kalifornische Firma Profluent. Ihr CEO, Ali Madani, meldete Ende April „die erste erfolgreiche Bearbeitung des menschlichen Genoms durch Proteine, die komplett per Machine Learning erzeugt wurden“.

Madanis Team hatte zuvor mit dem selbst entwickelten Proteinsprachmodell ProGen neue antibakterielle Proteine entwickelt. Für die Suche nach neuen CRISPR-Cas-Sequenzen hat das Team das weiterentwickelte ProGen2 mit vielen bekannten Sequenzen trainiert.

CRISPR-Cas besteht aus zwei Teilen: einem Protein und einer kurzen Ribonukleinsäurekette, die als Sonde dient (guide RNA, gRNA). Die gRNA klebt in einer Tasche des Cas-Proteins. Für die praktische Anwendung bringt man sie zusammen mit einem Stück therapeutischen Erbgut in den Zellkern, wo sie umherschweben. Wenn CRISPR-Cas mittels der gRNA an der spiegelverkehrten Erbgutsequenz andockt, schneidet Cas an der betreffenden Stelle ein Stück aus dem Erbgut heraus. Die Zelle repariert die Stelle mittels ihrer üblichen Werkzeuge, füllt sie aber mit dem therapeutischen Stück. Damit ist in der betreffenden Zelle die Erbkrankheit ausgemerzt.

Die von Madani trainierte KI hat Millionen neuer Cas-Sequenzen erzeugt. Rund 200 davon fand die Gruppe vielversprechend, synthetisierte sie und setzte sie anstatt des natürlichen CRISPR-Cas9 ein. Im Laborversuch mit menschlichen Zellen haben viele davon die Zielsequenz präzise editiert.

Den bisher besten Kandidaten nennt die Firma OpenCRISPR-1. Er schneidet das Erbgut genauso effizient wie das natürliche CRISPR–Cas9, aber viel seltener an falschen Stellen. Zusätzlich hat das Team OpenCRISPR-1 zu einem Baseneditor erweitert, also einem Präzisionswerkzeug, das einzelne Buchstaben des Erbguts editiert. In Experimenten war er genauso effizient wie andere Baseneditoren, aber wiederum mit einer geringeren Fehlerrate.

Die Firma Profluent hat OpenCRISPR zum Patent angemeldet und das Herstellungsrezept auf GitHub veröffentlicht. Die Nutzung ist an eine Lizenz gebunden, die nur „ethisch vertretbare Anwendungen“ zulässt. (dz@ct.de)

KI-gestützte CRISPR-Cas-Editoren: ct.de/y2nj

Kommentieren