Wie DeepMind die Struktur aller bekannten Proteine entschlüsseln will

Die Alphabet-Tochter hat ihre KI zur Proteinfaltung bereits eingesetzt, um Strukturen für das menschliche Proteom zu erzeugen. Doch AlphaFold kann mehr.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen

(Bild: DeepMind)

Lesezeit: 6 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Bereits im Dezember 2020 überraschte DeepMind, die in London ansässige KI-Tochter von Google, die Welt der Biologie, als die Firma mit AlphaFold, einem KI-Tool zur Vorhersage der Struktur von Proteinen, einen schon seit 50 Jahre laufenden wissenschaftlichen Wettbewerb gewann. Nun hat das Unternehmen erstmals Details zu diesem Werkzeug veröffentlicht und sogar den Quellcode freigegeben.

Doch das war erst der Anfang. Nun wurde bekannt, dass DeepMind mit Hilfe seiner KI die Formen fast aller Proteine im menschlichen Körper vorhersagen kann. Und das ist nicht alles: Auch die Form hunderttausender anderer Proteine, die in 20 der am häufigsten untersuchten Organismen vorkommen, darunter Hefe, Fruchtfliege und Maus. Der Durchbruch lasse sich berechnen. Das könnte es Biologen aus aller Welt ermöglichen, Krankheiten besser zu verstehen und neue Medikamente zu entwickeln.

Bislang besteht der Fundus aus 350.000 neu vorhergesagten Proteinstrukturen. DeepMind gab an, dass es in den nächsten Monaten die Strukturen für mehr als 100 Millionen weitere errechnen und veröffentlichen wird – mehr oder weniger alle Proteine, die der Wissenschaft aktuell bekannt sind.

"Die Proteinfaltung ist ein Problem, auf das ich schon mehr als 20 Jahren ein Auge geworfen habe", sagt DeepMind-Mitbegründer und CEO Demis Hassabis. "Es war ein riesiges Projekt für uns. Ich würde sagen, es ist das größte, das wir bisher durchgeführt haben. Und es ist in gewisser Weise auch das aufregendste, weil es den größten Einfluss auf unsere Welt außerhalb der KI-Szene haben dürfte."

Proteine bestehen aus langen Ketten von Aminosäuren, die sich zu komplizierten Knoten verdrehen. Wenn man die Form des Knotens eines Proteins kennt, kann man herausfinden, was dieses Protein praktisch tut. Das ist entscheidend, um zu verstehen, wie Krankheiten ablaufen und wie neue Medikamente gegen sie entwickelt werden könnten. Zudem lassen sich so potenziell Organismen identifizieren, die bei der Bekämpfung von Umweltverschmutzung und Klimawandel helfen können. Um die Form eines Proteins herauszufinden, braucht es Wochen oder Monate im Labor. AlphaFold kann die Form eines Proteins in ein oder zwei Tagen bis auf das nächste Atom genau vorhersagen.

Die neue AlphaFold-Datenbank könnte das Leben von Biologen einfacher machen. Die KI kann zwar von Forschern genutzt werden, aber nicht jeder wird die Software selbst betreiben wollen. "Es ist viel einfacher, sich eine Struktur aus der Datenbank zu holen, als die KI auf dem eigenen Computer laufen zu lassen", sagt David Baker vom Institute for Protein Design an der University of Washington, dessen Labor ein eigenes Tool zur Vorhersage von Proteinstrukturen entwickelt hat, das "RoseTTAFold" heißt und auf den Grundlagen von AlphaFold basiert.

In den letzten Monaten hat Bakers Team mit Biologen zusammengearbeitet, die bisher nicht in der Lage waren, die Form von Proteinen, die sie untersuchten, zu entschlüsseln. "Es gibt eine ganze Menge ziemlich cooler biologischer Forschung, die dadurch wirklich beschleunigt wurde", sagt er. Eine öffentliche Datenbank mit Hunderttausenden von vorgefertigten Proteinstrukturen sollte ein noch größerer Beschleuniger sein.

"Das sieht erstaunlich beeindruckend aus", sagt auch Tom Ellis, synthetischer Biologe am Imperial College London, der sich mit dem Hefegenom beschäftigt und die AlphaFold-Datenbank sehr gerne ausprobieren möchte. Er gibt allerdings zu bedenken, dass die meisten der vorhergesagten Strukturen noch nicht im Labor verifiziert worden sind.

In der neuesten Version von AlphaFold werden die Vorhersagen mit einem Vertrauenswert versehen, mit dem das Tool angibt, wie nahe die vorhergesagte Form an der realen Form sein dürfte. Unter Verwendung dieses Maßstabs fand DeepMind heraus, dass AlphaFold die Formen für 36 Prozent der menschlichen Proteine mit einer Genauigkeit vorhersagte, die bis auf die Ebene der einzelnen Atome korrekt ist. Das sei gut genug für die Medikamentenentwicklung, sagt Hassabis.

Bisher wurden nach jahrzehntelanger Arbeit nur für 17 Prozent der Proteine im menschlichen Körper die Strukturen im Labor identifiziert. Wenn die Vorhersagen von AlphaFold so genau sind, wie DeepMind behauptet, hat das Tool diese Prozentzahl in nur wenigen Wochen mehr als verdoppelt.

Selbst Vorhersagen, die auf atomarer Ebene nicht ganz genau sind, sind immer noch nützlich. Für mehr als die Hälfte der Proteine im menschlichen Körper hat AlphaFold eine Form vorhergesagt, die für Forscher gut genug sein sollte, um die Funktion des Proteins herauszufinden. Der Rest der aktuellen Vorhersagen von AlphaFold ist entweder fehlerhaft (falsch) oder gilt für das Drittel der Proteine im menschlichen Körper, die überhaupt keine Struktur haben, bis sie sich mit anderen Proteinen verbinden. "Die bleiben zunächst schlaff", sagt Hassabis.

"Die Tatsache, dass AlphaFold in dieser Qualität angewendet werden kann, ist eine beeindruckende Sache", sagt Mohammed AlQuraish, ein Systembiologe an der Columbia University, der seine eigene Software zur Vorhersage von Proteinstrukturen entwickelt hat. Er weist auch darauf hin, dass es, wenn man die Strukturen für die meisten Proteine in einem Organismus hat, möglich sein wird, zu untersuchen, wie diese Proteine als System funktionieren und nicht nur isoliert. "Das ist das, was ich am spannendsten finde", sagt er.

DeepMind gibt seine Werkzeuge und Proteinstrukturen kostenlos frei und gibt bislang nicht an, ob es Pläne hat, in Zukunft damit Geld zu verdienen. Die Google-Tochter schließt diese Möglichkeit jedoch nicht aus. Um die Datenbank einzurichten und zu betreiben, arbeitet DeepMind mit dem European Molecular Biology Laboratory zusammen, einer internationalen Forschungseinrichtung, die bereits eine große Datenbank mit Proteininformationen besitzt.

AlQuraishi kann es kaum erwarten, zu sehen, was die Forscher mit den neuen Daten machen. "Das ist ziemlich spektakulär", sagt er. "Ich glaube nicht, dass einer von uns gedacht hat, dass wir diesen Meilenstein so schnell erreichen würden. Das ist eigentlich unglaublich."

(bsc)