KI-Sprachmodelle in der Medizin: Über Forschung mit BioGPT, BioMedLM und mehr

Seite 2: Suchmaschinen wie BingChat könnten für Ärzte medizinisches Dossier erstellen

Inhaltsverzeichnis

Wo sehen Sie das große Potenzial dieser Sprachmodelle?

Das Potenzial liegt in der Zusammenfassung von medizinischer Literatur, denn kein Arzt hat die Zeit, sich laufend einen guten Überblick zu verschaffen. Wir können uns also schon bald mit einem Sprachmodell plus Suchmaschine wie BingChat zu einer Fragestellung eine Art Dossier zu wissenschaftlichen Artikeln aus der medizinischen Meta-Datenbank PubMed erstellen lassen – samt den Literaturreferenzen. Noch ist das so nicht möglich, aber das ist Stand aktiver Forschung.

Das heißt, diese Verknüpfung zu den Referenzen gibt es bisher nicht?

BioGPT und BioMedLM sind Sprachmodelle, die mit einer Suchmaschine noch nicht gekoppelt sind. Für eine Nutzung, die eine Verifizierung des Outputs ermöglicht, müsste man also die Referenzierung auf die Quellen noch ermöglichen.

Auf welchem Stand ist BioGPT und welche Updates sind für die Zukunft geplant?

GPT-3 bringt nicht mehr, wenn man nicht mehr Text als Trainingsmaterial hat. Das heißt, mit den 30 Millionen Einträgen von PubMed kann ich ein sehr viel größeres Sprachmodell nicht richtig trainieren. Im schlimmsten Fall lernt es dann die Texte nämlich auswendig und kann nicht mehr generalisieren.

Wenn ich also das Modell von BioMedLM mit 2,7 Millionen Parametern vergrößern würde – und GPT-3 hat 175 Billionen Parameter –, dann wäre das sogar schädlich. Ein größeres Modell würde also nur Sinn machen, wenn deutlich mehr Daten hineingefüttert werden könnten.

Wie spielt das eben an den Start gegangene Forschungsdatenportal Gesundheit hinein? Wäre hier eine Kopplung an ein Sprachmodell möglich?

Viele dieser Primärdaten sind tabellarische Daten, auch Genomdaten werden so gespeichert. Das ist nichts, was ein Sprachmodell ad hoc auswerten könnte. Was als Sprache in dem Portal zur Verfügung steht, könnte mit einem Sprachmodell ausgewertet werden. Es ist aber eine interessante Forschungsrichtung, wie sich tabellarische Daten oder andere Daten zusammenfassen lassen könnten.

Man hat bereits mit AlphaFold gesehen, wie gut die 3D-Struktur von Proteinen herausgefunden werden konnte. Diese Systeme nutzen Deep Learning Ansätze und können aus laufenden Experimenten lernen. Wenn ein solches KI-System aus den bereits erfolgten Experimenten lernen kann, kann es die Regelmäßigkeiten extrahieren und das auf anderen Molekülen übertragen, etwa bei Wirkstoffkandidaten. Im Labor können nicht alle Kandidaten durchprobiert werden, weshalb man sich normalerweise nur auf ein paar Kandidaten konzentriert, die ausgetestet werden. Mit einem KI-System lässt sich das besser hochskalieren.

Doch mit diesen Methoden lässt sich auch nach tödlichen Giftstoffen suchen.

Ich kann damit natürlich jetzt einerseits nach Wirkstoffen suchen, die auf eine bestimmte Krankheit zugeschnitten sind, aber ich könnte auch Stoffe finden, die tödlich sind. Das weiß der Algorithmus ja an sich nicht.