KI-Modelle für die Medizin: Google veröffentlicht MedGemma 1.5 und MedASR

Google hat mit MedGemma 1.5 die neueste Version seines multimodalen KI-Modells veröffentlicht.

vorlesen Druckansicht
Screenshot von Googles Medizin-KI-Demo auf Hugging Face

Google gibt auf Hugging Face einen Einblick in seine KI.

(Bild: Hugging Face)

Lesezeit: 3 Min.
Von
  • Dr. Fabio Dennstädt
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Die Forschungsabteilung von Google, Google Research, hat mit MedGemma 1.5 die neueste Version ihres auf medizinisches Verständnis und Bildgebung spezialisierten KI-Modells veröffentlicht. Der Vorgänger des multimodalen, großen Sprachmodells erschien im Mai 2025 als eines der ersten Open-Source-Modelle, das gezielt auf medizinischen Texten und Bildern trainiert wurde.

Version 1.5 wurde für eine höhere Leistungsfähigkeit in verschiedenen Bereichen optimiert und verfügt über deutlich erweiterte Fähigkeiten in der Bildverarbeitung. Während die erste Version bereits zweidimensionale medizinische Bilder verarbeiten konnte, analysiert MedGemma 1.5 nun auch dreidimensionale Bildgebungen sowie zeitliche Verläufe.

Die Stärken der KI liegen unter anderem in der Beurteilung und Befundung von radiologischen Aufnahmen wie der Computertomographie (CT) oder Magnetresonanztomographie (MRT). Bei Röntgenaufnahmen der Lunge kann das Modell auch aktuelle Befunde mit Voraufnahmen vergleichen, um Krankheitsverläufe und Heilungsprozesse im zeitlichen Verlauf zu beschreiben. Die Fähigkeiten von MedGemma 1.5 reichen jedoch weit über die Radiologie hinaus. Das Modell interpretiert ebenso histopathologische Gewebeschnitte, dermatologische Befunde oder Netzhautaufnahmen.

Videos by heise

In internen Tests von Google zeigt MedGemma 1.5 zahlreiche Verbesserungen gegenüber der Vorgängerversion. Dies umfasse unter anderem eine bessere Klassifizierung von Befunden im CT (Genauigkeit von 65 Prozent gegenüber 51 Prozent), eine bessere allgemeine Bildbefundung (Genauigkeit von 62 Prozent gegenüber 59 Prozent) und eine verbesserte Extraktion von Daten aus Laborberichten (F1-Score von 78 Prozent gegenüber 70 Prozent). Trotz dieser vielseitigen Fähigkeiten hat die neue Modellversion eine überschaubare Größe von 4 Milliarden Parametern. Dies ermöglicht den lokalen Betrieb auf Computern innerhalb eines Krankenhauses oder einer Arztpraxis („On-Premise“). Dieser Aspekt ist für den praktischen Einsatz entscheidend, da so sensible Gesundheitsdaten nicht zwingend über eine Cloud oder das Internet verarbeitet werden müssen.

Neben MedGemma 1.5 hat Google Research noch ein zweites KI-Modell namens MedASR veröffentlicht. MedASR ist optimiert für die medizinische Spracherkennung und kann für das Diktieren von Arztbriefen oder die Aufnahme von Fallbesprechungen verwendet werden. MedASR ist direkt mit MedGemma kombinierbar und ist somit als Gesamtsystem neben medizinischen Texten und Bildern auch für Sprachaufnahmen einsetzbar.

Google setzt mit einer Open-Source-Veröffentlichung seiner medizinischen KI-Modelle auf die Verwendung und Weiterentwicklung durch Entwicklerinnen und Entwickler. Durch weiteres KI-Training auf eigenen Daten (Finetuning) kann die Leistung der Modelle für spezifische Anwendung, wie etwa den Einsatz in einem bestimmten medizinischen Fachbereich, weiter verbessert werden. Google stellt mit der Veröffentlichung umfangreiche Tutorials und Hilfsmittel bereit. Daneben werden 100.000 US-Dollar an Preisen für die „MedGemma Impact Challenge“ vergeben, bei der Entwicklerteams die Modelle für innovative KI-Anwendungen im Gesundheitssystem einsetzen.

Für die Integration von KI-Systemen in der Medizin ist die Veröffentlichung von MedGemma 1.5 und MedASR von großer Bedeutung. Bereits seit der Erstveröffentlichung wird das Modell weltweit genutzt. So setzte beispielsweise die nationale Gesundheitsverwaltung in Taiwan MedGemma ein, um den Gesundheitszustand von Lungenkrebspatienten vor Operationen systematisch zu beurteilen.

(mack)