"FHIR-Starter": Forschungsgruppe will Gesundheitsdaten sinnvoll strukturieren
Gesundheitsdaten sind oft nicht interoperabel. Das Fraunhofer IESE und weitere wollen das ändern und entwickeln dafür ein großes Sprachmodell.
(Bild: greenbutterfly/Shutterstock.com)
Die Daten in der elektronischen Patientenakte liegen derzeit überwiegend unstrukturiert vor. Um das zu ändern, startet das Projekt "FHIR-Starter" unter der Leitung des Fraunhofer-Instituts für Experimentelles Software Engineering IESE, das für die Umsetzung mit Prof. Sylvia Thun und ihrer Arbeitsgruppe für Gesundheitsforschung an der Berliner Charité sowie dem KI-Unternehmen Insider Technologies zusammenarbeitet.
Damit die Daten sowohl für die Versorgung als auch für die Forschung besser genutzt werden können, soll eine Software auf Basis eines Large Language Models (LLMs) sowie Natural Language Processing entwickelt werden, um die Daten automatisiert zu strukturieren. Dabei kommen der medizinische Datenstandard FHIR sowie die Kodiersysteme LOINC und SNOMED-CT zum Einsatz.
Mit der so entstehenden Software sollen Ärzte sich "langfristig Laborwerte beispielsweise im Zeitverlauf anzeigen oder Medikamentenlisten automatisiert erstellen lassen. Mit den strukturierten Daten ließe sich die ePA vollständig und sinnvoll digitalisieren", erklärt Dr. Theresa Ahrens, Leiterin der Abteilung Digital Health Engineering vom Fraunhofer IESE. Außerdem sollen Daten mithilfe des Projekts künftig anonymisiert der Forschung zugänglich gemacht werden.
Videos by heise
Als Herausforderungen nennt das IESE "die Sicherstellung der Verlässlichkeit der Daten", um Halluzinationen der KI vorzubeugen und einen "umfangreichen Datenschutz", der aber mithilfe eigener Server und auf Open Source basierenden LLMs eingehalten werden soll. Für einen verantwortungsbewussten Umgang mit großen Sprachmodellen im Gesundheitswesen sind laut Ahrens Sicherheitsmechanismen wichtig. "Das Fraunhofer IESE hat mit der Entwicklung des sogenannten Uncertainty Wrappers dafür schon eine wichtige Vorarbeit geleistet, auf die wir bei diesem Projekt aufbauen können", erklärt Ahrens. Der Uncertainty Wrapper soll Unsicherheiten in KI-Modellen quantifizieren, verwalten und reduzieren.
Strukturierte Daten statt "digitaler Schriftenrolle"
Bereits vor der Umsetzung der aktuellen Version der elektronischen Patientenakte gab es Kritik, da die Daten in der elektronischen Patientenakte nicht strukturiert, sondern überwiegend als PDF vorliegen. Das Öffnen und Untersuchen der einzelnen Dateien wurde immer wieder als zeitintensiv bezeichnet – in diesem Zusammenhang wurde auch die Sorge vor einer "digitalen Schriftenrolle" geäußert.
Außerdem müssen wichtige Informationen so manuell abgetippt werden, um die Daten in die Praxis- oder Krankenhausverwaltungssysteme zu übertragen, wie auch aus der Pressemitteilung des IESE hervorgeht. Das sei fehleranfällig und verschlechtere die Versorgung. Ebenso könne auch die Forschung "Daten aus Volltexten nur schwer nutzen, was Deutschland als Forschungsstandort schwächt". "Endlich! Fax/ Word PDF to FHIR in Deutschland", freut sich Thun daher auf LinkedIn.
Künftig wird der Software-Dienst offene Schnittstellen zur Datenübertragung anbieten. Das Ziel ist es, das LLM anschließend Open Source zur Verfügung zu stellen, wie Ahrens gegenüber heise online erklärt. "Grundlage dafür wäre aber, dass das Training komplett auf anonymisierten Daten gelaufen ist. Das kann zu diesem Zeitpunkt noch nicht endgültig garantiert werden. Es werden dennoch alle Erkenntnisse und Technologien so weit wie möglich zugänglich gemacht – selbst wenn das LLM nicht Open Source gestellt werden kann", so Ahrens.
Das Projekt mit einer Laufzeit von drei Jahren wird vom Bundesministerium für Wirtschaft und Energie im Rahmen des Innovationswettbewerbs "Generative KI für den Mittelstand" mit 1,64 Millionen Euro gefördert.
Zitat von Frau Ahrens zu Open Source ergänzt.
(mack)