Medizinische KI-EntscheidungsunterstĂĽtzung: Rolle von Terminologien & Ontologien
In der Medizin können KI-bedingte Fehlentscheidungen zu schwerwiegende Folgen führen. Doch es gibt Technologien, die ebensolche Fehler verhindern können.
In kritischen Bereichen, wie zum Beispiel der Medizin, ist die Integration von Künstlicher Intelligenz alles andere als trivial, da hier KI-bedingte Fehlentscheidungen ernsthafte Konsequenzen haben können. Doch es gibt Technologien, die die aktuellen KI-Modelle zuverlässiger und sicherer machen können.
Zu Zeiten von Corona hat jeder plötzlich wie selbstverständlich über "Inzidenzen" und "R-Werte" gesprochen – heute sind es eben "LLM", "Transformer-Architekturen" und "Generative Modelle", die in aller Munde sind. Vor allem aber werden gleich eine ganze Reihe von durchaus unterschiedlichen Technologien auf diese beiden Buchstaben reduziert. Das, was wir heute ganz allgemein als "KI" bezeichnen, ist dabei nur einer von mehreren Ansätzen, mit denen künstliche Intelligenz implementiert werden kann.
Die EU teilt kĂĽnstliche Intelligenz folgendermaĂźen ein:
- Machine Learning
- Reasoning
- Robotics
Auf der Implementierungsebene etwas differenzierter:
- Konzepte des Machine Learnings
- Logik- und wissensgestĂĽtzte Konzepte
- Statistische Ansätze
Die Technologien konkurrieren dabei nicht miteinander, sondern sie ergänzen und bedingen sich zum Teil sogar. Das wird insbesondere beim allgegenwärtigen Problem der Halluzinationen von LLMs sichtbar. Ein gängiger Lösungsansatz lautet nämlich schlicht: Regeln. Damit lassen sich im Übrigen nicht nur Halluzinationen, also Falschaussagen, adressieren, sondern auch Probleme wie Rassismus und Chauvinismus in den Antworten der Modelle.
Ontologien
In der Medizin wird – im Gegensatz zu den Machine-Learning-Modellen – das Wissen in Terminologien und Ontologien abgespeichert. Die ursprüngliche Idee von Ontologien ist – wie der Name bereits vermuten lässt – eine Entwicklung der Philosophie, insbesondere der Metaphysik. Es geht um die Einteilung der Welt in das Wirkliche und Mögliche. Obwohl die Wurzeln etwa 2500 Jahre zurückreichen, wurde der eigentliche Begriff erst in den vergangenen 500 Jahren von Philosophen, wie Goclenius, Hegel und Kant aufgegriffen und definiert.
Das Ziel einer Ontologie ist die strukturierte Abbildung der Welt und "durch begrifflich begründete Deduktion alle jene Bestimmungen zu explizieren, die den Seienden als solchen zukommen können und die damit von höchster Allgemeinheit sind" (Christian Wolff) – also nichts anderes, als Wissen abzubilden und daraus zu erzeugen bzw. zu implizieren.
Mit der Entstehung der Informatik als Wissenschaft wurde diese Idee frühzeitig aufgegriffen und bereits ab den 1950er-Jahren untersucht und adaptiert. Zunächst wurden in den 1960er-Jahren, getrieben vor allem von Linguisten, sogenannte semantische Netze eingeführt. Diese Netze haben auf einer recht geringen Abstraktionsebene Beziehungen zwischen Dingen und ihren Attributen abgebildet.
Kurze Zeit später, in den frühen 1970er-Jahren, wurde, insbesondere durch Marvin Minsky, das Konstrukt von "Frames" vorgeschlagen, das Wissen in kleinen, definierten Einheiten abgebildet hat. Damit war technisch der Grundstein für regelbasierte, künstliche Intelligenz gelegt.
Schnell wurde jedoch klar, dass im Sinne der Informatik eine gewisse Formalisierung notwendig war. Die Sprachen, die entwickelt wurden, um Wissen abzubilden, heißen Beschreibungslogiken (description logics) und basieren auf formaler Logik. Die ersten Wissenssysteme, die auf dieser Basis implementiert wurden, entstanden in der zweiten Hälfte der 1980er-Jahre. Der aktuelle Stand der Technologie ist von Baader et al. 2003 in seinem "Description Logic Handbook" zusammengefasst worden und gilt heute als Standardwerk.
Terminologien
In der Medizin sind Terminologien seit langem ein Mittel zur strukturierten Dokumentation. Vorwiegend Klassifikationen – eine spezielle Form von Terminologien, die vor allem der Aggregation in Klassen dienen – werden seit Ende des 19. Jahrhunderts eingesetzt. Anfangs gedacht als Mortalitätsstatistik (zur Analyse von Todesursachen) hat sich die "International Classification of Diseases" (ICD; voller Name "International Statistical Classification of Diseases and Related Health Problems") zur Abbildung von Morbiditäten (Erkrankungen) weiterentwickelt und bildet heute in vielen Ländern der Welt eine wichtige Basis zur Steuerung der Finanzierung der Gesundheitssysteme.
Während im Laufe der Versionen große Teile der ICD entfernt wurden – vornehmlich die sogenannten äußeren Ursachen (zum Beispiel sehr detaillierte Todesursachen durch kriegerische Maßnahmen) – sind andere Bereiche immer detaillierter dargestellt worden. Speziell die sogenannten Volkskrankheiten, allen voran Diabetes, können heute sehr genau abgebildet werden. Das ist eben darin begründet, dass die ICD als Basis für die Verteilung des Gesundheitsbudgets benutzt wird.
Die ICD wurde unregelmäßig ungefähr alle fünf bis zehn Jahre aktualisiert und befindet sich heute in der 10. Revision in Routine. Zurzeit befindet sich auch diese Klassifikation im Wandel zu einer Terminologie und hat als Version 11 daher eine erhebliche Strukturänderung erfahren. Hierarchien, wie sie in den Abbildungen am Beispiel von Diabetes dargestellt sind, sind so ohne Weiteres gar nicht mehr möglich.
Das Beispiel "Diabetes" illustriert sehr plastisch die Probleme, die sich für Informatiker ergeben: Eine doch recht große Volatilität in den Daten und Strukturen. Klassifikationen sind keine festgeschriebenen Werke, sondern entwickeln sich mit dem Wissensstand der Medizin und – das ist wichtig zu verinnerlichen – mit dem Anwendungszweck. Im Prinzip kann jede Version der ICD als eigenständiges Werk verstanden werden und dennoch muss eine Kontinuität gewährleistet werden. Aus Sicht der Medizin, der Epidemiologie, der Finanzierung und der eigentlichen Versorgung sollte bzw. darf es keine Brüche geben, wenn sich Ordnungssysteme ändern. Es sollte sich um evolutionäre, "fließende" Prozesse handeln – auch wenn oft von "Revolution" gesprochen wird.
Klassifikation im Wandel (4 Bilder)
Mit Klassifikationen, insbesondere der ICD-10, haben Bürgerinnen und Bürger in Deutschland durchaus Berührung: sei es auf einer Krankschreibung oder dem Bundes-Klinik-Atlas (in der Version mit "freier Suche"). In beiden tauchen Ausdrücke auf, die aus der ICD-10 stammen. Wer beispielsweise beim Hausarzt mit einem typischen Atemwegsinfekt vorstellig wird, der wird in der Regel auf der Krankschreibung den Code "J06.9" finden. Dieser steht für nichts anderes als "Akute Infektion der oberen Atemwege, nicht näher bezeichnet". Übrigens, die Version für den Arbeitgeber enthält diesen Code nicht – somit weiß der Arbeitgeber auch nicht, warum ein Arbeitnehmer krankgeschrieben wurde.
Im Bundes-Klinik-Atlas muss bei Eingabe eines Suchbegriffes eine Diagnose oder Behandlung ausgewählt werden. Die Diagnosen haben dabei eine zusätzliche Codierung – auch das sind eben jene ICD-10 Codes. Bei den Behandlungen wird eine andere, aber ähnliche Klassifikation benutzt (der Operationen- und Prozedurenschlüssel, kurz OPS).
Mit eigentlichen Terminologien und Ontologien kommen "Endanwender" (Versicherte, Patienten, aber auch Fachpersonal) kaum bis gar nicht in Kontakt. Dennoch verrichten diese bereits heute einen wichtigen Beitrag bei der Digitalisierung des Gesundheitssystems und werden zunehmend in modernen Standards – bis hin zur namentlichen Nennung in Gesetzen – genutzt. Das Digital-Gesetz (DigiG) regelt beispielsweise das "Recht auf Interoperabilität" (§ 386) und beschreibt detailliert, welche Daten semantisch und syntaktisch interoperabel übertragen werden müssen.
Wer heute ein E-Rezept einlöst, eine elektronische Arbeitsunfähigkeitsbescheinigung erhält oder sich eine elektronische Patientenakte oder einen Impfpass auf sein Smartphone herunterlädt, verwendet im Hintergrund Terminologien.
Hinweis: In Teil 2 erfahren Sie, wie Terminologien aufgebaut sind und algorithmisch angewendet werden können.
Lesen Sie auch
Kommentar: ChatGPT kann Ă„rzte nicht ersetzen
Über den Autor: Dr. André Sander promovierte an der Charité im Bereich Medizinwissenschaften und beschäftigt sich seit mehr als 25 Jahren mit medizinischen Terminologien und Ontologien. Bei ID Information und Dokumentation ist er CTO, Prokurist und Mitglied der Geschäftsführung.
(mack)