Terminologien und Ontologien: Konkrete Anwendungsbeispiele

Terminologien und Ontologien können die Gesundheitsversorgung verbessern, etwa bei der Arzneimitteltherapiesicherheit, aber auch bei weiteren Anwendungsfällen.

In Pocket speichern vorlesen Druckansicht
Lager mit Medikamenten in einer Apotheke

Sie sind zwar den wenigsten bekannt, doch Terminologien und Ontologien spielen in Bereichen wie der Medizin eine große Rolle.

(Bild: miguelglxz/Shutterstock.com)

Lesezeit: 9 Min.
Von
  • Dr. André Sander
Inhaltsverzeichnis

Die Anwendungsfälle für Terminologien und Ontologien in der Medizin sind nicht immer trivial, sondern erfordern zum Teil recht komplexe Algorithmen. Eine der größten Herausforderungen ist die Verarbeitung von Fließ- oder Freitexten, wie sie in der Medizin nach wie vor in großem Umfang verwendet werden.

Ontologien und Terminologien in der Medizin

(Bild: 

Chinnapong/Shutterstock.com

)

Terminologien und Ontologien können die Gesundheitsversorgung verbessern. Doch davon weiß kaum jemand etwas. In unserer Artikelserie lernen Sie, wie dadurch beispielsweise die Arzneimitteltherapiesicherheit verbessert wird. Doch auch in bekannten Anwendungen wie der elektronischen Patientenakte, der elektronischen Arbeitsunfähigkeitsbescheinigung, dem E-Rezept spielen sie eine Rolle.

Dabei geht es darum, Phrasen, Sätze oder ganze Abschnitte mit den entsprechenden Konzepten einer Terminologie abzubilden. In der Fachliteratur häufig als Concept-Tagging oder Annotation bezeichnet, werden hierfür Algorithmen aus dem Bereich des Natural Language Processing (NLP) benötigt.

Expression Constraint Language

Es können Platzhalter (*) und Vererbungsattribute (< (Kinder von), << (Element selbst und Kinder von), >> (Element selbst und Eltern von), > (Eltern von)) verwendt und die komplette Syntax enthält in der aktuellen Version unter anderem auch die Abbildung von verschachtelten Ausdrücken, Kardinalitäten und Negationen. Ein Konzept kann mittels zweier Pipes um einen Kommentar bzw. Label ergänzt werden.

In der einfachsten Form findet bzw. expandiert der Ausdruck <<* zur Gesamtmenge aller "SNOMED CT"-Konzepte. Etwas praxisnäher wäre dieser Ausdruck: <36989005|Mumps| der alle (20) Spezialisierungen von Mumps liefert.

Durch die Attributierung lassen sich nun solche rein hierarchischen Abfragen auf Basis des Concept-Models einschränken. Alle Frakturen, die den Oberschenkelknochen betreffen, lassen sich beispielsweise mit dieser Syntax darstellen:

<125605004|Fraktur| : 363698007|Wo| =<71341001|am Oberschenkelknochen|

Im Fall von SNOMED CT liefert diese Abfrage derzeit 132 Begriffe zurück. Ersetzt man die Fraktur (125605004) mit einem "*", so würde man alle 237 Begriffe erhalten, die einen topografischen Bezug zum Oberschenkelknochen haben.

Interessanterweise kann man diese Abfrage auch invertieren und fragen: Welche Knochen können brechen? Dafür wird der Fokus-Begriff schlicht als Ziel-Begriff benutzt (Achtung: Vererbung benutzen!) und die Rolle mittels vorangestelltem "R" invertiert:

<* : R363698007 =<<125605004

Es gibt knapp 800 Begriffe, die diesem Ausdruck genügen, also Strukturen im menschlichen Körper sind, die brechen können. Ein Tool zum Ausprobieren von Ausdrücken findet sich unter https://browser.ihtsdotools.org/

Gerade im Deutschen und auf dem Gebiet der Medizin gibt es dabei einiges zu bewältigen. Honeck et al. haben das sehr prägnant zusammengefasst:

"Not only is the German language known for excessive single-word nominal compounding, but also its medical sublanguage, in particular, is characterized by a mix of Latin and Greek roots."

Genau an der Schnittstelle NLP treten nun erstmals mögliche Synergien zwischen den verschiedenen KI-Ansätzen hervor, denn die Aufgabe des Concept-Taggings kann mit großen KI-Modellen (Large Language Models, LLMs) und deren Methoden deutlich verbessert werden. Insbesondere die Verarbeitung von Modalitäten, also jenen Elementen der menschlichen Sprache, die es erlauben, Vermutungen zu äußern und Hypothesen aufzustellen, ist damit erstmals zuverlässig möglich. Regelbasierte NLP-Algorithmen werden in Zukunft nur noch in Randbereichen eine eigenständige Bedeutung haben, wenn es etwa um differenzierte, syntaktische Analysen geht.

Bei der Implementierung eines Clinical Decision Support System (CDSS) geht es darum, einem Anwender Hilfestellung zu leisten, indem etwa aus Symptomen auf Diagnosen geschlossen wird oder ähnliche Patienten gesucht werden, an deren Beispiel dann eine Therapie geplant und entschieden werden kann. Im Hintergrund sind dafür spezielle Algorithmen nötig, unter anderem sogenannte Inferenzalgorithmen. In diesem Artikel soll der Aspekt der Abfragen aus Ontologien erläutert werden, da hier nach wie vor ein deutlicher Vorteil gegenüber Machine-Learning-basierten Ansätzen besteht.

Um Begriffe aus SNOMED CT und analog aufgebauten Ontologien abzufragen, wurde eigens die "expression constraint language" (ECL) entwickelt (SNOMED ECL). Diese erlaubt es, formale Ausdrücke D⊆∃R.C in der Form Fokus-Begriff: Attribut=Ziel-Begriff darzustellen und auszuführen.

Die Stärken gegenüber anderen Ansätzen bestehen vor allem in der äußerst eindeutigen und effizienten Art und Weise, bestimmte Sachverhalte definieren zu können und der Nachvollziehbarkeit der Ergebnisse.

Ein CDSS kann bei "großen Herzoperationen an Kindern" vorab etwa einen Hinweis für ein interdisziplinäres Board ausgeben, um mögliche Risiken zu minimieren. Oder bei "Infektionen im Bauchraum" einen bestimmten Prozess in Gang setzen, der die Ursache evaluiert. Aber wie definiert man nun "große Herzoperationen" und "Infektionen im Bauchraum"? Oft einfach nur durch Aufzählen.