Neues KI-Modell soll sagen können, wer in den nächsten vier Jahren stirbt

Forscher trainierten eine KI mit Lebensabläufen von rund sechs Millionen Dänen, um deren Zukunft vorauszusagen. Die Prognosen übertrafen die bisheriger Modelle.

43

(Bild: Miha Creative/ Shutterstock.com)

10.01.2024, 11:29 Uhr

Lesezeit: 4 Min.

MIT Technology Review

Von

Eike Kühl

KI-Modelle sind in der Lage, in komplexen Daten komplexe Zusammenhänge zu erkennen, was unter anderem bei der Wettervorhersage, in der Materialwissenschaft oder bei der Entwicklung neuer Medikamente hilfreich ist. Mit genug Daten gefüttert, können sie aber auch Aussagen über zukünftige Ereignisse im Leben von Menschen treffen – inklusive einer Prognose, ob diese in den kommenden vier Jahren sterben werden. Das zeigen Forscherinnen und Forscher der Technischen Universität Dänemark und der Northeastern University in Boston in einer neuen Studie.

Die Forschenden erhielten dafür Zugriff auf Daten aller rund sechs Millionen dänischer Staatsbürgerinnen und Staatsbürger zwischen 2008 und 2020. Darin enthalten waren Angaben zu Wohnort, Ausbildung, Beruf, Einkommen und Sozialleistungen, aber auch medizinische Informationen zu Arztbesuchen, Diagnosen und dem Grad der Erkrankung. Die sensiblen Daten stammen von der Regierungsorganisation Danmarks Statistik, die diese der Wissenschaft unter strengen Auflagen zur Verfügung stellt.

"Das Modell soll eine grundlegende Frage beantworten: Inwieweit können wir Ereignisse in der Zukunft auf der Grundlage von Bedingungen und Ereignissen in der Vergangenheit vorhersagen? Wissenschaftlich gesehen ist für uns nicht so sehr die Vorhersage selbst spannend, sondern die Aspekte der Daten, die es dem Modell ermöglichen, so präzise Antworten zu geben", sagt Studienleiter Sune Lehmann in einer Pressemitteilung.

Ein Prototyp, der zur Diskussion anregen soll

Um ihr life2vec genanntes Modell zu trainieren, haben die Forschenden zunächst die Daten für jeden Bürger und jede Bürgerin in eine chronologische Abfolge gebracht. Anschließend wurden die Lebensabläufe von Menschen im Alter von 25 bis 70 Jahren zwischen den Jahren 2008 und 2016 in ein Transformer-Modell eingespeist, auf dem auch große Sprachmodelle wie GPT basieren.

Ähnlich wie Sprachmodelle anhand der Trainingsdaten selbstständig Verbindungen zwischen Buchstaben und Wörtern erkennen und dadurch "sprechen" lernen, ist life2vec anhand der Lebensabläufe in der Lage, Verbindungen zwischen Ereignissen zu finden (etwa, ob auf einen Jobwechsel oder einen Umzug vom Land in die Stadt ein Herzinfarkt folgte oder ob die Diagnose von Krankheit A später auch Krankheit B mit sich zieht) und darauf basierend Vorhersagen, über die kommenden vier Jahre zu treffen.

Da das Modell nur mit Daten bis 2016 trainiert wurde, die Forschenden aber die Daten bis 2020 hatten, konnten sie die Prognosen mit den tatsächlichen Entwicklungen abgleichen und sagen, wie zuverlässig sie waren. Dazu gehörte auch die Prognose, ob eine Person in diesem Zeitraum sterben würde. Wie die Verantwortlichen schreiben, habe life2vec bei dieser Frage bisherige Modelle zur Sterblichkeit um 11 Prozent übertroffen. Und auch als es darum ging, Vorhersagen darüber zu treffen, wie Menschen in einem Persönlichkeitstest abschneiden, übertrafen die Ergebnisse speziell für diese Aufgabe trainierten Modelle.

Die Forschenden weisen darauf hin, dass die Daten nicht frei von Bias sind: So gingen bestimmte Bevölkerungsgruppen womöglich seltener zum Arzt und seien deshalb vielleicht in den Gesundheitsdaten unterrepräsentiert. Überhaupt handele es sich bei life2vec "um einen Forschungsprototyp, der in seinem derzeitigen Zustand nicht für konkrete Aufgaben in der realen Welt gedacht ist", heißt es in der Studie. Das Modell kann und soll also nicht dafür eingesetzt werden, um die Zukunft einzelner Menschen zu analysieren.

"Das Modell eröffnet wichtige positive und negative Perspektiven, die politisch diskutiert und angegangen werden können", sagt Sune Lehmann. Ähnliche Technologien zur Vorhersage von Lebensereignissen und menschlichem Verhalten würden bereits heute in Technologieunternehmen eingesetzt werden, um zum Beispiel unser Verhalten in sozialen Netzwerken zu tracken und Nutzerprofile zu erstellen. Lehmann hofft, dass seine Arbeit dazu beitragen kann, ein offeneres, öffentliches Verständnis dafür zu schaffen, wie diese Technologie funktioniert, wozu sie in der Lage ist und wie sie verwendet werden sollte – und wie nicht.