Interview: Puraite will Literaturrecherche mit erklärbarer KI beschleunigen

Puraite will die manuelle Literaturrecherche in den Lebenswissenschaften mit erklärbarer KI deutlich verkürzen. Über die Pläne des Start-ups.

3

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Laptop, auf dem miteinander verbundene Datenpunkte zu sehen sind. — (Bild: Pixels Hunter / Shutterstock.com)

Stand: 29.04.2026, 19:45 Uhr

Lesezeit: 24 Min.

Von

Marie-Claire Koch

Die medizinische Forschung produziert jedes Jahr über drei Millionen neue Studien – doch wer soll das alles lesen? Selbst hoch spezialisierte Experten können nur einen Bruchteil der relevanten Literatur überblicken. Gleichzeitig hinkt die Aufbereitung dieses Wissens hinterher: Ein systematischer Review, also die strukturierte Zusammenfassung des aktuellen Forschungsstands zu einer konkreten Frage, dauert heute zwischen sechs Monaten und zwei Jahren. Bis das Ergebnis vorliegt, ist die Datenlage oft schon wieder veraltet.

Das ostwestfälische Start-up Puraite will mit einer KI-Plattform für die Evidenzsynthese diese Prozesse beschleunigen, ohne dabei die wissenschaftliche Strenge zu opfern. Die Plattform durchsucht Datenbanken wie PubMed, filtert relevante Studien heraus, extrahiert Daten und bewertet sie nach wissenschaftlichen Kriterien. Im Interview und auch in dem später produzierten Podcast erklärt Mitgründer Schahin Baki, warum der manuelle Weg an seine Grenzen stößt und wie KI-gestützte, aber methodisch saubere Prozesse die Evidenzsynthese beschleunigen können. International gibt es zwar ähnliche Angebote von Unternehmen wie „Laser AI“, „Nested Knowledge“, „DistillerSR“ und „Covidence“, Puraite ist nach eigenen Angaben jedoch das einzige Produkt in diesem Umfang, das vollständig aus Europa heraus entwickelt und vertrieben wird.

Schahin Baki ist wissenschaftlicher Mitarbeiter im Bereich Data Science und KI an der Uni Paderborn.

(Bild: Puraite)

Können Sie einmal kurz sagen, wofür Puraite steht und was es macht?

Der Name steht für Pure AI Technology. Wir automatisieren die Evidenzsynthese in den Life Sciences, also in der Pharmaindustrie, Medizintechnik, klinischen Versorgung und angrenzenden Bereichen. Wir helfen dabei, Inhalte aus Studien zusammenzuführen, um daraus Forschungsfragen zu beantworten.

Und was ist der Unterschied zu einem guten KI-Sprachmodell?

Sprachliche Eleganz ist kein Beweis für wissenschaftliche Qualität. Ein KI‑Modell kann einen Text formulieren, der wie eine gründliche Zusammenfassung klingt – doch dahinter steht kein systematisches Verfahren. Eine echte Übersichtsarbeit folgt klaren methodischen Schritten: ein vorher festgelegtes Forschungsprotokoll, eine nachvollziehbare Literaturrecherche, eine doppelte unabhängige Bewertung der Studien, strukturierte Prüfung des Verzerrungsrisikos nach anerkannten Tools (RoB 2, ROBINS-I, QUADAS-2), eine Bewertung der Evidenzsicherheit nach GRADE und eine vollständige Rückverfolgbarkeit der Quellen bis auf Satzebene.

Internationale Forschungsnetzwerke wie Cochrane und Campbell haben in einem Positionspapier gemeinsam klargestellt: KI kann diese methodischen Anforderungen unterstützen – aber sie ersetzt sie nicht. Genau hier setzt Puraite an. Wir automatisieren keine Evidenz, sondern liefern die Infrastruktur, in der ein methodisch korrekter, konformer Prozess effizient durchgeführt und gegenüber Regulatoren nachgewiesen werden kann.

Puraite hilft also dabei, besser einzuschätzen, was gerade der aktuelle Forschungsstand ist?

Genau. Das bedeutet, aus verschiedenen Studien Informationen zu extrahieren, um komplexe, feingranulare Forschungsfragen zu beantworten – etwa: Wie wirksam sind GLP-1-Rezeptoragonisten im Vergleich zu Placebo oder anderen antidiabetischen Therapien hinsichtlich der Reduktion schwerwiegender kardiovaskulärer Ereignisse bei erwachsenen Patientinnen und Patienten mit Diabetes mellitus Typ 2? Typischerweise würde man dafür verschiedene Datenbanken bedienen, die Studien auf Relevanz screenen, die Daten extrahieren und schließlich aus vielen Einzelstudien ein Dokument zusammenstellen, das die Antwort liefert. Die Anwendungsfälle sind dabei sehr weitreichend – von medizinischen Leitlinien bis hin zu Preisverhandlungen für Medikamente. Im gesamten Gesundheitsbereich ist Evidenz so etwas wie das Fundament für Entscheidungen.

Videos by heise

Wir haben die klinische Versorgung bewusst zunächst ausgeklammert und uns vollständig auf die Industrie konzentriert – also Pharmaindustrie, Medizintechnik, Versicherungen und angrenzende Bereiche wie die Lebensmittelbranche, überall dort, wo Literaturrecherchen für regulatorische Zwecke erforderlich sind. Die Produktentwicklung in unserem Bereich ist kostenintensiv, bedingt durch KI-Know-how in Form von Personal als auch in der Infrastruktur. Die Industrie ist daher unser erster Fokus – auch weil die dort erzielten Erlöse uns langfristig ermöglichen sollen, die Plattform für den akademischen und klinischen Bereich zugänglich zu machen.

Und auf welche Datenbanken greift Puraite dabei zurück?

Vor allem auf öffentlich zugängliche Publikationen und klinische Studien – über Datenbanken wie PubMed, Embase oder OpenAlex. Etwa 50 Prozent der Volltexte sind frei zugänglich, die andere Hälfte liegt hinter Paywalls, aber die Firmen und Institutionen, die damit arbeiten, verfügen in der Regel über die entsprechenden Lizenzen. Hinzu kommt Grauliteratur. Entscheidend ist, alles systematisch zu erfassen: Jedes relevante Signal muss einbezogen werden, weil es die Antwort auf die Forschungsfrage beeinflussen kann – zwei klinische Studien können durchaus zu unterschiedlichen Ergebnissen kommen.

Welche Rolle spielen da Leitlinien?

Leitlinien werden auf Basis von systematischen Reviews entwickelt. Diese Reviews stellen die höchste Form der Evidenz dar. Man nutzt sie, um die vorhandene Evidenz zu synthetisieren und daraus Leitlinien abzuleiten. Das Problem dabei ist jedoch, dass systematische Reviews extrem zeitaufwändig sind. Angesichts der Wissensexplosion in der Medizin ist eine Information oft schon veraltet, bevor sie in eine Leitlinie überführt wurde.

Aktualisiert sich das also sehr viel schneller als herkömmliche KI-Systeme?

Das Besondere ist weniger die KI selbst als vielmehr das Konzept der sogenannten „Living Reviews“. Das bedeutet, dass der gesamte Prozess in regelmäßigen Abständen – quartalsweise, monatlich, wöchentlich oder sogar täglich – erneut angestoßen wird, um neu erschienene Publikationen einzuspeisen. Denn was heute der Stand der Evidenz ist, kann sich morgen bereits verändert haben.

Kann man das auch manuell anstoßen?

Das ist jederzeit möglich. Das aktuelle Geschäftsmodell basiert auf einem Flat-Rate-Prinzip: Es gibt ein Lizenzmodell, bei dem beliebig viele Nutzerinnen und Nutzer eingebunden werden können. Wir rechnen bewusst nicht nach Sitzen ab, weil wir möchten, dass das Tool tatsächlich intensiv eingesetzt wird, ohne dass Accounts geteilt werden müssen. Man kann sich das wie einen Organisationsaccount vorstellen. Eine große Pharmafirma hat beispielsweise verschiedene Abteilungen, die systematische Reviews erstellen oder in Auftrag geben. Diesem Unternehmen stellen wir die Plattform vollumfänglich bereit – mit Versionierung und Aufgabenverteilung.

Ihr werbt mit 95 Prozent Sensitivität?

Der Prozess beginnt mit der Suche nach Publikationen. Im nächsten Schritt erfolgt das Screening: Man liest Titel und Abstract und entscheidet – relevant oder nicht relevant. Bei diesem Schritt erreichen wir eine Sensitivität von über 95 Prozent, was dem etablierten Zielwert für KI-gestützte Screening-Tools in diesem Bereich entspricht. Die menschliche Vergleichsgröße liegt bei zwei unabhängigen Reviewern bei etwa 97 Prozent – bei einem einzelnen Reviewer jedoch deutlich darunter, wie Studien zeigen. Der Mensch gilt in der Industrie als unangefochtener Goldstandard, doch auch Menschen machen Fehler – große Untersuchungen dokumentieren Fehlerquoten von über zehn Prozent beim Einzelscreening. Ich behaupte nicht, dass die KI perfekt ist, ganz im Gegenteil – ich sage nur, dass diese Seite der Debatte oft zu wenig Beachtung findet.

Handelt es sich dabei um ein Agentenmodell?

Die Plattform ist vor allem sehr modular aufgebaut, entsprechend der wissenschaftlichen Methodologie. Der gesamte Prozess der Evidenzsynthese ist derzeit extrem manuell: Mehrere Personen arbeiten parallel daran, tauschen Tabellen aus, nutzen verschiedene Tools – also sehr fragmentiert. Unsere Plattform soll so etwas wie die gemeinsame Evidenzinfrastruktur werden. Man kann KI nutzen – erklärbare KI –, aber man kann jeden Schritt auch vollständig manuell durchführen, alles innerhalb einer Plattform ohne Medienbrüche. Das ist schon ein erheblicher Vorteil: keine verteilten Excel-Tabellen mehr, dafür Versionierung, klare Aufgabenverteilung und eine gemeinsame Arbeitsoberfläche. Die KI kann für den gesamten Prozess genutzt werden oder nur für einzelne Schritte mit Sub-Agents – ganz nach Bedarf.

Das Produkt ist zunächst auf Englisch. Wie wäre das für den deutschen Markt? Andere Datenbanken, angepasste Modelle?

Das ist eine sehr gute Frage. Glücklicherweise findet Evidenzsynthese nahezu ausschließlich auf Englisch statt – in der weit überwiegenden Mehrzahl der Fälle. Selbst wenn man das für klinische Leitlinien in Deutschland nutzt, basieren diese auf Publikationen aus verschiedensten Ländern. Wir sind daher von vornherein englischsprachig vorgegangen, weil Publikationen in diesem Bereich fast immer auf Englisch erscheinen. Die Plattform selbst zu übersetzen wäre kein Problem – bisher hat allerdings auch keiner unserer Nutzer Bedarf daran geäußert, weil alle ohnehin auf Englisch arbeiten. Und es handelt sich stets um sehr internationale Teams, die in Amerika, Irland, Deutschland oder Japan sitzen.

Ihre Kunden sind aus verschiedenen Ländern?

Ja. Der Großteil unserer Kunden kommt allerdings aus den USA, Kanada und dem Vereinigten Königreich. Ich hatte oft das Gefühl, dass man in Deutschland innovativ sein möchte, aber niemand der Erste sein will. Und das ist in gewissem Sinne auch unser Alleinstellungsmerkmal und der Grund, wieso wir mit Puraite aus Deutschland heraus angetreten sind: Wir sind das einzige Team weltweit, das diese Lösung vollständig aus Europa heraus entwickelt, ohne Niederlassungen in den USA oder anderswo.