KI soll Zukunft der KI voraussagen

Forscher entwickeln Software, um vorherzusagen, welche Konzepte in KI und Maschinenlernen demnächst erforscht werden.

In Pocket speichern vorlesen Druckansicht 42 Kommentare lesen

(Bild: Tatiana Shepeleva/Shutterstock.com)

Lesezeit: 4 Min.

Die Zahl der wissenschaftlichen Veröffentlichungen wächst rasant. In KI und Maschinenlernen beispielsweise verdoppelt sich die Zahl der Paper etwa alle 23 Monate. Der Gedanke, diese Informationsflut selbst maschinell auszuwerten, Trends frühzeitig zu erkennen und möglicherweise sogar Hinweise auf besonders lohnende Forschungsfelder zu finden, liegt deshalb nahe. Doch obwohl Sprachmodelle mittlerweile verblüffende Fähigkeiten zeigen, sind sie nicht leistungsfähig genug, um die wesentlichen Konzepte und Forschungsziele aus Veröffentlichungen heraus zu destillieren.

Der Physiker Mario Krenn vom Max-Planck-Institut fĂĽr die Physik des Lichts in Erlangen und seine Kollegen setzten auf eine radikale Vereinfachung des Problems: Sie suchten in akademischen Papern nach SchlĂĽsselkonzepten, die sie dann zu einem semantischen Netz verknĂĽpften, dessen zeitliche Entwicklung Prognosen ĂĽber die zukĂĽnftige Entwicklung erlaubt.

Die Idee geht auf eine Arbeit des Biochemiker Andrey Rzhetsky von der University of Chicago zurück, der erstmals 2015 systematisch Paper maschinell nach gleichzeitig in dem Paper erwähnten biochemischen Molekülen durchsuchte, um ein Modell der biochemischen Forschung zu erstellen. 2020 wandten Krenn und der Quantenforscher Anton Zeilinger, der vor kurzem mit dem Physik-Nobelpreis ausgezeichnet wurde, die Idee auf die Quantenforschung an. Ihr Ziel: Ein Tool, das Forschungsteams basierend auf ihren bisherigen Arbeiten Vorschläge für vielversprechende neue Forschungsprojekte macht. Die Vorschläge bestehen aus Konzepten in dem semantischen Netzwerk, die bisher zum einen zu den bisherigen Forschungen passen, in dem Modell-Netzwerk aber noch nicht miteinander verbunden sind.

In einem aktuellen Paper versuchen Krenn und Kollegen sich einem wesentlich größeren semantischen Netz und wenden sich der KI zu. Mit dem Software Tool RAKE (Rapid Automatic Keyword Extraction) durchsuchten sie 143.000 akademische Arbeiten, die zwischen 1994 und 2021 auf dem Preprint-Server arXiv im Bereich KI und maschinelles Lernen veröffentlicht wurden. Aus Titel und Abstrakt der Paper extrahierten sie dann eine Liste von rund 65.000 Schlüsselkonzepten. Diese Konzepte bildeten die Knotenpunkte eines semantischen Netzwerks – die Kanten sind Verbindungen, die sich dadurch ergeben, dass zwei Konzepte gleichzeitig in einem Paper auftauchen. Auf diese Weise entstand ein dynamisch wachsendes semantisches Netz, aus dem – so die Idee – zumindest grob hervorgehen sollte, wie sich Forschungsbereiche im Laufe der Zeit verschoben und wie Wissenschaftler Verbindungen herstellten und neue Interessengebiete in der Vergangenheit erkundeten.

Um das herauszufinden, veranstaltete das Forschungsteam 2021 einen Wettbewerb. Die besten zehn Modelle, die in dem Paper vorgestellt werden, konnten auf Basis der historischen Daten mit einer Genauigkeit von mehr als 99,5 Prozent vorhersagen, ob drei Konzepte innerhalb von fĂĽnf Jahren gemeinsam in mindestens drei Artikeln auftauchen wĂĽrden. Das schlechteste Modell landet bei 60 Prozent.

Mehr ĂĽber KĂĽnstliche Intelligenz

Natürlich ist die Vorhersagekraft dieser Methode begrenzt. Wirklich neue Ideen, das räumen auch die Autoren ein, können mit diesem Verfahren nicht entdeckt werden, da ja hier per Definition bekannte Konzepte miteinander verknüpft werden. Dennoch sehen die Autoren noch viel Spielraum für Verbesserung: So werden beispielsweise im Moment nur die Überschrift und der Abstrakt der Paper ausgewertet. In Zukunft könnte zudem bei der Verknüpfung von Konzepten im semantischen Netz auch der wissenschaftliche Impact der Veröffentlichung genutzt werden.

Krenn und Kollegen sind zudem nicht die einzigen, die an der Automatisierung wissenschaftlicher Erkenntnisse arbeiten. So arbeiten Forschungsgruppen am MIT beispielsweise an KI-Systemen, die selbstständig Naturgesetze entdecken, bei IBM wird an einem System gearbeitet, das autonom Synthese-Verfahren für die industrielle Produktion von Naturstoffen aus einfachen Ausgangschemikalien entwickelt – und das sind nur zwei von zahlreichen Beispielen.

(wst)