Missing Link: Stephen Wolfram über die Rolle der KI in der Forschung (Teil 2)

Seite 6: Jenseits der "Exakten Wissenschaften"

Inhaltsverzeichnis

In Bereichen wie den Naturwissenschaften ist die Entwicklung umfassender Theorien, die quantitative Vorhersagen machen können, eine vertraute Vorstellung. Doch viele Bereiche, zum Beispiel in den biologischen, humanen und sozialen Wissenschaften, haben tendenziell in viel weniger formalen Weisen operiert, und lange Ketten erfolgreicher theoretischer Schlussfolgerungen sind weitgehend unbekannt.

Könnte KI das ändern? Es scheinen sich interessante Möglichkeiten abzuzeichnen, insbesondere um die neuen Arten von "Messungen", die KI ermöglicht. "Wie ähnlich sind diese Kunstwerke?" "Wie nahe sind die Morphologien dieser Organismen?" "Wie unterschiedlich sind diese Mythen?" Das sind Fragen, die früher meist durch das Verfassen eines Essays angegangen wurden. Doch nun bietet KI potenziell einen Weg, solche Dinge definitiver und in gewissem Sinne quantitativer zu machen.

Typischerweise besteht die Schlüsselidee darin, herauszufinden, wie man "unstrukturierte Rohdaten" nimmt und "bedeutungsvolle Merkmale" daraus extrahiert, die auf formale, strukturierte Weisen gehandhabt werden können. Und das Hauptelement, das dies ermöglicht, ist, dass KIs vorhanden sind, die auf großen Korpora trainiert wurden, die das Typische in unserer Welt widerspiegeln – und die effektiv definitive interne Darstellungen der Welt gebildet haben, in Begriffen, in denen Dinge beispielsweise durch Listen von Zahlen beschrieben werden können.

Was bedeuten diese Zahlen? Am Anfang gibt es typischerweise keine Vorstellung; sie sind einfach das Ergebnis eines neuronalen Netzwerk-Encoders. Wichtig ist aber, dass sie eindeutig und wiederholbar sind. Bei gleichen Eingabedaten erhält man immer die gleichen Zahlen. Mehr noch, wenn Daten uns "ähnlich erscheinen", neigen wir dazu, ihnen Zahlen zuzuordnen, die nahe beieinander liegen.

In einem Bereich wie der Physik wird erwartet, spezifische Messgeräte zu bauen, die Größen messen, deren Interpretation "bekannt ist". Doch KI ist viel mehr eine Black Box: Es wird etwas gemessen, aber zumindest anfangs ist nicht notwendigerweise eine Interpretation davon vorhanden. Manchmal wird es möglich sein, ein Training durchzuführen, das eine bekannte Beschreibung verknüpft, sodass zumindest eine grobe Interpretation erhalten wird (wie im Fall einer Sentimentanalyse). Aber oft wird das nicht der Fall sein.

(Und es muss gesagt werden, dass etwas Ähnliches sogar in der Physik passieren kann. Angenommen, es wird getestet, ob ein Material die Oberfläche eines anderen kratzt. Vermutlich kann das als eine Art Härte des Materials interpretiert werden, aber wirklich ist es nur eine Messung, die Bedeutung erlangt, wenn sie erfolgreich mit anderen Dingen in Verbindung gebracht werden kann.)

Etwas, das besonders auffällig an "KI-Messungen" ist, ist, wie sie potenziell "kleine Signale" aus großen Mengen unstrukturierter Daten herausfiltern können. Man ist gewohnt, Methoden wie Statistik zu haben, um Ähnliches mit strukturierten, numerischen Daten zu tun. Doch es ist eine andere Geschichte, aus Milliarden von Webseiten zu fragen, ob etwa Kinder, die Wissenschaft mögen, typischerweise Katzen oder Hunde bevorzugen.

Doch gegeben eine KI-Messung, was kann damit erwartet werden zu tun? Nichts davon ist bisher sehr klar, doch es scheint zumindest möglich, dass formale Beziehungen gefunden werden können. Vielleicht wird es eine quantitative Beziehung involvierende Zahlen sein; vielleicht wird es besser durch ein Programm repräsentiert, das einen Berechnungsprozess beschreibt, durch den eine Messung zu anderen führt.

Es ist seit einiger Zeit üblich, in Bereichen wie der quantitativen Finanzwirtschaft, Beziehungen zwischen dem zu finden, was im Grunde einfache Formen von KI-Messungen sind – und hauptsächlich damit beschäftigt zu sein, ob sie funktionieren, anstatt warum sie funktionieren oder wie man sie narrativ beschreiben könnte.

In gewissem Sinne scheint es unbefriedigend, Wissenschaft auf "Black-Box"-KI-Messungen zu bauen, die nicht interpretiert werden können. Doch auf einer gewissen Ebene ist dies nur eine beschleunigte Version dessen, was oft gemacht wird, sagen wir mit alltäglicher Sprache. Eine neue Beobachtung oder Messung wird ausgesetzt und schließlich erfindet man Worte, um sie zu beschreiben ("es sieht aus wie ein Fraktal"). Und dann kann begonnen werden, "in Begriffen davon zu argumentieren", et cetera.

Doch KI-Messungen sind potenziell eine viel reichere Quelle formalisierbaren Materials. Doch wie sollte diese Formalisierung durchgeführt werden? Computergestützte Sprache scheint der Schlüssel zu sein. Und tatsächlich gibt es bereits Beispiele in der Wolfram Language – wo Funktionen wie ImageIdentity oder TextCases (oder, was das betrifft, LLMFunction) effektiv KI-Messungen machen können, aber dann können ihre Ergebnisse genommen und symbolisch damit gearbeitet werden.

In der Physik wird oft vorgestellt, nur mit "objektiven Messungen" zu arbeiten (obwohl meine jüngste Beobachtertheorie impliziert, dass eigentlich unsere Natur als Beobachter auch entscheidend ist). Doch KI-Messungen scheinen eine gewisse unmittelbare "Subjektivität" zu haben – und tatsächlich werden ihre Details (sagen wir, assoziiert mit den Besonderheiten eines neuronalen Netz-Encoders) für jede unterschiedliche KI, die verwendet wird, anders sein. Aber wichtig ist, dass, wenn die KI auf gewaltigen Mengen menschlicher Erfahrung trainiert wird, eine gewisse Robustheit zu ihr gehört. In gewissem Sinne können viele KI-Messungen wie die Ausgabe eines "gesellschaftlichen Beobachters" angesehen werden – der so etwas wie die gesamte Masse menschlicher Erfahrung nutzt und dadurch eine gewisse "Zentralität" und "Trägheit" gewinnt.

Welche Art von Wissenschaft kann erwartet werden, auf der Basis dessen zu bauen, was ein "gesellschaftlicher Beobachter" misst? Größtenteils ist das noch unbekannt. Es gibt einige Gründe zu denken, dass (wie im Fall der Physik und Metamathematik) solche Messungen in Taschen computergestützter Reduzibilität eindringen könnten. Und wenn das der Fall ist, kann erwartet werden, dass begonnen werden kann, Dinge wie Vorhersagen zu machen – wenn auch vielleicht nur für die Ergebnisse von KI-Messungen, die schwer zu interpretieren sein werden. Doch indem solche KI-Messungen mit computergestützter Sprache verbunden werden, scheint das Potenzial zu bestehen, "formalisierte Wissenschaft" an Orten zu konstruieren, wo das zuvor nie möglich war – und dadurch den Bereich dessen zu erweitern, was als "exakte Wissenschaften" bezeichnet werden könnte.

(Übrigens ist eine weitere vielversprechende Anwendung moderner KIs das Einrichten von "wiederholbaren Personas": Entitäten, die effektiv wie Menschen mit bestimmten Eigenschaften agieren, aber an denen großangelegte wiederholbare Experimente der Art, wie sie in der Physik typisch sind, durchgeführt werden können.)

Zu Beginn könnte es überraschend erscheinen, dass Wissenschaft überhaupt möglich ist. Warum gibt es Regelmäßigkeiten, die wir in der Welt identifizieren können, die es uns erlauben, "wissenschaftliche Narrative" zu bilden? Tatsächlich wissen wir heute durch Konzepte wie den Ruliad, dass die rechnerische Irreduzibilität unvermeidlich allgegenwärtig ist – und damit fundamentale Unregelmäßigkeit und Unvorhersehbarkeit. Es stellt sich jedoch heraus, dass die reine Präsenz der rechnerischen Irreduzibilität notwendigerweise impliziert, dass es Bereiche gibt, in denen zumindest bestimmte Dinge regelmäßig und vorhersagbar sind. Und es ist innerhalb dieser Bereiche der Vorhersagbarkeit, wo die Wissenschaft fundamental existiert – und tatsächlich versuchen wir, mit der Welt zu operieren und zu interagieren.

Wie steht es also um die Künstliche Intelligenz? Die Entwicklung trainierter neuronaler Netze, die hier besprochen wurde, basiert auf dem Nutzen rechnerischer Vorhersagbarkeit. Diese Form der Vorhersagbarkeit entspricht auf interessante Weise den Prozessen, die auch der menschliche Verstand anwendet. In der Vergangenheit war der Hauptweg, um rechnerische Vorhersagbarkeit zu erfassen – und davon zu profitieren –, formale Wege zu entwickeln, um Dinge zu beschreiben, typischerweise unter Verwendung von Mathematik und mathematischen Formeln. KI bietet effektiv eine neue Möglichkeit, rechnerische Vorhersagbarkeit zu nutzen. Normalerweise gibt es keine menschliche Narrative dazu, wie es funktioniert; es ist einfach so, dass irgendwie innerhalb eines trainierten neuronalen Netzes bestimmte Regelmäßigkeiten erfasst werden, die es uns ermöglichen, bestimmte Vorhersagen zu treffen.

In gewissem Sinne neigen die Vorhersagen dazu, sehr "menschlich" zu sein, oft wirken sie "ungefähr richtig" für uns, auch wenn sie auf der Ebene präziser formaler Details nicht ganz richtig sind. Und grundsätzlich verlassen sie sich auf rechnerische Vorhersagbarkeit – und wenn rechnerische Irreduzibilität vorhanden ist, scheitern sie mehr oder weniger unvermeidlich. In gewissem Sinne führt die KI "oberflächliche Berechnungen" durch, aber bei rechnerischer Irreduzibilität benötigt man irreduzible, tiefe Berechnungen, um herauszufinden, was passieren wird.

Und es gibt viele Bereiche – selbst beim Arbeiten mit traditionellen mathematischen Strukturen –, wo das, was KI tut, nicht ausreichen wird für das, was von der Wissenschaft erwartet wird. Aber es gibt auch Bereiche, wo "KI-Stil-Wissenschaft" Fortschritte machen kann, auch wenn traditionelle Methoden nicht können. Wenn man etwas wie das Lösen einer einzelnen Gleichung (sagen wir, eine ODE) präzise macht, ist KI wahrscheinlich nicht das beste Werkzeug. Aber wenn man eine große Sammlung von Gleichungen hat (sagen wir für etwas wie Robotik), kann KI erfolgreich in der Lage sein, eine nützliche "grobe Schätzung" dessen zu geben, was passieren wird, selbst wenn traditionelle Methoden völlig in Details stecken bleiben würden.

Es ist ein allgemeines Merkmal von Machine-Learning- und KI-Techniken, dass sie sehr nützlich sein können, wenn eine ungefähre ("80 %") Antwort gut genug ist. Aber sie tendieren dazu zu scheitern, wenn etwas präziser und "perfekter" benötigt wird. Und es gibt ziemlich viele Arbeitsabläufe in der Wissenschaft (und wahrscheinlich mehr, die identifiziert werden können), wo genau das benötigt wird. "Kandidatenfälle für etwas auswählen". "Ein Merkmal identifizieren, das wichtig sein könnte". "Eine mögliche Frage zum Erkunden vorschlagen".

Es gibt klare Grenzen, insbesondere wann immer rechnerische Irreduzibilität vorliegt. In gewissem Sinne beinhaltet der typische KI-Ansatz zur Wissenschaft nicht explizit "Dinge zu formalisieren". Aber in vielen Bereichen der Wissenschaft ist Formalisierung genau das, was am wertvollsten war, und was Türme von Ergebnissen ermöglicht hat. Und in letzter Zeit haben wir die kraftvolle neue Idee, Dinge rechnerisch zu formalisieren – und insbesondere computergestützte Sprache dafür zu nutzen.

Und mit einer solchen rechnerischen Formalisierung sind wir in der Lage, irreduzible Berechnungen zu starten, die uns Entdeckungen erreichen lassen, die wir nicht vorhersehen können. Wir können unter anderem mögliche rechnerische Systeme oder Prozesse aufzählen und "grundlegende Überraschungen" sehen. In typischer KI gibt es Zufälligkeit, die uns einen gewissen Grad an "Originalität" in unserer Erkundung gibt. Aber es ist von einem grundsätzlich niedrigeren Niveau, als wir mit tatsächlichen irreduziblen Berechnungen erreichen können.

Was können wir also von der KI in der Wissenschaft in Zukunft erwarten? Wir haben in gewissem Sinne eine neue – und eher menschenähnliche – Möglichkeit, rechnerische Vorhersagbarkeit zu nutzen. Es ist ein neues Werkzeug für die Wissenschaft, bestimmt, viele praktische Anwendungen zu haben. In Bezug auf das fundamentale Potenzial für Entdeckungen verblassen sie jedoch im Vergleich zu dem, was wir aus dem rechnerischen Paradigma und aus irreduziblen Berechnungen, die wir durchführen, aufbauen können. Aber wahrscheinlich wird uns die größte Möglichkeit, die Wissenschaft voranzubringen, die Kombination der Stärken von KI und des formalen rechnerischen Paradigmas bieten. Was, ja, Teil dessen ist, was wir in den letzten Jahren mit der Wolfram Language und ihren Verbindungen zum maschinellen Lernen und jetzt LLMs energisch verfolgt haben.

Mein Ziel war es, meine derzeitigen Überlegungen über das grundlegende Potenzial (und die Grenzen) der KI in der Wissenschaft zu skizzieren. Ich habe meine Ideen entwickelt, indem ich die Wolfram Language und ihre KI-Funktionen für verschiedene einfache Experimente verwendet habe. Ich betrachte das, was ich hier getan habe, nur als einen Anfang. Im Grunde könnte jedes Experiment viel detaillierter und mit viel mehr Analysen durchgeführt werden. (Und klicken Sie einfach auf ein beliebiges Bild, um die Wolfram Language aufzurufen, mit der es gemacht wurde, damit Sie es wiederholen oder erweitern können).

"Künstliche Intelligenz in der Wissenschaft" ist heutzutage in der ganzen Welt ein heißes Thema, und ich bin mir sicher, dass ich nur einen kleinen Teil von all dem kenne, was gemacht worden ist. Ich selbst habe mich darauf konzentriert, "die offensichtlichen Experimente durchzuführen" und zu versuchen, mir ein Bild von dem zu machen, was vor sich geht. Ich sollte betonen, dass es in letzter Zeit einen regelmäßigen Strom herausragender und beeindruckender echnischer Innovationen im Bereich der KI gegeben hat. Ich wäre überhaupt nicht überrascht, wenn Experimente, die für mich nicht gut funktioniert haben, durch künftige derartige Innovationen dramatisch verbessert werden könnten, was möglicherweise sogar meine Schlussfolgerungen aus dem "großen Bild" verändern würde.

Ich muss mich auch entschuldigen. Obwohl ich – wenn auch oft nur "durch die Gerüchteküche" – von vielen Dingen erfahren habe, die sich mit "KI in der Wissenschaft" befassen, vor allem im letzten Jahr, habe ich keinen ernsthaften Versuch unternommen, die Literatur auf diesem Gebiet systematisch zu studieren. Ich habe es auch nicht versucht, seine Geschichte und die Herkunft der Ideen darin nachzuvollziehen.
Ich muss es also anderen überlassen, Verbindungen zwischen dem, was ich hier getan habe, und dem, was andere Leute anderswo getan haben (oder auch nicht), herzustellen. Es wäre faszinierend, eine ernsthafte Analyse der Geschichte der KI in der Wissenschaft vorzunehmen, aber dazu hatte ich bisher keine Gelegenheit.

Bei meinen Bemühungen wurde ich in hohem Maße von den Wolfram Institute-Stipendiaten Richard Assar ("Ruliad Fellow") und Nik Murzin ("Fourmilab Fellow") unterstützt. Ich bin auch den vielen Menschen dankbar, mit denen ich in letzter Zeit über KI in der Wissenschaft (und verwandte Themen) gesprochen oder von ihnen gehört habe, darunter Giulio Alessandrini, Mohammed AlQuraishi, Brian Frezza, Roger Germundsson, George Morgan, Michael Trott und Christopher Wolfram.

Ein Hinweis: Wenn Sie im englischsprachigen Originalartikel "Can AI Solve Science?" auf ein beliebiges Diagramm klicken, erhalten Sie den Code in Wolfram Language, um die Ergebnisse zu reproduzieren. Der Code zum Trainieren der verwendeten neuronalen Netze ist ebenfalls verfügbar (setzt eine GPU voraus).

(vza)