Mit Einstein-Lichtkegeln zu besseren KI-Vorhersagen

Computer verstehen nicht viel von Ursache und Wirkung. Doch mit Hilfe der speziellen Relativitätstheorie könnten sie trotzdem zielgenauere Prognosen treffen.

In Pocket speichern vorlesen Druckansicht 71 Kommentare lesen
Mit Einstein-Lichtkegeln zu besseren KI-Vorhersagen

(Bild: Étienne-Jules Marey / PD)

Lesezeit: 9 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Niemand kann wirklich wissen, was die Zukunft bringt, aber manche Prognosen sind treffsicherer als andere. So wird ein getretener Fußball nicht mitten im Flug umdrehen und zum Spieler zurückkehren und ein halb aufgegessener Cheeseburger nicht wieder zu einem ganzen. Auch ein gebrochener Arm wird am nächsten Morgen noch nicht geheilt sein.

Zumindest solche Prognosen sollen auch künstlich intelligente Computer abgeben können. Forscher am Imperial College London haben jetzt eine Idee vorgestellt, wie sie besser darin werden könnten – mit einem Konzept, das auf Einsteins spezieller Relativitätstheorie beruht.

Die Welt entwickelt sich Schritt für Schritt weiter. Jeder Moment geht aus den vorherigen hervor. Wir können relativ gut abschätzen, was als Nächstes passiert, weil wir starke Intuitionen über Ursache und Wirkung haben. Diese sind entstanden in den Jahren, in denen wir die Welt seit unserer Geburt beobachten und diese Informationen mit Gehirnen verarbeiten, die sich über Millionen Jahre Evolution entwickelt haben.

Computer dagegen tun sich schwer mit dem Erkennen von Kausalzusammenhängen. Modelle für maschinelles Lernen sind hervorragend darin, Korrelationen festzustellen, können aber kaum erklären, warum auf ein Ereignis ein bestimmtes anderes folgen sollte. Das Problem dabei ist, dass Prognosen ohne jede Vorstellung von Ursache und Wirkung weit danebenliegen können. Ein Fußball könnte dann sozusagen doch mitten im Flug die Richtung wechseln.

Besonders heikel ist das auf dem Gebiet von medizinischen Diagnosen mit Hilfe künstlicher Intelligenz. Oft gehen Krankheiten mit mehreren Symptomen einher. So sind viele Menschen mit Typ-2-Diabetes auch übergewichtig und kurzatmig. Aber die Atemprobleme werden nicht von der Diabetes ausgelöst, also wird eine Behandlung mit Insulin daran nichts ändern. Der KI-Community wird angesichts solcher Überlegungen zunehmend klar, wie wichtig kausale Schlussfolgerungen für Maschinenlernen sein könnten. Ihre Mitglieder suchen fieberhaft nach Wegen, um sie zu ermöglichen.

Dafür gab es in der Vergangenheit verschiedene Ansätze. So wurde ein Maschinenlern-Modell Einzel-Bild (Frame) für Einzel-Bild darauf trainiert, in einem Geschehen Muster zu erkennen. Zum Beispiel könnte eine KI einige Frames mit einem Zug zu sehen bekommen, der aus einem Bahnhof abfährt, und dann die weitere Entwicklung dieser Sequenz generieren.

Für wenige Folge-Bilder sind Computer dazu gut in der Lage, berichtet Athanasios Vlontzos vom Imperial College London – aber nach fünf bis zehn Frames lasse die Treffsicherheit rapide nach. Denn KI nutzt jeweils die vorigen, um das nächste Bild in einer Sequenz zu berechnen. Dadurch potenzieren sich frühe kleine Fehler wie einige falsche Pixel immer stärker.

Zusammen mit Kollegen hat Vlontzos deshalb einen anderen Ansatz gewählt. Ihre KI sollte nicht mehr lernen, anhand von Millionen Video-Clips direkt eine bestimmte Sequenz von weiteren Bildern vorherzusagen. Stattdessen war die Aufgabe, auf dieser Basis viele verschiedene Entwicklungen vorherzusagen und dann diejenigen auszuwählen, deren Eintreten am wahrscheinlichsten ist. Auf diese Weise kann die Maschine die Zukunft erraten, ohne irgendetwas über den Zeitverlauf gelernt zu haben, sagt der Forscher.

Dazu entwickelte das Team einen Algorithmus, der vom Konzept des Lichtkegels inspiriert ist. Damit werden die Grenzen von Ursache und Wirkung in der Raum-Zeit beschrieben, eingeführt in Einsteins spezieller Relativitätstheorie und später ausgearbeitet von seinem früheren Professor Hermann Minkowski. Lichtkegel in der Physik gibt es, weil die Lichtgeschwindigkeit konstant ist. Sie zeigen die zunehmende zeitliche Ausbreitung eines Lichtstrahls (und alles anderen) ausgehend von einem bestimmten Ereignis wie einer Explosion.

Zur Veranschaulichung können Sie einen Punkt auf ein Blatt Papier und dann einen Kreis um dieses Ereignis herum zeichnen. Die Entfernung zwischen Punkt und Kreis-Linie entspricht der Distanz, die Licht in einer bestimmten Zeit zurückgelegt hat, zum Beispiel in einer Sekunde. Weil nichts, nicht einmal Information, schneller sein kann als das Licht, ist die Linie eine harte Grenze für die kausalen Auswirkungen des ersten Ereignisses. Grundsätzlich könnte alles innerhalb des Kreises davon ausgelöst worden sein, alles außerhalb nicht mehr.

Nach zwei Sekunden ist das Licht doppelt so weit gekommen, und der Kreis hat sich verdoppelt – es gibt jetzt viel mehr mögliche Zukünfte nach dem ersten Ereignis. Stellen Sie sich vor, solche immer größeren Kreise würden jede Sekunde aus dem Blatt Papier herauswachsen: Dann haben Sie einen auf dem Kopf stehenden Kegel, dessen Spitze der darauf gezeichnete Punkt bildet – einen Lichtkegel. Ein zweiter Kegel kann sich unterhalb des Papiers ausbreiten und steht für alle Vergangenheiten, die zu dem Ereignis geführt haben könnten.

Mit diesem Konzept haben Vlontzos und Kollegen eingeschränkt, welche Zukunftsbilder die KI auswählt. Sie testeten ihre Idee anhand von zwei Daten-Sammlungen: Moving MNIST, bestehend aus kurzen Video-Clips mit handgeschriebenen Ziffern, die sich auf einem Bildschirm bewegen, und KTH Human Action Series, in der Menschen gehen oder mit den Armen winken. In beiden Fällen wurde die KI darauf trainiert, Frames zu generieren, die denjenigen in der Sammlung ähnlich sind. Wichtig dabei aber: Die Frames der Trainingsdaten wurden nicht als Sequenz gezeigt, und der Algorithmus lernte nicht, eine Reihe zu vervollständigen.

Im nächsten Schritt sollte die KI auswählen, welche Bilder mit höherer Wahrscheinlichkeit aufeinander folgen würden. Dazu gruppierte sie generierte Frames nach Ähnlichkeit und benutzte dann den Lichtkegel-Algorithmus, um eine Grenze um diejenigen zu ziehen, die in kausalem Zusammenhang mit dem jeweiligen Frame stehen könnten. Obwohl sie nicht auf Fortsetzungen trainiert war, konnte die KI dabei gut abschätzen, was folgen würde. Laut Vlontzos würde sie Bilder einer Person mit langen Haaren oder ohne Hemd zurückweisen, wenn sie vorher einen Frame mit einer Person mit kurzen Haaren und Hemd gesehen hätte. Die Arbeit wird derzeit für eine Vorstellung bei der Maschinenlern-Konferenz NeurIPS überprüft.

Ein Vorteil des Ansatzes ist, dass er mit unterschiedlichen Arten von Maschinenlernen funktionieren könnte; das Modell muss nur jeweils neue Frames generieren können, die denen in den Übungsdaten ähneln. Außerdem könnte sich damit die Genauigkeit von bestehenden Systemen verbessern lassen, die auf Video-Sequenzen trainiert sind. Für seine Tests ließ das Team um Vlontzos die Kegel mit einer festen Rate größer werden, was nicht der Realität entspricht. So hat ein Ball auf einem Fußball-Feld mehr mögliche Zukünfte als einer, der sich auf Schienen fortbewegt. Im ersten Fall bräuchte man deshalb einen schneller wachsenden Kegel.

Um diese Geschwindigkeiten zu bestimmen, müsste man tief in die Thermodynamik eintauchen, was nicht praktikabel ist. Einstweilen geben die Forscher den Kegel-Durchmesser deshalb per Hand vor. Doch indem die KI ein Fußballspiel ansieht, könnte sie auch lernen, wie weit und schnell sich Objekte darin bewegen, und so selbst die richtige Größe für den Kegel finden. Das könnte sogar dynamisch geschehen, wenn sich das reale System verändert.

Die Zukunft vorherzusagen, ist für viele Anwendungen wichtig. Autonome Autos müssen vorhersagen, ob ein Kind auf die Straße laufen wird oder ob ein wackliger Fahrradfahrer in Gefahr ist. Wenn Roboter mit physischen Objekten interagieren, müssen sie wissen, wie diese reagieren, wenn sie bewegt werden. Allgemein werden prädiktive Systeme treffsicherer, wenn sie Überlegungen zu Ursache und Wirkung anstellen statt nur zu Korrelationen.

Vlonzos und Kollegen interessieren sich vorerst vor allem für die Medizin. Hier könnte eine KI simulieren, wie ein Patient auf eine bestimmte Therapie reagiert – indem sie Schritt für Schritt seine mögliche Entwicklung simuliert. "Wenn man all diese möglichen Ergebnisse generiert, kann man die Auswirkungen eines Medikaments auf die Krankheit sehen", erklärt der Forscher. Der Ansatz lasse sich auch für medizinische Bilder nutzen: Anhand eines MRT-Scans vom Gehirn könnte ein System vorhersagen, wie sich eine Krankheit weiter entwickeln dürfte.

"Es ist sehr cool, dass für so etwas Konzepte aus der Grundlagenforschung in der Physik eingesetzt werden", sagt Ciaran Lee, der bei Spotify und am University College London an kausalen Maschinen-Schlussfolgerungen arbeitet. Eine Vorstellung von Kausalität sei sehr wichtig, wenn es um Aktionen oder Entscheidungen in der echten Welt gehe. "Wenn Sie je die Frage nach dem Warum stellen wollen, müssen Sie Ursache und Wirkung verstehen", sagt Lee. (sma)