Facebook lernt Physik mit Bildern

Künstliche-Intelligenz-Forscher bei Facebook haben einer Software mit Hilfe von vielen Beispiel-Bildern grundlegendes Wissen über Physik vermittelt. Derartiges Alltagswissen könnte Computer-Assistenten deutlich nützlicher machen.

vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 4 Min.
Von
  • Tom Simonite

Künstliche-Intelligenz-Forscher bei Facebook haben einer Software mit Hilfe von vielen Beispiel-Bildern grundlegendes Wissen über Physik vermittelt. Derartiges Alltagswissen könnte Computer-Assistenten deutlich nützlicher machen.

Wird der im Bild oben gezeigte Turm aus virtuellen Blöcken einstürzen? Facebook hat Software so trainiert, dass sie die Antwort auf diese Frage kennt.

Mit dem Projekt wollten Künstliche-Intelligenz-Forscher des Unternehmens erkunden, wie man Computer grundlegenden physikalischen Alltagsverstand verleihen kann. Das Verständnis darüber, dass Dinge ohne Unterlage herunterfallen oder dass größere Objekte nicht in kleinere hineinpassen, ist zentral für die Art und Weise, wie wir Menschen die Welt voraussagen und erklären und über sie kommunizieren. Wenn Maschinen nützlicher werden sollen, brauchen sie dieselbe Art von Alltagswissen, sagt Mike Schroepfer, der Chief Technology Officer von Facebook.

„Wir müssen Computersystemen beibringen, die Welt auf ähnliche Weise zu verstehen“, sagte Schroepfer Ende Oktober bei einer Vorschau auf die Ergebnisse, die er Anfang November beim Web Summit im irischen Dublin vorstellte.

Menschen lernen die Grundlagen der Physik schon im frühen Alter, indem sie spielen und die Welt beobachten. Auf ähnliche Weise hat Facebook bei dem neuen Projekt seine Software für Bildverarbeitung eingesetzt.

Der Lerneffekt der Software stellt sich ein, wenn sie Zugriff auf Bilder von virtuellen Stapeln wie dem obigen bekommt, zum Teil auch auf Stereo-Bilder wie von einem Augenpaar. In der Lernphase bekam sie viele unterschiedliche Stapel zu sehen, von denen einige zusammenfielen und andere nicht. Anhand der Simulationen konnte die Software erkennen, welche Stapel stabil sind und welche nicht. Nach genügend Beispielen sagte sie das Einstürzen mit 90 Prozent Trefferquote voraus. „Bei einer Reihe von Tests wird sie die meisten Menschen schlagen“, sagte Schroepfer.

Das Projekt wurde von der Facebook-Forschungsgruppe für Künstliche Intelligenz in New York betrieben. Die Gruppe beschäftigt sich vor allem mit der Entwicklung von Software, die Bilder und Sprache mit Hilfe einer Technik namens Deep Learning verstehen kann. Vergangene Woche zeigte die Gruppe zum Beispiel eine mobile App, die Fragen über den Inhalt von Fotos beantworten kann.

Das System zur Vorhersage einstürzender Türme zeige, dass sich mit komplexeren Simulationen möglicherweise auch grundlegendere Prinzipien der Physik vermitteln lassen, sagte Yann LeCun, Leiter der Gruppe und zugleich Professor an der New York University, gegenüber Technology Review. „Damit ist ein Ausgangspunkt geschaffen. Wir haben gezeigt, dass das System solche Sachen herausfinden kann, wenn wir es ohne Eingriffe trainieren lassen“, sagte er.

Zuvor hatte LeCuns Gruppe bereits ein System namens „Memory Network“ entwickelt, das einfache Geschichten liest und auf dieser Grundlage grundlegendes Alltagswissen und sprachlogisches Denken erlernt.

Mittlerweile trägt dieses System zu einem virtuellen Assistenten namens M bei, den Facebook derzeit testet. M kann deutlich mehr als Siri von Apple und ähnliche Apps, denn hinter ihm steht eine Reihe von menschlichen Helfern. Die allerdings sollen zunehmend weniger gebraucht werden, weil die Software lernt, Aufträge selbst abzuarbeiten.

Die Nutzung des Memory Network für M zeigt, wie das funktionieren könnte, sagt Schroepfer. Indem es Interaktionen zwischen den Nutzern von M und den Helfern im Hintergrund beobachtet, hat es bereits gelernt, einige häufige Anfragen eigenständiger zu beantworten.

Beispielsweise weiß das trainierte Gedächtnisnetz, dass die zwei wichtigsten Fragen „Wie viel wollen Sie ausgeben?“ und „Wohin sollen sie geschickt werden?“ lauten, wenn jemand eine Blumen-Lieferung beauftragt. Die menschlichen Mitarbeiter können mit einem einfachen Mausklick dafür sorgen, dass diese beiden Rückfragen automatisch gestellt werden. In Zukunft könnte das Gedächtnisnetz in der Lage sein, bestimmte Anfragen gänzlich automatisch zu erledigen, sagt Schroepfer.

Facebook hat sich noch nicht darauf festgelegt, M zu einem allgemein verfügbaren Produkt zu machen. Doch wie Schroepfer sagt, zeigen die bisherigen Ergebnisse, dass das möglich wäre. „Das System hat das nur dadurch herausgefunden, dass es die Menschen beobachtet“, sagt er. „Wir können es uns nicht leisten, Betreuer für die ganze Welt zu beschäftigen. Aber mit dem richtigen KI-System könnten wir es auf der gesamten Welt anbieten.“

(sma)