Sprache "Picture": 3D-Gesichter mit 50 Zeilen Code

Forscher des Massachusetts Institute of Technology haben eine probabilistische Programmiersprache vorgestellt, in der sie mit weniger als 50 Zeilen Code einen Algorithmus zur Rekonstruktion eines 3D-Modells aus Bildern von Gesichtern schreiben konnten.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
Sprache "Picture": 3D-Gesichter mit 50 Zeilen Code

Oben das Original, in der Mitte ein Rendering des rekonstruierten Gesichts. Unten das Ergebnis eines bestehenden Algorithmus zur Gesichtsrekonstruktion.

(Bild: Tejas D Kulkarni et al.)

Lesezeit: 1 Min.

Tejas Kulkarni und sein Team vom Massachusetts Institute of Technology haben eine probabilistische Programmiersprache speziell für die Anforderungen von Bildverarbeitung geschaffen, wie die Universität mitteilt. Die Sprache namens "Picture" baut auf der Programmiersprache Julia auf, ebenfalls eine probabilistische Programmiersprache des MIT.

Mit Picture soll der Ansatz der probabilistischen Programmierung erstmals auf Probleme der Bilderkennung anwendbar werden. Als Beleg verweisen die Forscher auf ihren Algorithmus mit weniger als 50 Zeilen Quellcode, der aus Bildern von Gesichtern dreidimensionale Modelle rekonstruieren kann. Prinzipiell ist die Möglichkeit, Gesichter zu rekonstruieren, nicht neu. Interessant ist aber, dass Picture im Algorithmus nur eine vage Beschreibung braucht und einen großen Teil der Besonderheiten menschlicher Gesichter selbst aus Beispielen lernen kann.

Die rekonstruierten Gesichter können dank des 3D-Modells aus anderen Perspektiven oder mit geänderter Beleuchtung dargestellt werden.

(Bild: Tejas D Kulkarni et al.)

Für viele Probleme existieren Beispiele, aus denen ein Programm mit maschinellem Lernen Schlüsse ziehen könnte. Bei der probabilistischen Programmierung wird versucht, diese Möglichkeit mit konventioneller Programmierung zu kombinieren. Für die Rekonstruktion geben die Entwickler an, das Gesicht als zwei symmetrische Objekte (Augen) und zwei zentral angeordnete Objekte (Nase und Mund) darunter definiert zu haben. "Wenn man über probabilistische Programme nachdenkt, denkt man sehr intuitiv, während man modelliert", kommentiert Kulkarni die Arbeit mit der neuen Sprache. "Es ist ein anderer Stil der Modellierung."

Das Team vom MIT will seine Forschung im Juni auf der ComputerVision and Pattern Recognition Konferenz präsentieren. (pmk)