Ein Blick genügt: Objektidentifizierung per Eyetracking

Forscher des Deutschen For­schungs­zentrums für Künstliche Intelligenz (DFKI) haben ein Fahrer­assis­tenz­system entwickelt, das Infor­mationen über Gebäude gibt, indem man sie einfach nur anschaut

vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 5 Min.
Von
  • Gernot Goppelt
Inhaltsverzeichnis

Saarbrücken, 2. September 2012 – Forscher des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) haben ein neuartiges Fahrerassistenzsystem entwickelt, das einem Autoinsassen Informationen über Gebäude gibt, indem er sie einfach nur anschaut. Das so genannte „EyeBox“-System nutzt die Eyetracking-Technik, um die Blickrichtung eines Insassen zu überwachen. Sobald diese Person zum Beispiel fragt „Was ist das für ein Gebäude?“ oder „Was ist das für ein Denkmal“, ordnet das System die Blickrichtung dem Objekt zu, indem es die Position des Fahrzeugs und die Blickrichtung mit vorliegendem 3D-Kartenmaterial abgleicht.

Eine wesentliche Innovation der Technik liegt in den Erkennungsalgorithmen, denn das System kommt ohne Sensoren wie etwa Laser aus, mit denen sich die Entfernung angeschauter Objekte berechnen ließe. Die Identifizierung des betrachteten Objekts erfolgt rein virtuell, wobei die 3D-Daten von Gebäuden eine entscheidende Hilfe sind. Der Algorithmus sorgt dafür, dass gewissermaßen virtuelle Messstrahlen in die zuvor ermittelte Blickrichtung geworfen werden. Anhand von im Kartenmaterial hinterlegten 3D-Informationen wie Breite oder Höhe wird dann eine Plausibilitätsprüfung vorgenommen, welches Objekt gemeint ist. Denn besonders bei enger Bebauung in der Stadt lässt sich aus dem 3D-Kartenmaterial recht zuverlässig errechnen, welche Objekte überhaupt im Blickfeld liegen. Beispielsweise kann der Algorithmus mithilfe der virtuellen Vermessung feststellen, dass das hinter Gebäude A liegende Gebäude B nicht gemeint sein kann, weil es von ersterem verdeckt wird.

Ein Blick genügt: Objektidentifizierung per Eyetracking (3 Bilder)

Ein Eyetracking-System überwacht permanent die Blickrichtung des Beifahrers.

(Bild: DFKI)

Prinzipiell könnte das System allerdings auch ohne 3D-Informationen funktionieren, sofern die Dichte von möglichen Points of Interest (POI) nur niedrig genug ist. Wenn man beispielsweise links im Feld eine Kapelle sieht und sonst ist weit und breit nichts zu sehen, kann ziemlich zuverlässig unterstellt werden, dass man an dieser Kapelle interessiert ist, wenn man die Frage stellt „Was ist das für ein Gebäude?“ Für ihre Fahrtests in einem modifizierten BMW-Modell verwenden die Forscher derzeit selbst erstellte 3D-Daten, die das Umfeld des Forschungszentrums abdecken. Es wäre allerdings naheliegend, Datenmaterial wie jenes von Google Maps zu nutzen, das ohnehin bereits für Navigationszwecke eingesetzt wird. Sollte sich eine Applikation wie EyeBox durchsetzen, würden die schon jetzt recht ausführlichen 3D-Daten in Google Maps wohl schnell rapide wachsen.