Kinect & Co. als 3D-Scanner

Seite 2: Punktiert

Um die Objekte vor sich plastisch zu erfassen, projizieren die Tiefenkameras mit einem Infrarot-Laser ein Punktmuster in den Raum. Gegenstände, Personen und Wände reflektieren diese Punkte. Ein Infrarotsensor in der Tiefenkamera registriert wiederum diese Reflexionen. Er sitzt um etwa 7,5 Zentimeter versetzt im Gehäuse und erfasst die Szene deshalb aus einem etwas anderen Winkel. Die Folge: Je näher sich ein Objekt an der Kamera befindet, desto stärker erscheinen die von ihm reflektierten Punkte verschoben. Die Software vergleicht das aufgenommene Punktmuster mit einem Referenzmuster, identifiziert die verschobenen Punkte und berechnet daraus die Tiefenkoordinaten – und zwar alles live.

Kinect Prinzip Lichtmuster — Der Infrarotlaser (rot) zeichnet ein Punktmuster auf die Szene, das der weiter links sitzende Sensor aufnimmt (grün). Die Reflexionen von näher an der Kamera befindlichen Oberflächen erscheinen nach rechts verschoben.

Die fallen allerdings recht grob aus. Zum einen arbeitet der Infrarotsensor lediglich mit einer Auflösung von 320 × 240 Pixeln. Zum anderen schrumpfen die Verschiebungen mit wachsendem Abstand zum Gegenstand, was die Messung zusätzlich ungenau macht. Deshalb begnügt sich keine Scan-Software mit einem einzelnen 3D-Schnappschuss. Vielmehr kombinieren sie allesamt Serien von Aufnahmen aus leicht unterschiedlichen Blickwinkeln zu einem zusammenhängenden 3D-Modell.

Rekonstruierte Bewegung

Dafür muss der Software das Kunststück gelingen, aus den 3D-Daten aufeinanderfolgender Schnappschüsse die Bewegung der Tiefenkamera durch den Raum zu rekonstruieren und simultan die Punktkoordinaten einzelner Datensätze so aneinander auszurichten, dass sich die darin erfassten Formen möglichst widerspruchsfrei ergänzen. Dabei überlässt die Software die Hauptarbeit der Grafikkarte, weshalb die Hardware-Anforderungen der Anwendungen in diesem Punkt ziemlich hoch sind. Wenn es gut läuft, verfestigt und verfeinert sich aus vielen einzelnen 3D-Aufnahmen im Lauf eines Scans ein detailliertes Datenmodell des Objekts oder der Szene vor der Tiefenkamera.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.

Videos immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Das klappt aber nur, wenn sich im Lauf des Scans nichts in der aufgenommenen Szene verändert, denn widersprüchliche Datensätze bringen die Software schnell aus dem Konzept. Möchte man beispielsweise eine Person dreidimensional erfassen, muss sie ihre Positur und auch ihren Gesichtsausdruck zwischen zehn Sekunden und ein paar Minuten lang unbewegt beibehalten können.

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}