Kinect & Co. als 3D-Scanner
Seite 2: Punktiert
Um die Objekte vor sich plastisch zu erfassen, projizieren die Tiefenkameras mit einem Infrarot-Laser ein Punktmuster in den Raum. Gegenstände, Personen und Wände reflektieren diese Punkte. Ein Infrarotsensor in der Tiefenkamera registriert wiederum diese Reflexionen. Er sitzt um etwa 7,5 Zentimeter versetzt im Gehäuse und erfasst die Szene deshalb aus einem etwas anderen Winkel. Die Folge: Je näher sich ein Objekt an der Kamera befindet, desto stärker erscheinen die von ihm reflektierten Punkte verschoben. Die Software vergleicht das aufgenommene Punktmuster mit einem Referenzmuster, identifiziert die verschobenen Punkte und berechnet daraus die Tiefenkoordinaten – und zwar alles live.
Die fallen allerdings recht grob aus. Zum einen arbeitet der Infrarotsensor lediglich mit einer Auflösung von 320 × 240 Pixeln. Zum anderen schrumpfen die Verschiebungen mit wachsendem Abstand zum Gegenstand, was die Messung zusätzlich ungenau macht. Deshalb begnügt sich keine Scan-Software mit einem einzelnen 3D-Schnappschuss. Vielmehr kombinieren sie allesamt Serien von Aufnahmen aus leicht unterschiedlichen Blickwinkeln zu einem zusammenhängenden 3D-Modell.
Rekonstruierte Bewegung
Dafür muss der Software das Kunststück gelingen, aus den 3D-Daten aufeinanderfolgender Schnappschüsse die Bewegung der Tiefenkamera durch den Raum zu rekonstruieren und simultan die Punktkoordinaten einzelner Datensätze so aneinander auszurichten, dass sich die darin erfassten Formen möglichst widerspruchsfrei ergänzen. Dabei überlässt die Software die Hauptarbeit der Grafikkarte, weshalb die Hardware-Anforderungen der Anwendungen in diesem Punkt ziemlich hoch sind. Wenn es gut läuft, verfestigt und verfeinert sich aus vielen einzelnen 3D-Aufnahmen im Lauf eines Scans ein detailliertes Datenmodell des Objekts oder der Szene vor der Tiefenkamera.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Das klappt aber nur, wenn sich im Lauf des Scans nichts in der aufgenommenen Szene verändert, denn widersprüchliche Datensätze bringen die Software schnell aus dem Konzept. Möchte man beispielsweise eine Person dreidimensional erfassen, muss sie ihre Positur und auch ihren Gesichtsausdruck zwischen zehn Sekunden und ein paar Minuten lang unbewegt beibehalten können.