IFA

Heinrich-Hertz-Institut zeigt erweiterte Bildtelefonie

Das Heinrich-Hertz-Institut will auf der Internationalen Funkausstellung ein eigenes Verfahren vorstellen, das auf MPEG4-Streaming gründet und Video-Telefonate über schmalbandige Mobilfunkanbindungen ermöglicht.

In Pocket speichern vorlesen Druckansicht 16 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Dusan Zivadinovic

Das Heinrich-Hertz-Institut will in Berlin auf der Internationalen Funkausstellung ein eigenes Verfahren vorstellen, das auf MPEG4-Streaming gründet und Video-Telefonate über schmalbandige Mobilfunkanbindungen ermöglicht. Das System ist eines von zahlreichen Exponaten, die die Berliner Nachrichtentechniker unter dem Motto Interaktiv sehen in Halle 5.3 während der IFA vom 29. August bis 3. September 2003 zeigen wollen.

"Wir haben einen MPEG4-Player entwickelt, mit dem Kopf-Schulter-Szenen auch bei Datenraten von wenigen kBit/s übertragen werden können", meint Dr. Peter Eisert vom HHI. Damit lassen sich Mimik, Mundbewegung und Sprache selbst auf Handys und Pocket-PCs übertragen, die über Netze mit geringen Datenraten angebunden sind. Der Trick der Forscher: Statt die Sequenz mit herkömmlichen Verfahren wie MPEG2 direkt zu komprimieren, wird zu Beginn des Gesprächs einmalig ein 3D-Computermodell der Person übertragen. Im Folgenden reichen 3D-Bewegungs- und Mimikparameter aus den Kameraansichten aus, um einen "lebensecht" erscheinenden Sprecher darzustellen -- das synthetische Gesicht schmunzelt, lacht oder reagiert mit fragendem Blick wie das eigentliche Gesicht des Gesprächspartners auf das zuletzt Gesagte; die Stimme erklingt aus dem Handy-Lautsprecher synchron zur Mimik.

Basis dafür sind am HHI entwickelte Algorithmen zur Analyse und Visualisierung von Gesichtsmimik und 3D-Bildern. Außerdem setzen die Forscher ein neuartiges MPEG4-Streaming ein, das die Echtzeitdarstellung von Videodaten und 3D-Szenenstrukturen unterstützt. Die Modelle lassen sich sogar beliebig austauschen -- so kann eine Person mit den Bewegungen einer anderen dargestellt werden, sodass sich der anrufende Nachbar etwa mit dem Gesicht eines Politikers meldet. Auch aktuelle Nachrichtensendungen und andere Animationen können so in guter Qualität auf tragbaren Endgeräten gezeigt und etwa von einer virtuellen Freundin vorgelesen werden.

Darüber hinaus lassen sich virtuelle Agenten und benutzerfreundliche Mensch-Maschine-Schnittstellen entwickeln -- zum Beispiel für die Kommunikation mit dem Computer, die dann nicht mehr per Maus, Tastatur und Textmeldungen erfolgt, sondern in einem natürlich Dialog. Ein weiterer Vorteil der Technik dürfte darin liegen, dass der Computer Reaktionen und Emotionen des Anwenders erkennen und berücksichtigen kann. Die dreidimensionale Vermessung von Gesichtsmimik ließe sich aber auch in der Medizin einsetzen, etwa für die Diagnose. (dz)