Was guckst Du?

Eine iPhone-Anwendung bestimmt per Audioerkennung, welche Sendung Nutzer gerade im Fernsehen anschauen - und knüpft daraus ein soziales Netzwerk.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 4 Min.
Von
  • Duncan Graham-Rowe

Eine iPhone-Anwendung bestimmt per Audioerkennung, welche Sendung Nutzer gerade im Fernsehen anschauen – und knüpft daraus ein soziales Netzwerk.

Im Wohnzimmer allein vor dem Fernseher zu sitzen könnte bald zu einer geselligeren Angelegenheit werden, wenn es nach dem Start-up IntoNow geht: Die US-Firma hat gerade eine iPhone-Anwendung herausgebracht, mit der sich herausfinden lässt, welche Sendung gerade läuft. Dazu genügend es, der App nur wenige Sekunden Tonmaterial vorzuspielen. Doch das ist nicht alles: Einmal ermittelt, kann man seinen aktuellen TV-Konsum auf Knopfdruck auch seinen Freunden mitteilen – wenn sie die IntoNow-Anwendung selbst nutzen oder im persönlichen Netzwerk bei Facebook und Twitter sind.

"Die Leute reden schon jetzt darüber, was sie letzten Abend alles gesehen haben. Entsprechend hat Fernsehen bereits eine soziale Komponente", meint Adam Cahan, Gründer und Chef von IntoNow. Seine Firma konzentriere sich nun darauf, Menschen miteinander in Kontakt zu bringen, die einen ähnlichen TV-Geschmack hätten. Die App erlaubt nun einen Überblick darüber, was die Freunde gerade sehen oder gesehen haben. Hierüber lässt sich dann eine Diskussion über die integrierte Social-Networking-Einbindung anstoßen.

Die durchaus eindrucksvolle Audioerkennung arbeitet mit dem sogenannten SoundPrinting-Verfahren, das bei IntoNow entwickelt und patentiert wurde. Zum Ermitteln der Sendungen nutzt IntoNow die sogenannte Spektralanalyse, bei der Klangmuster erfasst und unterschieden werden können. Jede TV-Show erhält eindeutige Unterscheidungsmerkmale, die dann sehr schnell online mit der Probe vom Telefon des Nutzers verglichen werden können. "Unser Katalog enthält alles, was in den USA in den letzten fünf Jahren im Fernsehen war", sagt Cahan. Fast 266 Jahre Inhalt seien das zusammen oder auch 140 Millionen Minuten.

Bislang war dieses "Tagging" von Klängen vor allem im Musikbereich bekannt. Firmen wie Shazam erlauben es seit längerem, per Smartphone einen Song zu identifizieren, der gerade im Radio oder im TV läuft. Hier reichen ebenfalls wenige Sekunden, um unter rund 10 Millionen Titeln den richtigen zu erfassen.

IntoNow geht aber noch weiter: Die Datenbank wird in Echtzeit gefüllt. Läuft gerade ein Live-Sportwettkampf oder die neueste Episode einer Serie, kann diese auch schon erkannt werden. "Das haben wir kürzlich mit der Super Bowl gemacht", sagt Cahan. Selbst Nachrichtensendungen erkennt IntoNow. 130 unterschiedliche Stationen werden ständig erfasst, die Spektralanalyse der Tonspur erfolgt dabei bis zu 20 Mal pro Sekunde, wie Rob Johnson, Architekt hinter der Technologie, erläutert. Wenn jemand die App verwendet, kann er das also auch mit völlig neuen Inhalten tun, solange diese gerade laufen.

"Wenn die App unseren Index durchsucht, wird nicht etwa übermittelt, wie das Programm heißt." Stattdessen werde Kanal und Uhrzeit ermittelt und daraus dann auf den Sendungsnamen und die präzise Episode geschlossen. Marie-José Montpetit, die im Bereich "Social TV" am MIT forscht, meint, dass IntoNow nicht die einzige Firma sei, die so vorgehen wolle. "Die Erkennung von Live-Sendungen ist aber ein Vorteil. Das ist ein nettes Gimmick, das abheben könnte." Den Fernsehkonsum werde IntoNow aber wohl kaum grundlegend ändern.

Und dennoch: Zumindest die Art, wie Werbetreibende momentan ihre Spots schalten, könnten die von IntoNow erfassten Daten beeinflussen. So lässt sich auch bestimmen, welche Teile einer Sendung die meisten Nutzer ansehen, sagt Firmenchef Cahen. "Das gibt den Leuten sogar die Möglichkeit, auszudrücken, dass sie eine bestimmte Werbung mögen."

Montpetit wirft allerdings ein, dass die Audioerkennung aus dem Wohnzimmer auch Datenschutzbedenken hervorrufen könnte. IntoNow-Architekt Johnson wiegelt ab: "Wir nehmen den Sound ja nicht auf, sondern analysieren ihn nur." Eine nachträgliche Rekonstruktion in hörbare Signale sei nicht möglich. (bsc)