Software findet Zitate in Videos

Das Fraunhofer-Institut fĂĽr Medienkommunikation IMK hat eine Software namens iFinder entwickelt, die Videos automatisch analysiert und archiviert.

vorlesen Druckansicht 18 Kommentare lesen
Lesezeit: 2 Min.
Damit knackige Politiker-Zitate nicht in Vergessenheit geraten, hat das Fraunhofer-Institut für Medienkommunikation IMK (Halle 11, Stand A24) eine Software namens iFinder entwickelt, die Videos automatisch analysiert und archiviert: Dabei werden am Institut entwickelte Gesichts- und Spracherkennungsverfahren eingesetzt, um die Personen zu identifizieren und deren Reden in Schrift zu fassen. Per Suchmaschine kann man später etwa nach "Schröder"-Reden zum Thema "Irak-Krieg" fahnden und sich die entsprechenden Videosequenzen nebst geschriebenem Wort nacheinander abspielen lassen.
Die auf der CeBIT gezeigte Spezialanwendung glänzt durch eine außerordentlich gute Texterkennung von annähernd 100 Prozent. Sie ist allerdings auf eine Besonderheit bei Bundestagsdebatten zurückzuführen: Der per Spracherkennung extrahierte Text wird anschließend mit den Protokollen der Sitzung gematcht -- ohne die "Amtshilfe" läge die Ausbeute nur bei etwa 75 Prozent, wie Projekt-Mitarbeiter Dr. Jobst Löffler im Gespräch mit c’t zugibt. Weitere Tests wurden mit Sendungen des WDR-Magazins Monitor durchgeführt, wo ebenfalls Protokolle zur Verfügung stehen.
Komplett vollautomatisch funktioniert die Software natürlich nicht: Sie muss vorher -- wie ein Mensch auch -- lernen, welches Gesicht und welche Stimme zu welchem Namen gehört. Die vom IMK gezeigte Lösung für Bundestagsdebatten etwa muss man zunächst mit entsprechendem Bild- und Tonmaterial auf die dort auftretenden Politiker trimmen. Nach Angaben von Löffler reichen etwa fünf Bilder, um den iFinder mit einer Person vertraut zu machen.
Bei der Entwicklung habe man den Schwerpunkt auf offene Standards gelegt. Die extrahierten Bild- und Textmerkmale werden in einem MPEG-7-Strom gespeichert; daneben kommen Java, XML und die Apache-Datenbank Xindice zum Einsatz.
Nach Auskunft von Projektmitarbeiter Dr. Joachim Köhler soll die Software ab Juli verfügbar sein. Geplant ist, einen SDK für Anwendungsentwickler zur Verfügung zu stellen, der nur die Indizierung, also die Extraktion der Gesichts- und Sprachmerkmale beherrscht. Der SDK soll ab 7000 Euro zu haben sein. Die komplette Lösung, wie sie auf der CeBIT zu sehen ist, inklusive Datenbank und Suchmaschine, soll etwa 30.000 Euro kosten.