Suchmaschine lernt von Video-Portal

Wissenschaftler am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) haben eine Software entwickelt, die Videos aus Online-Protalen wie Youtube verwendet, um zu lernen, Inhalte zu klassifizieren.

In Pocket speichern vorlesen Druckansicht 7 Kommentare lesen
Lesezeit: 2 Min.

Wissenschaftler am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) haben eine Software entwickelt, die Videos aus Online-Protalen wie Youtube verwendet, um zu lernen, Inhalte zu klassifizieren. Das berichtet Technology Review in seiner [htto://www.heise.de/tr/magazin aktuellen Ausgabe] 03/08 (seit dem 21.2. am Kiosk oder online protokostenfrei zu bestellen).

Das von Adrian Ulges und Kollegen entwickelte prototypische System lernt mit Hilfe von statistischen Verfahren den Inhalt von Videos einzuordnen – mit welchen besonderen Merkmalen im Video also beispielsweise das Konzept "Fußball" verknüpft ist, indem es sich die Fußballvideos bei YouTube.com ansieht.

Das Problem, das Ulges und seine Kollegen zu lösen versuchen, beschäftigt nicht nur die akademische Forschung. Für Töne, Bilder und Videos fehlen noch immer hinreichend robuste und skalierbare Verfahren entwickelt, die bei einer Suche direkt den Inhalt anstatt virtuell draufgepappter Meta-Informationen auswerten. Dafür gilt es die sogenannte "semantische Lücke" zu schließen: Computer haben zwar keine Probleme damit, Charakteristika wie Farben, Kontraste und Konturen zu erfassen; aber mit Bildinhalten wie Personen, Tieren oder Autos, die Menschen auf einen Blick erkennen, haben sie noch erhebliche Schwierigkeiten.

Yahoo! arbeitet beispielsweise zusammen mit der Universität Berkeley an einer neuen Multimedia-Suche, die sich die in Online-Gemeinden wie Flickr vergebenen Tags zunutze macht. Das ist jedoch nicht unproblematisch, weil jeder Mensch Bilder und Töne individuell interpretiert und damit auch unterschiedliche Schlagworte dafür vergibt. Systematischer ist da der Ansatz, Bilder mittels maschineller Lernverfahren anhand von Beispielen zu kategorisieren. Derart trainierte Detektoren sind umso besser, je mehr Beispiele sie vorgelegt bekommen. Die jedoch müssen bislang jedoch vorher manuell mit Schlagworten versehen werden, was mit erheblichem Aufwand verbunden ist. Der DFKI-Ansatz könnte dieses Problem jedoch zumindest teilweise lösen. (wst)