Neue Xerox-Software sortiert Bilder automatisch

Hund, Katze, Maus, Auto, Flugzeug: Geht es nach den Wissenschaftlern des Xerox Research Center in Grenoble, sollen sich Motive schon bald automatisch nach ihrem Inhalt klassifizieren lassen.

vorlesen Druckansicht 95 Kommentare lesen
Lesezeit: 2 Min.

Hund, Katze, Maus, Pferd, Auto, Flugzeug: Geht es nach den Wissenschaftlern des Xerox Research Center in Grenoble, sollen sich Motive schon bald automatisch nach ihrem Inhalt klassifizieren lassen. Stand der Bildarchivierungstechnik ist es bislang, Fotos und Grafiken manuell zu verschlagworten -- eine trotz moderner Kategorien- und Drag-&-Drop-Implementierungen recht zeitintensive Angelegenheit. Nur wenige Bilddatenbanken bieten überhaupt inhaltsbasierende Techniken, beschränken sich aber auf eine Ähnlichkeitssuche, die sich hauptsächlich auf die Farbverteilung im Bild stützt.

Die im Xerox-Institut entwickelte Software soll nun Gegenstände des täglichen Lebens wie Tiere, Flugzeuge, Autos oder Gebäude in einem Foto erkennen können und das Motiv entsprechend einordnen, also mit den passenden Schlagworten beschreiben. Der Vorgang soll rund zwei Sekunden pro Bild dauern. Die Bildbeschreibungs-Software soll dabei ähnlich arbeiten wie die schon weiter entwickelten Textklassifizierer. Im ersten Schritt durchsucht sie das Foto nach Schlüsselmerkmalen, so genannten "Key patches", welche beim Vergleich mit der eingebauten visuellen Bibliothek im Idealfall zu aussagekräftigen Schlüsselwörtern werden. Eine beim allweihnachtlichen Verkehrschaos aufgenommene Autoschlange etwa dürfte jede Menge Räder, Scheinwerfer und Scheiben als Schlüsselwörter zutage fördern.

Aufgrund einer Analyse der Häufigkeit der auftretenden Schlüsselwörter entscheidet die Software, welchen der vordefinierten Kategorien das Motiv angehört. Selbst ungewöhnliche Blickwinkel, mehrere zutreffende Kategorien oder teilweise verdeckte Gegenstände sollen sie nicht in die Irre führen. Mit derartigen Problemen habe man sich im Frühstadium der Entwicklung häufig auseinandersetzen müssen, erläutert der für das Projekt verantwortliche Wissenschaftler Christopher Dance: So habe etwa ein Reifenstapel versehentlich als Auto identifiziert werden können, da beide Bilder dieselben Patches enthalten. Verbesserte, spätere Versionen des Systems analysierten darüber hinaus weitere Bildbereiche und unterschieden das Auto vom Reifenstapel anhand weiterer wichtiger Schlüsselmerkmale wie Scheinwerfer oder Fenster. Abhängig von der Bildkategorie liegt die Trefferquote der Software nach Angaben des Xerox-Instituts bei 80 bis 99 Prozent. Nähere Informationen über den derzeitigen Umfang der Bibliotheken, die exakte Funktionsweise sowie das Entwicklungsstadium der Software waren von Xerox bislang nicht zu bekommen. (atr)