Neuartige Objekterkennung per KI: STEGO sieht etwas, was Du nicht siehst

Forscher haben einen Algorithmus entwickelt, der pixelgenau Objekte voneinander unterscheiden können soll. Computer kommen so ohne menschliches Training aus.

(Bild: Peshkova / shutterstock.com)

21.04.2022, 16:45 Uhr

Lesezeit: 2 Min.

Von

Malte Kirchner

So faszinierend die Erkennung von Objekten und Personen mittels Künstlicher Intelligenz auch erscheint: In der Regel sind hunderte Stunden des Trainings vorausgegangen, in denen der Mensch eine zentrale Rolle spielt. Ein neu geschaffener Algorithmus von Forschern des MIT Computer Science and Artificial Intelligence Laboratory, der in Zusammenarbeit mit der Cornell Universität und Microsoft entstanden ist, soll Computersysteme in dieser Beziehung intelligenter werden lassen.

Straßenszene in ihre Bestandteile zerlegt

STEGO – die Abkürzung für Self-supervised Transformer with Energy-based Graph Optimization – kann pixelgenau Objekte in Bildern voneinander abgrenzen, erklärt das Team. Diese Objekte vergleicht das Verfahren dann mit denen ähnlicher Objekte, sodass eingeordnet werden kann, worum es sich handelt, wie etwa ein Fahrzeug, ein Gebäude oder eine Pflanze. In Tests konnte STEGO etwa eine belebte Straßenszene in ihre Bestandteile zerlegen und Personen, Straßen sowie Schilder voneinander abgrenzen, schreiben sie.

Bislang muss der Mensch der Maschine hier auf die Sprünge helfen. Er zeichnet im Training für das Maschinenlernen Rechtecke um Objekte und gibt diesen eine Bezeichnung. In stundenlangem Training bekommt die Software so eine Vorstellung von verschiedenen Objekten, wobei durch das rechteckige Feld auch Pixel eingeschlossen werden, die nicht zum Objekt gehören.

Die KI sieht, was der Mensch (noch) nicht kennt

STEGO ist durch die semantische Segmentierung schneller in der Lage, Neues zu erlernen und das selbstständig. Das Maschinenlernen (ML) könne dadurch vorangetrieben werden und größere Verbreitung finden. Der Algorithmus ermöglicht nach Ansicht der Forscher aber auch Anwendungen, bei denen der Mensch an seine Grenzen kommt – nämlich dann, wenn er gar nicht weiß, wonach er auf Bildern sucht. Der Algorithmus hingegen würde auch neuartige Objekte in der Astrophysik und in der Biologie erkennen können.

Videos by heise

Aber die Technik hat ihre Grenzen, zum Beispiel bei optischen Widersprüchen: Sie könnte aktuell etwa eine Banane anstelle eines Hörers auf der Gabel eines Telefons nicht korrekt zuordnen.