Bildelemente freistellen in Sekunden: Kostenloses KI-Tool von Meta

Das "Segment Anything Model" aus dem KI-Forschungslabor von Meta markiert Objekte in Bildern pixelgenau. Klick oder Stichwort genügt, den Rest macht die KI.

27

07.04.2023, 17:54 Uhr

Lesezeit: 1 Min.

Von

Andrea Trinkwalder

Meta AI hat einen Bildsegmentierer entwickelt, der Objekte in Fotos selbstständig erkennt und binnen Sekunden isoliert. Ob Hund, Katze, Gemüse oder alles zusammen: Das Segment Anything Model (SAM) markiert sämtliche oder gezielt ausgewählte Bildteile pixelgenau – kurzer Input als Mausklick oder Textanweisung genügt. Die Wissenschaftler haben SAM als Demo zum Testen sowie den Quellcode Github als Open Source veröffentlicht. Auch das selbst generierte Trainingsmaterial, einen Fundus von 11 Millionen Bildern mit 1,1 Milliarden Masken inklusive Labels, stellt Meta für Forschungszwecke zur Verfügung.

Das Segment Anything Model von Meta AI erkennt Objekte und markiert sie pixelgenau, auch in AR- und VR-Anwendungen.

Das Freistellen von Objekten vor ihrem Hintergrund ist eine zentrale Aufgabe im Bereich Bild- und Videobearbeitung, aber auch für VR- und AR-Anwendungen. Kombiniert mit einem Sprachmodell, ließen sich Gegenstände zum Beispiel auch per Sprachanweisung markieren, isolieren, maskieren oder ausschneiden und in andere Szenen übertragen. Laut Meta enthält der Trainingsdatensatz vierhundertmal mehr Masken als der größte, bislang verfügbare Korpus, und zwar sehr hochwertige, zu den unterschiedlichsten Themen und Objekten.

SAM wurde darauf trainiert, zu jeder Eingabe eine gültige Maske zu generieren. Der Nutzer kann das Ergebnis auch interaktiv verfeinern, indem er charakteristische Punkte anklickt, um bestimmte Bereiche hinzuzufügen oder auszuschließen.

Videos by heise