ChatGPT: Wie KI-Objekterkennung mit Prompting funktioniert
In diesem Artikel zeigen wir, wie eine KI mit Regeln in deutscher Sprache, ganz ohne Programmierung, Objekte in Szenen erkennen und Fehler finden kann.
- Detlef Heinze
Es ist heute gängige Praxis, Objekte auf Bildern mittels KI-Objekterkennung zu lokalisieren und zu identifizieren. Wir kennen alle diese Bilder, auf denen Objekte mit einem Rechteck und ihrer Klasse gekennzeichnet sind. Doch diese Beispieleprogramme reichen für viele Anwendungen nicht aus. Der Ort der Objekte und ihre Klasse sind nur die Grundlage für weitere Berechnungen und Überprüfungen.
Stellen wir uns folgende Situation vor: Auszubildende der Hotelfachschule sollen lernen, wie man ein Gedeck richtig auf einem Tisch anordnet. Wo kommen die Messer und Gabeln hin, wo eine Bowl und wo eine Tasse? Ist die Anzahl der Gabeln richtig? Fehlt ein Messer oder ein Becher?
- Bildszenen auf Ort und Anwesenheit von Objekten prüfen
- Formulierung, Anpassung und Tipps für den Prompt
- Objekterkennung und OpenAI GPT Chat Completions API
Kundige Ausbilder überprüfen eine derartige Szene in Sekunden. Wenn sie aber nicht vor Ort sind, wäre es hilfreich, wenn ein Raspberry Pi die Aufgabe übernehmen könnte. Die Auszubildenden könnten dann eigenständig lernen, ohne Buchvorlagen wälzen zu müssen.
Das war die Leseprobe unseres heise-Plus-Artikels "ChatGPT: Wie KI-Objekterkennung mit Prompting funktioniert". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.