Künstliche Intelligenz: Sag mir, was mein Hund mir sagen will

Forscher haben ein KI-Modell zur Sprachverarbeitung auf Hundegebell angesetzt. Das Ergebnis: Die Künstliche Intelligenz erfasste sogar die Stimmung der Tiere.

In Pocket speichern vorlesen Druckansicht 42 Kommentare lesen

Was sagt das Bellen des Hundes über seine aktuelle Stimmung? Diese Frage konnte eine auf menschliche Stimmen trainierte KI beantworten.

(Bild: Zivica Kerkez/Shutterstock.com)

Lesezeit: 3 Min.

Will der Hund nur spielen oder ist er aggressiv? Diese Frage konnte eine Künstliche Intelligenz (KI) beantworten, hat ein Forschungsteam der University of Michigan herausgefunden. Sie haben ein Sprachmodell, das eigentlich auf menschliche Sprache trainiert ist, auf Hundegebell angesetzt und festgestellt: Es funktioniert. Das Tool erkennt, ob das Bellen des Hundes spielerisch oder aggressiv ist.

Das Team fütterte das Modell mit 74 Lauten von Hunden verschiedener Rassen, Alters und Geschlechts, die in unterschiedlichen Situationen aufgenommen waren. Die Aufnahmen entstanden in kontrollierten Situationen. So wurde zum Beispiel das Bellen aufgezeichnet, wenn es mehrfach an der Tür klingelt, wenn der Hund spielte oder wenn ein Angriff auf die Hundehalter simuliert wurde.

Die gleichen Modelle konnten aus den Tierlauten außerdem herauslesen, wie alt der Hund ist, welcher Rasse er angehört und welches Geschlecht er hat. Mit dem Modell Wav2Vec2, das das Team verwendete, konnten sie die gesammelten Daten interpretieren. Das Modell erfüllte vier Klassifizierungs-Tests (Stimmerkennung, Rasse, Geschlecht und Stimmung) und übertraf zudem andere Modelle, die speziell mit Hundegebell trainiert worden waren, mit einer Genauigkeit von bis zu 70 Prozent.

Mit dem Einsatz eines eigentlich auf menschliche Sprache ausgelegten Modells wollten die Forscherinnen und Forscher ein Problem mit den Trainingsdaten lösen. Denn im Gegensatz zu menschlichen Stimmaufzeichnungen gibt es deutlich weniger Material von tierischer Kommunikation. "Tierlaute sind deutlich schwieriger zu erfassen und aufzuzeichnen", sagte Artem Abzaliev, Hauptautor und Doktorand der Informatik und Ingenieurwissenschaften an der University of Michigan laut einer Mitteilung der Universität. Entweder müsste die Aufnahme passiv in der freien Wildbahn oder mit Erlaubnis der Besitzer bei Haustieren erfolgen.

Das Forschungsteam nutzte daher die Modelle, auf denen aktuelle sprachgesteuerte Technologien aufbauen, darunter Übersetzungsangebote. Diese seien ohnehin darauf ausgelegt, Feinheiten wahrzunehmen und zu interpretieren, beispielsweise Stimme, Tonfall, Tonhöhe oder Akzente. "Diese Modelle können die unfassbar komplexen Muster der menschlichen Sprache lernen und entschlüsseln", sagte Abzaliev. "Wir wollten wissen, ob wir diese Fähigkeit auch nutzen können, um Hundegebell zu erkennen und zu interpretieren."

Die Erkenntnisse sieht das Team nicht nur als wertvoll für die Verwendung von Sprachmodellen der menschlichen Kommunikation für den Einsatz bei der Analyse von Tierkommunikation an. Sie lieferten auch wichtige Aufschlüsse für den Tierschutz, schließlich könne ein besseres Verständnis auch für einen besseren Umgang mit Tieren führen – nicht nur eine Errungenschaft für das tierische Wohlergehen, sondern auch wichtig für die Entschärfung gefährlicher Situationen.

Die Ergebnisse hat das Team auf der Joint International Conference on Computational Linguistics, Language Resources and Evaluation vorgestellt.

(are)