Large Language Model für Delfine: Sprechen mit den Meeressäugern
DolphinGemma ist eine Art Large Language Model für Delfine. Das nutzt eine Delfin-Organisation via Pixel-Smartphones.
(Bild: Google)
In den USA ist der nationale Delfin-Tag am 14. April und Google gibt bekannt, an einem KI-Modell zu arbeiten, durch das man mit den Tieren kommunizieren können soll. DolphinGemma ist in gemeinsamer Arbeit mit der Georgia Tech und dem Wild Dolphin Project (WDP) entstanden. Das Modell lernt Strukturen aus den Geräuschen von Delfinen und kann diese generieren.
Das WDP bringt dabei das Wissen rund um Delfine mit. Dazu gehören etwa das Sozialverhalten, aber auch schon erste Erkenntnisse über die Laute. Delfinmütter und Kälber finden beispielsweise durch Pfiffe zusammen, die nur sie verwenden, schreibt Google. Bei Streit gäbe es eine Art des Kreischens und bei der Balz und bei der Verfolgung durch Haie ein Klick-Brummen. Nun hat Google die Daten des WDP genutzt, um ein KI-Modell damit zu trainieren.
Large Language Model für Laute von Delfinen
Ein SoundStream-Tokenizer wird genutzt, um die Laute zu repräsentieren. Die Modellarchitektur ist optimiert für komplexe Sequenzen, schreibt Google. Mit 400 Millionen Parametern kann DolphinGemma auf den Pixel-Smartphones der WDP-Mitarbeiter laufen. Im Grunde funktioniert das Modell auf die bekannte Art und Weise eines Large Language Models, nur dass keine menschliche Sprache genutzt wird, sondern die Tierlaute. Die KI lernt Muster und Strukturen und berechnet Wahrscheinlichkeiten beim Output.
Videos by heise
"Durch die Identifizierung von wiederkehrenden Klangmustern, Clustern und zuverlässigen Sequenzen kann das Modell den Forschern dabei helfen, verborgene Strukturen und potenzielle Bedeutungen in der natürlichen Kommunikation der Delfine aufzudecken – eine Aufgabe, die bisher einen immensen menschlichen Aufwand erforderte." Möglich sei dadurch etwa bereits, Delfine auf Objekte hinzuweisen, mit denen die Tiere gerne spielen.
Delfine werden mittels Laute konditioniert
Aus der Kooperation ist zudem ein weiteres System hervorgegangen, das der Kommunikation mit Delfinen dient. CHAT steht für Cetacean Hearing Augmentation Telemetry. Es handelt sich um einen Unterwassercomputer, mit dem ein gemeinsames, aber einfaches Vokabular aufgebaut werden soll. Es erzeugt ebenfalls synthetische Pfiffe, die jedoch anders klingen als die der Delfine. Die Pfiffe werden dann mit Objekten in Verbindung gebracht, die Delfine also klassisch konditioniert. Nun erhoffen sich die Forscher aber auch, dass die Delfine irgendwann die Geräusche nachmachen, um die damit verbundenen Dinge einzufordern – es geht etwa um Seegras. Auch für CHAT werden Pixel-Geräte von Google genutzt.
DolphinGemma soll noch in diesem Sommer als offenes Modell verfügbar gemacht werden. Zwar sei das Modell auf den Lauten der Delfine im Atlantik trainiert worden, Google erwartet jedoch, dass es auch bei anderen Delfinarten eingesetzt werden könne – etwa mittels Feintuning. Im Blogbeitrag heißt es auch, man wolle die Kluft zwischen der Kommunikation von Menschen und Delfinen ein wenig kleiner machen. Freilich ist das übergeordnete Ziel die speziesübergreifende Kommunikation nicht nur mit Delfinen.
(emw)