Stand-up-Comedy: LLMs schreiben keine guten Witze

Kann eine Künstliche Intelligenz ein lustiges Comedy-Programm schreiben? Forscher von Google Deepmind haben es Comedians ausprobieren lassen.

In Pocket speichern vorlesen Druckansicht 41 Kommentare lesen
Ein Roboter tippt sich an die Stirn.

(Bild: Tatiana Shepeleva/Shutterstock.com)

Lesezeit: 2 Min.

Ein Forschungsteam von Google Deepmind hat in einer wissenschaftlichen Studie herausgefunden, dass große KI-Modelle nicht in der Lage sind, gute – also lustige – Witze für Stand-up-Comedians zu schreiben. Zwar können die Künstlichen Intelligenzen (KI) sich neue Witze ausdenken, lustig sind die dann aber meist nicht.

Stand-up-Comedy ist kein einfaches Unterfangen. Stand-up-Comedians arbeiten lange an ihren Programmen, um ein humorvolles, schlüssiges Programm zu schreiben. Meist testen sie diese dann vor dem Sprung auf die große Bühne in Teilen vor einem kleineren Publikum, um deren Reaktionen zu testen. Funktioniert ein Joke, dann wird er übernommen, wenn nicht, fällt er aus dem Programm raus.

Wissenschaftler von Deepmind wollten wissen, ob es möglich ist, dass eine KI ein lustiges Stand-up-Programm schreibt. Dazu heuerten die Wissenschaftler 20 professionelle Stand-up-Comedians an, die bereits Erfahrungen mit Large Language Models (LLM) bei der Entwicklung von Stand-up-Comedy-Programmen gesammelt hatten. Sie sollten eine komplette Stand-up-Comedy-Nummer mit einer KI entwickeln und das Ergebnis auch gleich bewerten. Die Forschungsergebnisse haben die Deepmind-Forscher in der wissenschaftlichen Studie "A Robot Walks into a Bar: Can Language Models Serve as Creativity Support Tools for Comedy? An Evaluation of LLMs' Humour Alignment with Comedians", die im Preprint auf Arxiv veröffentlicht ist, zusammengefasst.

Demnach waren die LLMs ziemlich gut darin, sich neue Witze auszudenken. Die meisten davon waren allerdings recht allgemein gehalten und boten selten eine Überraschung, eine Grundvoraussetzung für einen guten Witz. Wirklich lustig waren nur wenige der Comedy-Nummern.

Die Comedians kritisierten vor allem, dass den KI-generierten Witzen die Schärfe und Zuspitzung fehlte, um als lustig wahrgenommen zu werden. Die meisten Comedians bewerteten die Scherze deshalb als langweilig. Zugleich waren jedoch einige Comedians überzeugt, dass LMMs nützlich in der Entwicklungsphase eines Comedy-Programms sein könnten. Sie sind der Ansicht, dass sich mit ihnen eine Grundstruktur entwickeln lässt.

Ganz überraschend sind dieser Ergebnisse aber nicht, meinen die Forscher von Google Deepmind. Denn die Entwickler von LLMs bauen in ihre KIs Filter ein, um zu verhindern, dass beleidigende oder "kantige" Aussagen erzeugt werden.

(olb)