Duolingo: KI-Videogespräche mit Lilli

Duolingo erweitert seine Sprachlern-App um Funktionen wie die gelangweilte KI-Gesprächspartnerin Lilli. Über die Hintergründe haben wir mit Duolingo gesprochen.

In Pocket speichern vorlesen Druckansicht 18 Kommentare lesen
KI-Gesprächspartnerin Lily im Videotelefonat mit einem Model

Lilli ist bei den Nutzern wegen ihrer depressiven Stimmung besonders beliebt.

(Bild: Duolingo)

Update
Stand:
Lesezeit: 6 Min.

Duolingo erweitert sein Sprachlernangebot um mehr KI-gestützte Funktionen, beispielsweise Videocalls und Abenteuer. Die Neuerungen stellt Duolingo während auf der Duocon 2024 vor.

Mit der Videocall-Funktion können Abonnenten des zwischen 14,99 und 29,99 Euro kostenden Duolingo Max, oder "Duolingo Super" spontane und realistische Konversationen mit der KI-Figur Lilli führen. Es gibt bereits ähnliche Angebote, Sprachen mit einem KI-Sprachtrainer zu lernen. Lilli soll bisherige Duolingo-Funktionen nicht ersetzen, sondern eine Ergänzung zum bisherigen Angebot darstellen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Dabei passt Lilli sich laut den Herstellern automatisch dem Sprachniveau der Lernenden an. Die Funktion soll das Selbstvertrauen der Lerner stärken. Feedback gibt es daher nach dem Gespräch, wie es von Duolingo heißt. Der Kontakt mit Lilli ist zunächst unter iOS in den Sprachen Englisch, Spanisch und Französisch verfügbar, später auch für Deutsch, Italienisch, Chinesisch und Japanisch. Für die Zukunft ist auch eine Version für Android-Geräte geplant.

(Bild: Duolingo)

Über Lilli haben wir mit Zan Gilani, dem Leiter des "Experimential AI"-Teams bei Duolingo gesprochen, das mit generativer KI arbeitet.

heise online: Worauf basiert Lilli?

Zan Gilani: Wir arbeiten mit OpenAI und verwenden deren neueste Modelle – aktuell GPT-4o. Eine Feinabstimmung nehmen wir dabei nicht vor. Das heißt nicht, dass wir nur ChatGPT in Duolingo integriert haben. Der Technologie-Stack wurde erweitert, Lilli haben wir ein Gedächtnis gegeben. Beim ersten Test konnte sich Lilli an nichts erinnern.

Wie werden individuelle Gespräche möglich?

Wir haben unser eigenes System gebaut, bei dem Lilli sich versucht, an die Dinge zu erinnern, die für die Nutzer relevant sind und über die sie sprechen möchten. Das Ganze funktioniert nur für das entsprechende Nutzerkonto. Wir trainieren kein Modell anhand der Daten.

Die Anrufe, die mit Lilli geführt werden, gehen wir noch einmal durch und lassen GPT dann sagen: "Okay, aus deinen letzten 50 Anrufen extrahiere die wichtigsten Erkenntnisse." Dann erfahren die Nutzer etwas über die Person. Zum Beispiel: "Woher kommst du, worüber willst du reden?" Und dann verwenden wir diese Informationen in nachfolgenden Anrufen erneut und sagen zum Beispiel: "Heute fragst du Marie nach etwas aus euren vergangenen Gesprächen, das noch aktiv ist, über ihr Leben oder so etwas in der Art. In einem aktuellen Gespräch hatte sie zum Beispiel gesagt, sie wolle verreisen, frage sie danach."

Welche Sicherheitsvorkehrungen gibt es?

Ja. Speziell die Inhaltsmoderation ist uns wichtig. Duolingo ist auch für verschiedene Altersgruppen. Wir müssen also sicherstellen, dass es eine Inhaltsmoderation gibt, im Grunde jedes Mal, wenn etwas gesagt wird.

Wir prüfen, ob es nicht unangemessen ist, und wenn doch, beenden wir das Gespräch. Ebenfalls ist es uns wichtig, sicherzustellen, dass Lilli nichts Unangemessenes sagt. Die Leute sind sehr kreativ, wenn es darum geht, Lilli oder andere Chatbots dazu zu bringen, etwas Schlechtes zu sagen.

Gibt es Schwierigkeiten, Lilli andere Sprachen sprechen zu lassen?

Antwort: Ja. Wir haben zum Beispiel bereits eine Basisversion von Video Call auf Koreanisch. Sie ist nicht so gut, weil das Koreanische über sehr umfangreiche Höflichkeitsformen verfügt. Sie müssen also die richtige Anrede verwenden, wenn Sie mit Leuten sprechen. Wir haben Video Call auf Koreanisch ausprobiert, und das Gespräch ist aufgrund der Formalitätsregeln völlig durcheinandergeraten. Wir versuchen uns aber auch an solchen und ähnlichen Herausforderungen in Sprachen mit umfangreichen Grammatikregeln.

Gibt Lilli Feedback?

Aus pädagogischen Gründen gibt Lilli während des Gesprächs kein Feedback. Dies könnte den Gesprächsfluss stören. Der Sprecher würde mehr über mögliche Fehler und Korrekturen nachdenken und könnte nicht frei sprechen. Auf das Gespräch folgt konstruktives Feedback.

Wird Lilli ihre Stimmung ändern? Sie wirkt deprimiert.

Wir haben eine Reihe von Charakteren um Duo, unser Eulenmaskottchen, herum aufgebaut. Lilli ist unser Emo-Girl im Teenager-Alter mit lilafarbenen Haaren. Wir haben sie für diese Videoanruf-Funktion ausgewählt, weil unsere Lernenden ihren Sarkasmus und ihre Ironie lieben und sie in den sozialen Medien vieler Länder sehr beliebt ist. Wir werden ihre Persönlichkeit also nicht antasten. Aber ja, wir denken über eine gewisse Abwechslung nach.

Es ist auf alle Fälle besser, als mit Fremden im Internet zu versuchen, eine Sprache zu lernen.

Die Leute, die das machen, sind sehr beeindruckend, weil es viel Selbstvertrauen erfordert und ich denke, die meisten Leute sind einfach ein bisschen schüchtern und ein bisschen nervös, sich da draußen zu zeigen. Wir hoffen, dass Sie, wenn Sie dies häufig tun, das Selbstvertrauen haben, zu sagen: "Jetzt werde ich Muttersprachler finden und auf Reisen in Paris meinen Kaffee bestellen, ohne mich schämen zu müssen, weil sie sich über mein Französisch lustig machen." Das ist unsere Hoffnung.

Verwenden Sie Duolingo?

Ja, ich habe einen Deutschkurs begonnen, um zu sehen, ob ich eine neue Sprache lernen kann.

Hinweis: Das Interview wurde auf Englisch geführt.

Weiterhin wurde die Funktion Adventures vorgestellt, mit der Sprachlerner sowohl bei Android als auch unter iOS in verschiedenen Umgebungen mit Charakteren von Duolingo interagieren können. Die Abenteuer sollen den Sprachgebrauch in realistischen Kontexten, etwa beim Bestellen von Kaffee, fördern.

Neben den sprachlichen Neuerungen wird in Zusammenarbeit mit Loog, einem Hersteller tragbarer Musikinstrumente, ein kompaktes E-Piano entwickelt, das für 249 US-Dollar erhältlich sein wird. Lernende sollen dann Musikunterrichtsstunden auf einem elektronischen Klavier absolvieren können. Eine Partnerschaft mit Sony Music ermöglicht es, bekannte Musik zu üben.

Update

Interview und Antworten ergänzt.

(mack)