MWC

Whispp lässt Menschen mit Sprachbehinderung durch KI in Echtzeit sprechen

Whispp soll Menschen mit Sprachbehinderung dabei helfen, besser zu kommunizieren. Die KI verstärkt leise Stimmen jetzt auch in persönlichen Gesprächen.

vorlesen Druckansicht 1 Kommentar lesen
Whispp-App auf Handy

(Bild: heise online; dahe)

Lesezeit: 3 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Das niederländische Start-up Whispp nutzt KI, um Menschen mit Sprachbehinderung zu unterstützen. Ihre Anwendung verwandelt etwa leise Stimmen in besser verständliche Sprache und soll dabei Emotion und Intonation beibehalten. Auf dem MWC in Barcelona stellt Whispp eine neue Funktion vor, die auch KI-Unterstützung in persönlichen Unterhaltungen bietet.

Dafür spricht man ähnlich wie bei Simultanübersetzer-Apps direkt ins Handy. Das Gegenüber braucht dann an das Handy angeschlossene Kopfhörer oder Lautsprecher, um die geboostete Stimme zu hören. In Zukunft könnte man dafür einen speziellen Lautsprecher entwickeln, der eine möglichst geringe Latenz zur Whispp-App hat, sagt CEO Joris Castermans im Gespräch mit heise online auf dem MWC. Aktuell muss man sich dafür noch auf herkömmliche Abspielgeräte verlassen.

Eine möglichst geringe Latenz ist bei persönlichen Gesprächen besonders wichtig, sagt Castermans. Deswegen wolle man ab Sommer mit der neuen Funktion auch auf lokale KI-Verarbeitung von Spracheingaben umstellen. Bisher passiert das noch in der Cloud. In einer Demo auf dem MWC gab es mit einem kabelgebundenen Lautsprecher eine Verarbeitungslatenz von 220 Millisekunden. Das ist zwar etwas mehr, als man von Telefonaten über Bluetooth-Kopfhörer gewohnt ist, reicht für eine natürliche Unterhaltung aber aus.

Dass es ĂĽberhaupt so schnell geht, liegt an der Funktionsweise von Whispp. Die KI wandelt im Gegensatz zu anderen Anwendungen Audio direkt zu Audio um. Das Programm spart sich also den Zwischenschritt, Sprache zuerst in Text und dann wieder in Sprache zu verwandeln.

Wer möchte, kann Whispp weiterhin mit der eigenen Stimme trainieren. Das ist etwa nützlich für Personen, die ihre Stimme infolge einer Krankheit wie Kehlkopfkrebs verloren haben, aber noch Sprachaufzeichnungen ihrer alten Stimme besitzen. Pflegt man sie in Whispp ein, erstellt die App einen "Sprachklon" – die ausgegebene Stimme soll dann besonders authentisch klingen.

Whispp ist laut dem niederländischen Entwickler grundsätzlich sprachunabhängig nutzbar, solange der Nutzer keinen besonders starken Dialekt spricht und gut artikuliert. Die App richtet sich vorrangig an Personen mit Sprachbehinderungen und Menschen, die stottern – weil es für sie oftmals einfacher ist, flüsternd flüssig zu sprechen.

Videos by heise

Die Whispp-Anwendung gibt es bereits für Android und iOS, eine Desktop-Version für Windows-Geräte ist in Arbeit. Aktuell wurde Whispp laut Castermans 10.000 Mal heruntergeladen. Monatlich nutzen die App demnach 1500 Personen.

Um das Publikum zu erweitern, möchte Whispp nun auch Business-Kunden gewinnen. Die KI-Technik des Unternehmens könne etwa vertrauliche Geschäftsgespräche in leisen Tönen auch an öffentlichen Orten ermöglichen. Zudem könnten Mitarbeiter in Service-Centern mit Whispp auch dann Telefonate führen, wenn sie nach Krankheit heiser sind.

Die Mobil-App kann kostenlos heruntergeladen und ausprobiert werden. Sprachnachrichten sind kostenlos, wer Telefonate führen will, muss 20 Euro pro Monat zahlen. Für die Simultangespräche könnten noch einmal ein paar Euro im Monat draufkommen, sagt CEO Castermans. Langfristig sei aber ohnehin das Ziel, die Technik an andere Hersteller zu lizenzieren.

(dahe)