Personal Voice: iOS 17 mit KI-Sprachgenerator für die eigene Stimme

iPhone-Nutzer können künftig ihre Stimme klonen und damit etwa Texte vortragen lassen. Das KI-Stimmmodell wird lokal auf dem Gerät trainiert.

In Pocket speichern vorlesen Druckansicht 9 Kommentare lesen
Live Speech in iOS 17 Text-to-Speech-System

(Bild: Apple)

Lesezeit: 2 Min.

Apple ermöglicht demnächst, ein KI-Modell der eigenen Stimme zu erstellen – direkt auf iPhone, iPad und Mac. Die Option ist Teil einer neuen Bedienungshilfe, die der Hersteller voraussichtlich mit iOS 17, iPadOS 17 und macOS 14 im Herbst einführt. Ein neues Text-To-Speech-System soll Texteingaben direkt in eine akustische Sprachausgabe verwandeln, die sich nicht nur in der eigenen Umgebung, sondern auch für die Kommunikation per Video-Call oder Anruf einsetzen lässt. Häufig verwendete Phrasen lassen sich zum schnelleren Abruf speichern, wie das Unternehmen mitteilte.

Für diese "Live Speech" genannte Bedienungshilfe nutzen die Apple-Betriebssysteme standardmäßig die Stimme des Sprachassistenzsystems Siri, die in einer männlichen, einer weiblichen und inzwischen auch einer geschlechtsneutralen Form auf den Apple-Geräten zum Abruf bereitsteht.

Mit der zusätzlichen Funktion "Personal Voice" (persönliche Stimme) haben Nutzer aber auch die Option, ein KI-Sprachmodell mit ihrer eigenen Stimme zu trainieren. Dafür müssen für rund 15 Minuten zufällige Sätze eingesprochen werden, wie Apple erläuterte. Das sei insbesondere für Personen gedacht, denen etwa krankheitsbedingt der Verlust der Sprachfähigkeit droht. Ein nachträgliches Training aus bestehenden Audioaufzeichnungen der Stimme scheint vorerst nicht vorgesehen.

Das eigene Stimmmodell wird auf dem iPhone lokal trainiert.

(Bild: Apple)

Das Training des persönlichen Stimmmodells erfolgt lokal auf dem Gerät – iPhone, iPad oder Mac mit Apple-Chip vorausgesetzt – und nicht in der Cloud, wie Apple betonte, das diene auch der Sicherheit. Optional wird sich das eigene Stimmmodell per iCloud zwischen den eigenen Geräten synchronisieren lassen und soll dabei durch Ende-zu-Ende-Verschlüsselung vor jeglichem Fremdzugriff geschützt bleiben.

Personal Voice und Live Speech gehören zu mehreren neuen Bedienungshilfen, die Apple gerade vorgestellt hat. Die Funktionen sollen noch im Laufe des Jahres in den Betriebssystemen eingeführt werden, sie sind zum Start nur für Englisch ausgelegt.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(lbe)