Software statt Stimmaufzeichnung: Siri klingt nun natürlicher

Apple scheint die verbesserten, rein per Software generierte Stimmen des Sprachassistenzsystems jetzt auch in Deutschland einzuführen.

12

Siri – fast immer für einen Witz zu haben.

(Bild: dpa, Lino Mirgeler)

29.04.2020, 15:40 Uhr

Lesezeit: 2 Min.

Mac & i

Von

Leo Becker

Siri erhält derzeit offenbar neue deutsche Stimmen: Die Antworten des Sprachassistenzsystems auf Apple-Geräten klingen seit Mittwoch in vielen Fällen besser als zuvor, wie Nutzer berichten. Zugleich kommt es teils aber auch zu Problemen: Antworten werden derzeit nicht immer komplett gesprochen, mitunter wechseln die Stimme zwischen der neuen und alten Fassung. Die Änderungen sind sowohl bei der männlichen als auch der weiblichen Stimme zu bemerken und sollten sich auf allen Geräten mit Siri-Support beobachten lassen – vom iPhone bis hin zum HomePod.

Siri mit neuer deutscher Stimme – weiblich wie männlich

Allerdings scheint Apple die Stimmfassungen schrittweise zu aktualisieren, so dass die neue Version derzeit noch nicht auf allen Geräten angekommen sein dürfte. Offenbar haben HomePod-Nutzer das Update in vielen Fällen zuerst erhalten, wie iPhone-Ticker.de berichtet. Dort klinge Siri nicht nur natürlicher, sondern spreche auch flüssiger und wirke teils sogar überschwänglich, schreiben Nutzer – das sei besonders bei der männlichen Stimme zu bemerken.

Nutzer können versuchen, das Update durch Änderung des Geschlechts der Siri-Stimme in den Einstellungen unter "Siri & Suche" zu erzwingen, die gewöhnlich nicht genutzte Fassung sollte dadurch neu von Apples Servern heruntergeladen werden. Apple hat bislang nicht bestätigt, dass auch die deutsche Siri-Stimme nun in verbesserter Form vorliegt und eingeführt wird, es könnte sich also auch nur um einen Testlauf handeln.

Siri-Stimme per Software generiert – statt aus Audio-Clips

Die zugrundeliegende Technik hat Apple im vergangenen Jahr für iOS 13 auf der Entwicklerkonferenz WWDC vorgestellt, sie war bislang auf die englische (US-Amerikanische) Stimme begrenzt. Ob die neuen Stimmen auch in älteren iOS- und macOS-Versionen verfügbar sind, bleibt vorerst unklar.

Durch maschinelles Lernen und "Neural Text To Speech" werde es möglich, die Stimme des Sprachassistenzsystems komplett per Software zu generieren. Das soll besonders Aussprache und Intonation bei komplexeren Begriffen und längeren Sätzen verbessern.

Ursprünglich wurden Siri-Antworten aus Audio-Clips menschlicher Sprecher zusammengesetzt: "Ich habe Sätze gelesen wie 'Sag' das Shrodding nochmal. Sag' das Shredding nochmal. Sag' das Shrading nochmal'. Sehr wiederholendes, stumpfes, langweiliges Zeug", erklärte die Sprecherin Susan Bennett, die die erste englische Siri-Stimme stellte, in einem Interview im Jahr 2015. Sie habe erst nachträglich erfahren, dass die langwierigen Sprachaufnahmen von Apple für das Sprachassistenzsystem verwendet wurde.

t

(lbe)