Mac & i 1/2019
S. 138
Hintergrund
Siri
Aufmacherbild

Alles verstehen

Wie Siri auf dem HomePod Störgeräusche mithilfe neuronaler Netze entfernt

Wer schon einmal auf dem HomePod Siri genutzt hat, fragt sich bestimmt: Warum funktioniert die Spracherkennung hier so viel besser als auf meinem iPhone? Die Entwickler haben dafür tief in die Trickkiste gegriffen.

Digitale Sprachassistenten haben mit vielfältigen Schwierigkeiten zu kämpfen: Sie müssen gesprochenen Text von anderen Geräuschen unterscheiden, mit völlig unterschiedlichen Stimmfarben und Betonungen zurechtkommen und dürfen auch bei Mundarten nicht gleich die Segel streichen. Besonders knifflig wird all das, sobald die Assistenten in besonders lauter oder geräuschhafter Umgebung arbeiten.

Es liegt auf der Hand, dass smarte Lautsprecher wie Apples HomePod (siehe Test in Mac & i, Heft 2/2018) von diesen störenden Einflüssen besonders betroffen sind. Schließlich besteht die Hauptaufgabe dieser Geräte darin, Musik abzuspielen – gerne auch mal etwas lauter. Je lauter aber die Musik, desto stärker strahlt sie in die Mikrofone, und um so schwerer wird es für die Spracherkennung, an Siri gerichtete Befehle zu erkennen und auszuwerten. Das lässt sich gut mit einem Schlagzeuger vergleichen, der beim Trommeln versuchen soll, einer Unterhaltung zu folgen.