zurück zum Artikel

Gut zu verstehen trotz niedriger Bitrate: Google stellt Audio-Codec Lyra vor.

Jonas Volkert

(Bild: Shutterstock/Juan Aunion)

Googles neuer Codec Lyra arbeitet mit KI und benötigt lediglich 3 KBit/s. In Kombination mit dem AV1-Videocodec sollen Anrufe mit nur 56 KBit/s möglich sein.

Mit Lyra veröffentlicht Google einen KI-basierten Audio-Codec, der ab einer Bitrate von 3 KBit/s gute Sprachverständlichkeit verspricht. In Kombination mit dem Open-Source-Videokompressionsformat AV1 sollen so virtuelle Gespräche selbst mit 56 KBit/s langsamen Dial-In-Modems möglich sein. Damit will Google Sprach-, aber auch Videotelefonate in relativ hoher Qualität in Regionen anbieten, in denen konstant hohe Datenraten nicht gewährleistet werden können.

Derzeit wird Lyra in Googles Gesprächsplattform Duo integriert, zu weiteren Einsatzgebieten ist hingegen nichts bekannt. Von Google heißt es lediglich, dass man daran arbeite, die maximale Verfügbarkeit der neuen Technik gewährleisten zu können.

Niedrige Datenraten gingen bei Audiokompressionen wie OPUS bislang mit schlechterer Sprachverständlichkeit und roboterhaften Klängen einher. Lyra kombiniert die Ansätze der klassischen Kompressionsmethoden nun mit Machine Learning und verspricht so hohe Qualität trotz niedriger Datenraten bei 3 KBit/s. Der KI-Audio-Codec wurde bislang in 70 Sprachen trainiert.

In Googles KI-Blog gibt es Audiobeispiele von Lyra [1] im Vergleich zu OPUS und Speex. Kürzlich hatte auch Microsoft mit Satin [2] einen Ansatz zur Verbesserung der Sprachqualität für die hauseigenen Teams und Skype präsentiert, der jedoch mindestens 6 KBit/s voraussetzt.

Mehr von iX Magazin Mehr von iX Magazin [3]

(jvo [4])


URL dieses Artikels:
https://www.heise.de/-5068323

Links in diesem Artikel:
[1] https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html
[2] https://www.heise.de/news/Klarer-Ton-fuer-Teams-Satin-KI-gegen-Kompressionsverluste-5060643.html
[3] https://www.heise.de/ix/
[4] mailto:jvo@ix.de