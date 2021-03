Mit Lyra veröffentlicht Google einen KI-basierten Audio-Codec, der ab einer Bitrate von 3 KBit/s gute Sprachverständlichkeit verspricht. In Kombination mit dem Open-Source-Videokompressionsformat AV1 sollen so virtuelle Gespräche selbst mit 56 KBit/s langsamen Dial-In-Modems möglich sein. Damit will Google Sprach-, aber auch Videotelefonate in relativ hoher Qualität in Regionen anbieten, in denen konstant hohe Datenraten nicht gewährleistet werden können.

Derzeit wird Lyra in Googles Gesprächsplattform Duo integriert, zu weiteren Einsatzgebieten ist hingegen nichts bekannt. Von Google heißt es lediglich, dass man daran arbeite, die maximale Verfügbarkeit der neuen Technik gewährleisten zu können.

Niedrige Datenrate, hohe Qualität

Niedrige Datenraten gingen bei Audiokompressionen wie OPUS bislang mit schlechterer Sprachverständlichkeit und roboterhaften Klängen einher. Lyra kombiniert die Ansätze der klassischen Kompressionsmethoden nun mit Machine Learning und verspricht so hohe Qualität trotz niedriger Datenraten bei 3 KBit/s. Der KI-Audio-Codec wurde bislang in 70 Sprachen trainiert.

In Googles KI-Blog gibt es Audiobeispiele von Lyra im Vergleich zu OPUS und Speex. Kürzlich hatte auch Microsoft mit Satin einen Ansatz zur Verbesserung der Sprachqualität für die hauseigenen Teams und Skype präsentiert, der jedoch mindestens 6 KBit/s voraussetzt.

(jvo)