Gut zu verstehen trotz niedriger Bitrate: Google stellt Audio-Codec Lyra vor.

Googles neuer Codec Lyra arbeitet mit KI und benötigt lediglich 3 KBit/s. In Kombination mit dem AV1-Videocodec sollen Anrufe mit nur 56 KBit/s möglich sein.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 35 Beiträge

(Bild: Shutterstock/Juan Aunion)

Von
  • Jonas Volkert

Mit Lyra veröffentlicht Google einen KI-basierten Audio-Codec, der ab einer Bitrate von 3 KBit/s gute Sprachverständlichkeit verspricht. In Kombination mit dem Open-Source-Videokompressionsformat AV1 sollen so virtuelle Gespräche selbst mit 56 KBit/s langsamen Dial-In-Modems möglich sein. Damit will Google Sprach-, aber auch Videotelefonate in relativ hoher Qualität in Regionen anbieten, in denen konstant hohe Datenraten nicht gewährleistet werden können.

Derzeit wird Lyra in Googles Gesprächsplattform Duo integriert, zu weiteren Einsatzgebieten ist hingegen nichts bekannt. Von Google heißt es lediglich, dass man daran arbeite, die maximale Verfügbarkeit der neuen Technik gewährleisten zu können.

Niedrige Datenraten gingen bei Audiokompressionen wie OPUS bislang mit schlechterer Sprachverständlichkeit und roboterhaften Klängen einher. Lyra kombiniert die Ansätze der klassischen Kompressionsmethoden nun mit Machine Learning und verspricht so hohe Qualität trotz niedriger Datenraten bei 3 KBit/s. Der KI-Audio-Codec wurde bislang in 70 Sprachen trainiert.

In Googles KI-Blog gibt es Audiobeispiele von Lyra im Vergleich zu OPUS und Speex. Kürzlich hatte auch Microsoft mit Satin einen Ansatz zur Verbesserung der Sprachqualität für die hauseigenen Teams und Skype präsentiert, der jedoch mindestens 6 KBit/s voraussetzt.

(jvo)