Apple ermöglicht demnächst, ein KI-Modell der eigenen Stimme zu erstellen – direkt auf iPhone, iPad und Mac. Die Option ist Teil einer neuen Bedienungshilfe, die der Hersteller voraussichtlich mit iOS 17, iPadOS 17 und macOS 14 im Herbst einführt. Ein neues Text-To-Speech-System soll Texteingaben direkt in eine akustische Sprachausgabe verwandeln, die sich nicht nur in der eigenen Umgebung, sondern auch für die Kommunikation per Video-Call oder Anruf einsetzen lässt. Häufig verwendete Phrasen lassen sich zum schnelleren Abruf speichern, wie das Unternehmen mitteilte.

Live Speech und Personal Voice

Für diese "Live Speech" genannte Bedienungshilfe nutzen die Apple-Betriebssysteme standardmäßig die Stimme des Sprachassistenzsystems Siri, die in einer männlichen, einer weiblichen und inzwischen auch einer geschlechtsneutralen Form auf den Apple-Geräten zum Abruf bereitsteht.

Mit der zusätzlichen Funktion "Personal Voice" (persönliche Stimme) haben Nutzer aber auch die Option, ein KI-Sprachmodell mit ihrer eigenen Stimme zu trainieren. Dafür müssen für rund 15 Minuten zufällige Sätze eingesprochen werden, wie Apple erläuterte. Das sei insbesondere für Personen gedacht, denen etwa krankheitsbedingt der Verlust der Sprachfähigkeit droht. Ein nachträgliches Training aus bestehenden Audioaufzeichnungen der Stimme scheint vorerst nicht vorgesehen.

Das eigene Stimmmodell wird auf dem iPhone lokal trainiert. (Bild: Apple)

Training lokal auf iPhone & Co

Das Training des persönlichen Stimmmodells erfolgt lokal auf dem Gerät – iPhone, iPad oder Mac mit Apple-Chip vorausgesetzt – und nicht in der Cloud, wie Apple betonte, das diene auch der Sicherheit. Optional wird sich das eigene Stimmmodell per iCloud zwischen den eigenen Geräten synchronisieren lassen und soll dabei durch Ende-zu-Ende-Verschlüsselung vor jeglichem Fremdzugriff geschützt bleiben.

Personal Voice und Live Speech gehören zu mehreren neuen Bedienungshilfen, die Apple gerade vorgestellt hat. Die Funktionen sollen noch im Laufe des Jahres in den Betriebssystemen eingeführt werden, sie sind zum Start nur für Englisch ausgelegt.

(lbe)