Sprache verarbeiten mit den Azure Cognitive Services Sprachvermittler Dr. Fabian Deitelhoff Neue Errungenschaften im Machine Learning machen Spracherkennung und -synthese praxistauglich. Über Cloud-Dienste können Anwender auf vortrainierte Modelle zugreifen, um Sprache zu verschriftlichen und Texte in Sprache zu verwandeln.

iX-tract Die Azure Cognitive Services machen Sprachdienste über die Cloud zugänglich.

Um Sprache in Text zu wandeln, nutzt man die Speech-to-Text-Funktion.

Text to Speech macht aus einem Text Sprache. Sprache und Stimmen lassen sich auswählen.

Spracherkennung macht sich Machine Learning zunutze. Microsoft stellt für die Azure Cognitive Services vortrainierte und anpassbare Modelle bereit.

Neben Amazon und Google hat auch Microsoft mit den Azure Cognitive Services und den dort integrierten Speech Services Dienste wie Spracherkennung und Sprachsynthese in die Cloud gebracht. Dadurch ist es nicht mehr notwendig, eigene Long-Short-Term-Memory- oder ähnliche Systeme zu trainieren, um Sprache verarbeiten oder generieren zu können (siehe Kasten „Entwicklung der Spracherkennung“). Für viele Anwendungsbereiche sind die Möglichkeiten in der Cloud ausreichend. Und falls nicht, lassen sich die Systeme von Microsoft modifizieren. Was das bedeutet, zeigt dieser Artikel an einem Use Case aus dem wissenschaftlich-praktischen Kontext.