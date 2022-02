Inhaltsverzeichnis Machine Learning: Sprache verarbeiten mit den Azure Cognitive Services Speech to Text, Text to Speech Verschiedene Sprachmodelle Fazit Artikel in iX 2/2022 lesen

Neben Amazon und Google hat auch Microsoft mit den Azure Cognitive Services und den dort integrierten Speech Services Dienste wie Spracherkennung und Sprachsynthese in die Cloud gebracht. Dadurch ist es nicht mehr notwendig, eigene Long-Short-Term-Memory- oder ähnliche Systeme zu trainieren, um Sprache verarbeiten oder generieren zu können. Für viele Anwendungsbereiche sind die Möglichkeiten in der Cloud ausreichend. Und falls nicht, lassen sich die Systeme von Microsoft modifizieren. Was das bedeutet, zeigt dieser Artikel an einem Use Case aus dem wissenschaftlich-praktischen Kontext.

Unter den Azure Cognitive Services fasst Microsoft einen Produktbereich zusammen, der KI-Modelle als APIs bereitstellt. Entwickler und Data Scientists können die Dienste in eigene Produkte integrieren. Grundsätzlich lassen sich die Funktionen auch selbst implementieren. Die dafür notwendigen Algorithmen stehen häufig als Open-Source-Projekte bereit, auch das Training dieser Algorithmen kann jeder selbst durchführen.

Als Problem erweist es sich, die notwendigen Trainingsdaten zu finden und Zeit und Wissen in die korrekte Auswahl von Algorithmen und Training zu investieren. Hier können die Cognitive Services einen Vorteil bieten, da sie anpassbare und vortrainierte Modelle verwenden, die über die Cloud-Plattform bereitgestellt werden. Zudem sind vorgefertigte Docker-Container verfügbar.