Automatische Spracherkennung in AWS Transcribe

Bislang mussten Nutzer die Ausgangssprache händisch auswählen, wenn sie sie mit AWS in Text umwandeln wollten. Nun soll der Cloud-Dienst das automatisch können.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 5 Beiträge

(Bild: Andrey VP/Shutterstock.com)

Von
  • Moritz Förster

Automatisch identifiziert AWS Transcribe künftig die Ausgangssprache, diese mussten Nutzer zuvor händisch auswählen. Amazons Dienst überträgt gesprochene Sprache in Text, zum Beispiel in einem Callcenter oder für Untertitel bei Vorträgen.

Kommt in einer App bereits die Transcribe-API StartTranscriptionJob zum Einsatz, lässt sich die neue Funktion hier direkt aktivieren. Um die Sprache korrekt erkennen zu können, benötigt die Software mindestens 30 Sekunden einer Tonaufzeichnung. Anschließend teilt sie die identifizierten Sprachen danach ein, wie dominant sie in der Aufnahme vertreten sind.

Hierbei vergibt Transcribe für jede Sprache einen Wert zwischen 0 und 1. Er gibt an, wie sicher der Dienst sich ist, dass vor allem diese Sprache vorliegt. Als Antwort gibt AWS die fünf besten Ergebnisse mit ihrer Punktzahl aus. Anschließend folgt die eigentliche Übertragung der Aufzeichnung in Text.

Entwickler können die Transcribe-API anweisen, die Suche ausschließlich auf bestimmte Sprachen einzuschränken – zum Beispiel, wenn die Firma nur Anrufe in ausgewählten Sprachen annimmt. Auch lässt sich die API GetTranscriptionJob verwenden, um lediglich die Sprache ohne weitere Textumwandlung zu erkennen.

Im Blogeintrag auf aws.amazon.com finden Programmierer eine ausführliche Anleitung zu den APIs. Die automatische Spracherkennung funktioniert mit 31 Sprachen. Verfügbar ist die Funktion weltweit, darunter aus Rechenzentren in Europa und Deutschland.

(fo)