Meta plant einen Universalübersetzer für Gespräche in Echtzeit, der neben den am häufigsten verwendeten Sprachen – Englisch, Mandarin und Spanisch – auch Hunderte weitere unterstützen soll.

Dies will Meta mit zwei Projekten erreichen: Mit einem im Rahmen des Programms "No Language Left Behind" entstehenden KI-Modell trainiert Meta ein Sprachmodell, das aus "wenigen Beispielen" lernen soll. Das zweite Projekt, der "Universal Speech Translator", soll Übersetzungen für Sprachen ohne standardisiertes Schriftsystem ermöglichen. Dies soll in Echtzeit "über ein Telefon, eine Uhr oder eine Brille" geschehen, wenn es soweit ist. Metas Chef Mark Zuckerberg interessiert sich vor allem im Rahmen seiner Metaversum-Pläne für den Universalübersetzer.

Noch ein weiter Weg

Bis Meta AI "allen Menschen auf der Welt" den Universalübersetzer zur Verfügung stellen kann, ist es noch ein weiter Weg. Denn maschinelle Übersetzungsprogramme müssen mit großen Datensätzen trainiert werden, sodass Sprachen mit weniger Trainingsdaten mangels entsprechender Textkorpora oder ohne standardisiertes Schriftsystem oft außen vor bleiben.

Einen Zeitrahmen für sein ambitioniertes Vorhaben nannte Meta nicht. "Die Fähigkeit, mit jedem in jeder Sprache zu kommunizieren – das ist eine Supermacht, von der die Menschen schon immer geträumt haben, und die KI wird das noch zu unseren Lebzeiten ermöglichen.", sagte Metas Chef Mark Zuckerberg in einer Präsentation über seine Metaversum-Pläne.

Meta: 20 Prozent der Menschen von kommerzieller Übersetzungstechnologie nicht erfasst (Bild: Meta, Inc.)

Meta erweitert Open-Source-Projekte

Für die Übersetzung von Sprachen mit wenigen Daten hat Metas KI-Abteilung Meta AI das Toolkit Language-Agnostic Sentence Representations (LASER) erweitert, welches Repräsentationen von Sätzen in verschiedenen Sprachen erstellt. Über die Hälfte des Codes besteht aus der Programmiersprache Python, mit der oft Projekte rund um die natürliche Sprachverarbeitung (NLP) umgesetzt werden. Das Open-Source-Toolkit umfasst inzwischen über 125 Sprachen in 28 verschiedenen Schriftsystemen. Mit LASER baut Meta System wie ccMatrix und ccAligned. ccMatrix sorgt dafür, größere Datensätze für öffentlich zugängliche Satzpaare – beispielsweise Sätze in Englisch und Deutsch – mittels Textmining nutzbar zu machen. ccAligned ist vor allem darauf ausgelegt, inhaltlich vergleichbare Texte, für die bereits eine Übersetzung vorliegt, zu identifizieren. Dabei werden in URLs eingebettete Hinweise genutzt.

Seit kurzem soll LASER Übersetzungen in gesprochener Sprache erkennen. Es seien bereits 1400 Stunden französischer, deutscher, spanischer und englischer Sprache identifiziert worden. Für die Forschung an mehrsprachigen Sprachdaten hat Meta AI das Korpus CoVoST 2 erstellt, das Übersetzungen aus 21 Sprachen ins Englische und aus dem Englischen in 15 Sprachen umfasst und auf Common Voice von Mozilla aufbaut. Ein weiterer bei Github unter Creative Commons Lizenz bereitgestellter Korpus "Voxpopuli" enthält 400.000 Stunden Sprachmaterial aus dem EU-Parlament in 23 Sprachen von denen 1.800 Stunden transkribiert wurden.

Sprachtrainingsmodelle

Für die Entwicklung seiner maschinellen Sprachübersetzer habe Meta in Modelle investiert, die "trotz großer Kapazität effizient trainieren" und eigenen Angaben zufolge das "erste mehrsprachige Textübersetzungssystem" gebaut, "das nicht auf das Englische ausgerichtet ist".

Dadurch, dass eine Sprache nicht erst ins Englische und dann in eine dritte Sprache übersetzt wird, fällt ein Zwischenweg weg unter dem allerdings nicht selten die Qualität der Übersetzung leide. Für die Evaluierung seiner Ergebnisse nutzt Meta AI neben dem BLEU-Score seinen in Zusammenarbeit mit KI-Forschern erstellten Evaluierungsdatensatz FLORES-101. Der für 101 Sprachen ausgelegte Datensatz enthält Texte, die nach und während automatischer Übersetzungen von Menschen korrigiert werden.

