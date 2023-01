Die Übersetzungs-App Google Translate beherrscht seit vergangenem Jahr 131 Sprachen plus der traditionellen wie der vereinfachten Variante der chinesischen Schriftsprache. Seit Neuestem lassen sich fast alle diese Sprache offline nutzen, also ohne Übermittlung des Inhalts an einen Server. Nur noch 26 Sprachen erfordern die Verbindung zu Google.

Voraussetzung ist, dass der Anwender das entsprechende Übersetzungspaket in der Google-Translate-App zuvor herunterlädt. Anfang 2023 sind dort 33 Sprachen hinzugekommen. Für den deutschen Sprachraum dürften besonders Friesisch, Jiddisch und Lëtzebuergesch (Luxemburgisch) sowie in anderer Hinsicht Latein von Interesse sein. Die Software ist gebührenfrei sowohl für Android als auch iOS verfügbar.

Die weiteren, jetzt offline verfügbaren Sprachen sind Baskisch, Birmanisch, Cebuano, Chichewa, Korsisch, Hausa, Hawaiianisch, Hmong, Igbo, Javanisch, Khmer, Kinyarwanda, Kurdisch, Lao, Madegassisch, Maorisch, Oriya, Samoanisch, Schottisches Gälisch, Sesotho, Shona, Sindhi, Sundanesisch, Tatarisch, Turkmenisch, Uigurisch, Xhosa, Yoruba und Zulu.

Ein langer Weg zur weltweiten Übersetzungsmaschine

Mit 133 Sprachen erreicht Google Translate einen Großteil der Netizens in wenigstens einer von ihnen gesprochenen Sprache, doch stellt das nur einen Bruchteil der weltweit gesprochenen Sprachen dar. Zwar sterben laufend Sprachen aus, doch gibt es immer noch über 7.000. Die genaue Abgrenzung zwischen einer Sprache und einem Dialekt ist allerdings schwierig und häufig (politisch) umfehdet. In Deutschland vom Aussterben besonders bedroht sind Jiddisch, Nordfriesisch, Romanes, Saterländisch, Sorbisch und Südjütisch.

Eine Herausforderung für den Aufbau maschineller Übersetzung ist, dass es für viele Sprachen keine umfangreichen, sauberen Textsammlungen gibt, die inhaltsgleich auch in anderen Sprachen vorliegen. Vergangenes Jahr hat Google erstmals 24 Sprachen bei Google Translate eingeführt, bei denen das System weitgehend mit Text trainiert wurde, der nur in einer einzelnen Sprache vorlag – sogenannte zero-resource translation. Diese 24 Sprachen werden immerhin von 300 Millionen Menschen gesprochen, von Bhojpuri (50 Millionen Sprecher) und Lingala (45 Millionen) bis zu Sanskrit (20.000). Der Forderung der Färöer, in Google Translate miteinzubeziehen, ist Google allerdings noch nicht nachgekommen.

