Menü
Wissenschaft
Alle Heise-Foren > Specials > Wissenschaft > KI / Universaltranslator / Yo…
Avatar von Mr. B.B.C.
  • Mr. B.B.C.

mehr als 1000 Beiträge seit 10.09.2000

KI / Universaltranslator / YouTube Untertitelgenerator

Bei Star Trek gibt's ja nen Universaltranslator, der mit wenigen gesprochenen Sätzen lippensynchron jede völlig unbekannte Sprache von Außerirdischen übersetzen kann, weil angeblich Sprache auf mathematischen Gesetzen basiert. - Ist natürlich völliger Quatsch. Um ne Sprache komplett zu verstehen musst du alle Vokabeln und Grammatik pauken.

Grundsätzlich könnte eine KI allerdings jede bekannte Sprache in eine andere bekannte Sprache simultan übersetzen. Wie und besser als ein Dolmetscher. - Natürlich mit Verzögerung; du kannst einen Satz normal erst übersetzen, wenn er zu Ende gesprochen wurde.

Wer sich ein bisschen auskennt, ist beeindruckt von den automatisch erzeugten Untertiteln von DuRohr. Die sind auch mitunter verdammt hilfreich, aber für Gehörlose unbrauchbar. Wobei man durchaus die größten Teile erstaunlich gut ausgespuckt bekommt.

Mal bei diesem Video ausprobieren:
https://www.youtube.com/watch?v=HaBQfSAVt0s
- (automatisch erzeugte) Untertitel auf Englisch aktivieren.

Dabei zeigen sich schon mal die ersten Probleme bzw. dass es unweigerlich ein künstliches Gehirn braucht, um Sprache zu verstehen. In diesem Fall "weiß" die eingesetzte KI z.B. nicht, dass es eine Person namens "Theresa May" gibt und es um sie geht. Gerade bei Homophonen ist der Kontext bekanntermaßen wichtig. - Ganz zu schweigen, wenn einer Wortspiele betreibt und BEWUSST Homophone falsch einbaut.

Die hier verwendete KI pickt offensichtlich die wahrscheinlichsten Wörter raus die "sie versteht"; hier gilt definitiv nicht "Schreiben wie man's spricht". Es ist nicht einfach nur ein simpler Wave=>Textkonverter. Dazu sind die Treffer viel zu intelligent. Man vergleiche das einfach mal mit Google Translate.

Gesang kann der Untertitelgenerator interessanterweise nicht, aber er erkennt bestimmte Geräusche, spuckt dann z.B. "[music]" aus.

Bemerkenswert ist auch, wenn man Begriffe aus anderen Sprachen einbaut wie z.B. "Haute Couture" - bei sehr gängigen derartigen Phrasen natürlich kein Problem. Man stelle sich aber vor, einer sagt "in meinem Land nennen wir das ..." Da muss die KI begreifen, dass jetzt ein Wort einer anderen Sprache kommt. Zum Beispiel "Fackelaki". Ohne Gehirn wird in Englisch so was wie "fuck a late key" draus.

Und das ist erst Schritt 1 bei einem Universaltranslator. Das Gesprochene "verstehen". Beim Übersetzen eines notwendigerweise richtig verstandenen Satzes muss genauso intelligent die beste Entsprechung einer Formulierung gefunden werden; es kann einen rhetorischen Kniff geben, für das man eine Entsprechung suchen sollte. Man sieht ja an Google Translate bzw. dem Urgestein Altavista Babelfish (1997) was ohne Gehirn bei Übersetzungen rauskommt. Z.B. "Schweinelendchen" => "pig misery".

---

Derartige Spracherkennung ist erst vor wenigen Jahren aufgepoppt. Ein überraschender Quantensprung, genauso wie autonom fahrende Autos. Die Technik "steckt" natürlich noch "in den Kinderschuhen", aber das WAS bereits geleistet wird ist unglaublich.

Ein anderer Aspekt allerdings der sich bei dem Video zeigt: dieser Untertitelgenerator weigert sich beharrlich, "fucking", "fuck" und "fucked" zu schreiben. Zum Beispiel bei Minute 18:55 und 20:15 (BTW hier die missglückte Interpretation "you're pointlessly fucking yourselves" => "your purchase Lee <lostintranslation> yourselves")

Das Posting wurde vom Benutzer editiert (20.02.2019 16:41).

Bewerten
- +
Anzeige