Der Übersetzer, der von den Lippen abliest
Jedem sein eigener Synchronsprecher: Elektronisches Übersetzungssystem soll direkt in Fremdsprachen wiedergeben
Mittlerweile gibt es die ersten tragbaren Übersetzungssysteme, die mit Spracherkennung arbeiten: der Tourist spricht seinen Wunsch ins Gerät und das quäkt die Übersetzung in der Fremdsprache aus dem Lautsprecher. Das mag funktionieren, macht aber einen ziemlich dämlichen Eindruck und hält auf. Zukünftig soll es die Übersetzung "live", fast ohne Verzögerung geben.
In Kürze sollen Amerikaner und Engländer auch dann spanisch oder deutsch sprechen können, wenn sie die Sprache überhaupt nicht beherrschen. Dies ist der Plan von Tanja Schultz, Sprachforscher an der Carnegie Mellon University in Pittsburgh, USA, wie der New Scientist berichtet. Erste Systeme dieser Art gibt es heute schon zu kaufen: Bei diesen muss erst der Text in der eigenen Muttersprache ins Gerät gesprochen werden, dann ist ein Knopf zu drücken, woraufhin die Übersetzung in der Fremdsprache wiedergegeben wird. Das mag besser sein als das lange Blättern in einem Vokabelbuch, doch wirklich praktisch ist es für längere Gespräche nicht - und auch wenn man nur eine Fahrkarte kaufen will, wirkt es auf die Umstehenden schlimmer als eine echte Behinderung.
Schultz sieht den Schritt, die Sätze erst in der eigenen Sprache laut sprechen zu müssen, bereits als störenden Umweg an: Auf diese Art verdoppelt sich der Zeitaufwand für eine Konversation, weil der Übersetzer nur entweder zuhören oder sprechen kann und auch das Gegenüber nicht damit klarkäme, wenn man gleichzeitig in der eigenen Sprache vor sich hin brabbelt, während ein elektronisches Gerät in einer anderen Sprache redete. Schon die in Deutschland oft üblichen Interviews mit Synchronton und darunter liegendem (und in Sprachpausen des Übersetzers in der Lautstärke hochgezogenen Originalton) überfordern so manchen Fernsehzuschauer.
Stumm artikulieren für den Computer
Schultz hat stattdessen ein System entwickelt, das mit Elektroden an Gesicht und Hals die elektrischen Impulse interpretieren soll, die das Gehirn an die Gesichtsmuskeln und die Zunge schickt, um die entsprechenden Wörter auszusprechen. Der Benutzer des Übersetzers muss diese dann auch gar nicht mehr tatsächlich aussprechen, da keine Spracherkennung benutzt wird, sondern eben nur die entsprechenden Mundbewegungen machen und die Wörter stumm sprechen. Die Übersetzung käme dann mit geringer Verzögerung bereits aus dem Gerät, während der Besitzer noch "spricht" - fast wie bei einem synchronisierten Film.
|
|
Das ultimative Ziel ist es, dass mit Hilfe eines solchen Gerätes eine ganz normale flüssige Konversation möglich wird, so der ebenfalls an der Carnegie Mellon University arbeitende Sprachforscher Alan W. Black. Allerdings müssten dazu beide Gesprächspartner je eine solche Installation benutzten – den Übersetzer einfach wie bisherige Geräte seinem Gesprächspartner hinüberzureichen und die Übersetzungsrichtung umzuschalten, dürfte hier nicht weit führen.
Im Oktober 2005 demonstrierte Tanja Schultz zusammen mit ihrem auch an der Carnegie Mellon University tätigen Kollegen Dr. Alex Waibel von der Technischen Hochschule Karlsruhe den ersten automatischen Übersetzer, der die elektrischen Signale von Gesicht und Kehlkopfmuskeln aufnehmen und in einen geschriebenen Text oder synthetische Sprache umsetzen konnte. Die entsprechende Technik wird als subvokale Spracherkennung (sub-vocal voice recognition) bezeichnet.
Wortschatz ohne Grenzen
Die Software während der Demonstration lief auf einem normalen Notebook und übersetzte Mandarin-Chinesisch in Englisch oder Spanisch, doch war ihr Wortschatz mit nur etwa 100 Wörtern sehr begrenzt, die der Benutzer dem System zudem auch noch erst antrainieren musste. Inzwischen ist der Sprachschatz theoretisch unbegrenzt, da nicht mehr nur Wörter, sondern auch Phoneme erkannt werden, aus denen die Wörter zusammengesetzt werden können. Für englische Spracherkennung sollen 45 Phoneme ausreichen. Dabei wird – ähnlich wie es inzwischen auch bei normaler Spracherkennungssoftware gehandhabt wird ("Die heiße Samantha will jetzt sofort mit Dir simsen") – eine Liste verwendet, die Wahrscheinlichkeiten enthält, welche Phoneme üblicherweise in engem Zusammenhang stehen und in welcher Reihenfolge. Wenn es dann einmal nicht auf Anhieb klappt mit der vollständigen Spracherkennung, wird auf Grundlage dieser Tabellen das wahrscheinlichste Ergebnis gewählt.
Noch allerdings sind die Ergebnisse mager: werden dem System Worte vorgesprochen, die es in dieser Reihenfolge noch nie gehört hat, wählt es nur mit 62% Wahrscheinlichkeit die richtige Übersetzung, was allerdings trotz allem ein großer Fortschritt ist, so Chuck Jorgensen, der an eben dieser Art von Spracherkennung für die Robotersteuerung am NASA Ames Research Center in Kalifornien arbeitet.
http://www.heise.de/tp/artikel/23/23835/1.html- Antwort: (1.11.2006 0:58)
- Aktion: automatische Überschriften für Antworten bei TP (31.10.2006 14:35)
- Antwort: (31.10.2006 4:18)
Darstellungsbreite ändern
Da bei großen Monitoren im Fullscreen-Modus die Zeilen teils unleserlich lang werden, können Sie hier die Breite auf das Minimum zurücksetzen. Die einmal gewählte Einstellung wird durch ein Cookie fortgesetzt, sofern Sie dieses akzeptieren.
Aktive und passive Alien-Artefakte im Sonnensystem
SETA - Spurensuche nach dem extrasolaren Monolithen - Teil 2
