Deutsche Sprache, schwere Sprache

Ingo T. Storm Spracherkennung und automatische Übersetzung

Trends & News | News

Neben Dutzenden von taschenrechnergroßen Wörterbüchern beschäftigten sich die CeBIT-Vorstellungen von Übersetzungsprogrammen vorwiegend mit neuen Versionen bekannter Produkte. Das gleiche Bild bietet sich bei Diktier- oder Sprachsteuerungslösungen.

Die kommerzielle Spracherkennung scheint im letzten Jahr auf der Stelle getreten zu sein - so erscheint es zumindest auf den ersten Blick. Beim zweiten Hinschauen wird klar, daß die Branche ihren ersten großen Technologieschub hinter sich hat und die Entwicklung jetzt `normal' voranschreitet: die gleiche Leistung gibt es jetzt für weniger Geld oder mit schwächerer Hardware - oder die Leistung steigt bei weitestgehend konstantem Aufwand.

So zum Beispiel der SpeechMaster, eine Lösung für sprecherabhängige, aber kontinuierliche Spracheingabe mit kleinen Vokabularen. Bei der vorgeführten und für Juni angekündigten Version 3.0 entfällt die Forderung nach einer eigenen Karte mit digitalem Signalprozessor (DSP) - ein zum Soundblaster-16-Pro kompatibler Krachmacher tut es jetzt auch. Außerdem hat die Norderstedter Firma aspect vor rund einem Jahr den Schritt von DOS nach Windows vollzogen - jetzt steht der Aufstieg in Richtung Windows 95 oder Windows NT ins Haus.

Ähnlich das Bild bei IBM. Das Diktiersystem VoiceType läuft in der Version 1.32 auch auf Windows 95 (Update von der Windows-Version um 200 DM). Wie es dann im Laufe des Jahres weitergeht, ist aber noch nicht sicher. So wird auch hier gemunkelt, daß VoiceType die proprietäre DSP-Karte nicht mehr benötigt, sondern mit einer Standard- Soundkarte auskommt. Auf diesem Wege dürfte ein recht ausgereifter Anteil des Produkts, nämlich die Komponenten zur Steuerung der Betriebssystemoberfläche, endlich einer größeren Benutzerschicht zeigen, was Spracherkennung kann: `Command and Control' wird voraussichtlich zum Lieferumfang der nächsten OS/2-Version `Merlin' gehören. DragonDictate von Dragon Systems läuft schon seit einiger Zeit mit Soundblaster- kompatiblen Soundkarten. Aktuell ist hier die Version 2.0 - ebenfalls für Windows 95 - mit verbessertem Basisvokabular, das schon vor dem sprecherspezifischen Training recht gute Erkennungsraten liefern soll.

Leider gibt es diese Version zur Zeit nur in Englisch. Auch bei der maschinellen Übersetzung macht der Fortschritt keine großen Sprünge: wie bei der Spracherkennung heißt der Trend `Downsizing'. Mit dem Personal Translator von IBM und Langenscheidts T1 gehen gleich zwei Produkte mit den Übersetzungsrichtungen Deutsch/Englisch und Englisch/Deutsch ins Rennen, die ehemals auf Workstations beziehungsweise Mainframes liefen: der Personal Translator stammt aus IBMs Forschungslabors, während hinter T1 eine PC-Variante des altehrwürdigen METAL von Siemens steckt.

IBM hat dabei den Bedürfnissen des PC-Markts besser Rechnung getragen. Weder von dem gigantischen Know-how noch von dem im Wörterbuch kodierten linguistischen Wissen bekommt der Anwender viel mit: er sieht nur einen kleinen Ausschnitt der komplexen Wörterbuchstruktur. In der Basisversion läßt sich das Wörterbuch nur um Substantive und Eigennamen erweitern. Erst in der `plus'-Variante kann man auch Adjektive und Verben erfassen. Diese Version soll außerdem auch weit vom Bezugswort entfernt stehende Pronomina korrekt erkennen, typisch deutsche Bandwurmkomposita korrekt auflösen und bei der Arbeit laufend `dazulernen' (Stichwort Translation Memory).

Die Kooperation zwischen IBM und dem Klett-Verlag (PONS-Wörterbücher) beschert dem Personal Translator außerdem große und recht aktuelle Wörterbücher. Langenscheidts T1 präsentiert sich weniger homogen und PC-gerecht. Der Name Langenscheidt garantiert zwar, daß die Wörterbücher denen des Personal Translator in nichts nachstehen. Mit der Oberfläche hat der Wörterbuchverlag dagegen keine wesentlich glücklichere Hand bewiesen als mit dem schon 1991 gescheiterten PC-Wörterbuch für DOS: sie reicht den verwirrenden Leistungsumfang des Profiwerkzeugs METAL nahezu ungefiltert an den Endanwender durch. Auf der Haben-Seite stehen eine ansprechende Integration in Word für Windows und die Bereitstellung der stilistischen Informationen zu den Wörterbucheinträgen.

Die Kölner HEI-Soft GmbH holt mit TranscenD ein relativ neues Produkt der US-Firma Intergraph auf den deutschen Markt. Die Version 1.1, von der Demoversionen für eine Schutzgebühr von 12 DM erhältlich sind, macht einen recht soliden Eindruck. Auch wenn das Vokabular nicht so umfangreich ist wie bei den oben genannten Konkurrenten: allein die Erfolge bei der Analyse komplexer Sätze lassen auf gute Ergebnisse nach einer gewissen Einarbeitungszeit hoffen.

In der Wissenschaftshalle 22 stellte die Universität Köln schließlich noch einen recht neuen Ansatz in der maschinellen Übersetzung vor: LPS ist ein in Modula2 geschriebener Prolog-Interpreter, der Sprache objektorientiert darstellt. LPS erzeugt aus einem zu übersetzenden Satz zunächst im Bottom-Up-Verfahren einen Baum, dessen Struktur die Beschreibung der Quellsprache bestimmt. Dieser Baum wird unmittelbar in den äquivalenten Baum in der Zielsprache übertragen. Erst von dort aus erfolgt die Synthese des zielsprachlichen Satzes.

Auch nach gut dreißig Jahren Computerlinguistikforschung ist der vom Anwender sehnlichst erwartete Durchbruch also in weiter Ferne: solange es nicht gelingt, umfangreiches Weltwissen im Computer zu repräsentieren, werden sprachverarbeitende Systeme auch mittelfristig nur kompromißbehaftete Teilerfolge erzielen. Diese können sich inzwischen aber sehen lassen. (it)

Anzeige