Menü

Dragon NaturallySpeaking 12: Spracherkennung aufgebohrt

vorlesen Drucken Kommentare lesen 42 Beiträge

Der Sprachspezialist Nuance hat Version 12 seines Diktierprogramms Dragon NaturallySpeaking vorgestellt. Wie immer steht ganz oben auf der Liste der Neuerungen der Punkt "Verbesserte Erkennungsleistung". Tatsächlich erkennt aber bereits die aktuelle Version 11.5 Spracheingaben mit recht hoher Genauigkeit, sofern man die Software durch entsprechende Vorbereitung richtig einstellt. Für Diktier-Profis dürften die weiteren Neuigkeiten daher interessanter sein. Laut Hersteller sind dies: Verbesserungen bei der Nutzung von Mehrkern-Prozessoren, Unterstützung für Gmail und Hotmail, ein neues Lernprogramm, sogenannte SmartFormat Regeln und eine natürlicher klingende Sprachausgabe. Die mit der Zwischenversion 11.5 eingeführte Möglichkeit, iPhones als Diktiergeräte-Ersatz zu verwenden ("Dragon Remote Mic") gibt es jetzt auch für Android-Smartphones.

Mit den sogenannten SmartFormat-Regeln soll der Anwender die Schreibweise von Abkürzungen, Maßangaben und Anredeformen seine Vorlieben anpassen können.

Das neue Lernprogramm ist eine Mischung aus Sprechertraining und interaktiver Einführung in die Bedienung der Software mit deutlichen Parallelen zu dem gelungenen Lernprogramm der Windows-Diktierfunktion. Die SmartFormat-Regeln erleichtern es dem Anwender, beispielsweise die Schreibweise von Abkürzungen oder Maßangaben an seine Vorlieben anzupassen. Insgesamt wirkt die Oberfläche des Programms gründlich überarbeitet und aufgeräumt.

Die wechselvolle Geschichte von Dragon NaturallySpeaking begann im April 1997 mit einem ersten kontinuierlichen Spracherkennungssystem mit allgemeinsprachlichem Vokabular. 2000 wurde der ursprüngliche Hersteller Dragon Systems vom belgischen Unternehmen Lernout & Hauspie gekauft. Nuance, damals noch unter dem Namen ScanSoft, erwarb die gesamte Spracherkennungs- und Text-to-Speech-Technik des belgischen Spracherkennungsspezialisten nach dessen Insolvenz in Folge eines Finanzskandals. Später übernahm ScanSoft unter anderem die Spracherkennungssparte von Philips und kaufte den Sprachsoftware-Entwickler Speechworks. Schließlich übernahm die Firma 2005 den Sprachspezialisten Nuance Communications und nahm nach Abschluss der Transaktion den Namen "Nuance" an. Durch Übernahme der Firma Tegic von Time Warner ging auch die Worterkennungssoftware T9 in den Besitz von Nuance über. Der Hersteller bietet die diversen Spracherkennungslösungen inzwischen in vielen Kombinationen und für viele Plattformen an, etwa eine Kombination aus der Dragon-Spracherkennung und der Worterkennung T9 in der Android-App FlexT9.

Dragon NaturallySpeaking 12 soll es in vier Versionen geben: Die Einsteigervariante Home kostet 99 Euro, die Premium-Version für 149 Euro bietet zusätzlich Unterstützung für Bluetooth-Headsets und die Möglichkeit, Audio-Aufzeichnungen umzusetzen sowie wahlweise auch in Englisch zu diktieren. Diese Version des Programms wird es auch als Premium Mobile mit digitalem Aufnahmegerät und als Premium Wireless mit Bluetooth-Headset für je 299 Euro geben. Die Version Professional für 699 Euro richtet sich an Geschäftskunden, in der Version Legal (899 Euro) für Juristen sind spezielle juristische Fachvokabulare enthalten. Die Premium Edition (auch Mobile und Wireless) soll ab Ende August, die Home Edition ab Anfang September im Handel verfügbar sein. Das Programm läuft unter Windows ab XP (SP3) und wird laut Hersteller unter Windows 8 im Destop-Modus funktionieren, jedoch höchstwahrscheinlich nicht auf Surface RT. (dwi)