Der Siri-Effekt

@ctmagazin | Editorial

Samstagvormittag, das Frühstück ist vorüber, in der Küche brummt die Spülmaschine. Und was war das? Es klang wie (1) "Möchtest du dich noch mal hinlegen und c‘t lesen?" oder (2) "Könntest du nicht mal den Flur fegen? Hier’s ’n Besen."

Der Siri-Effekt

Samstagvormittag, das Frühstück ist vorüber, in der Küche brummt die Spülmaschine. Und was war das? Es klang wie (1) "Möchtest du dich noch mal hinlegen und c‘t lesen?" oder (2) "Könntest du nicht mal den Flur fegen? Hier’s ’n Besen." Der erfahrene Ehemann analysiert die Gesamtsituation und kommt zu dem Ergebnis, dass die Wahrscheinlichkeit für (1) nahezu null Prozent beträgt, während die für (2) bei weit über 90 Prozent liegen dürfte.

Genauso arbeitet maschinelle Spracherkennung. Es geht immer darum, wie wahrscheinlich eine Äußerung in einem bestimmten Kontext ist. Sogenannte Sprachmodelle sind vor allem eine riesige Sammlung von Wahrscheinlichkeitswerten. Anfangs waren Büro-Rechner damit überfordert. Inzwischen reicht die Rechenleistung eines Desktop-PC locker aus, um ein Diktierprogramm auszuführen - mit verblüffend guten Ergebnissen. Es ist vielleicht nicht jedermanns Sache, aber es funktioniert schon seit Jahren.

IT-affine Menschen hat das bisher wenig interessiert. "Spracherkennung? Hör‘ mir auf! Da muss man ewig trainieren und dann klappt es trotzdem nicht." Doch seit das iPhone 4S mit der Sprachsteuerung Siri auf den Markt kam, ist Spracherkennung plötzlich hip. Viele iPhone-Besitzer machen ihrem Gerät mehrmals täglich einen Heiratsantrag oder fragen es nach dem Sinn des Lebens. Nach der eigentlichen Spracherkennung folgt bei Siri eine semantische Analyse, die auf solche Eingaben lustige Antworten generiert. Manchmal sagt sie auch artig: "Entschuldigung, ich verstehe nicht."

Längst gibt es jede Menge Siri-Klone im App Store und im Marketplace. Sie tragen Mädchennamen wie Evi, Iris, Alice, sprechen nur Englisch und befinden sich im frühen Beta-Stadium. Macht aber alles nichts, das Publikum hat sehr viel Nachsicht. "Tolle App!", steht in den Bewertungen. "Hat mich zwar ständig falsch verstanden, aber das lag bestimmt nur an meinem schlechten Englisch."

Was ist da passiert? Siris Geplauder trifft offenbar den Nerv der Zeit. Die Thesen der starken KI haben wieder Konjunktur: Man möchte sich Systeme vorstellen, die nicht nur intelligent wirken, sondern es tatsächlich sind. Wer die Sprachsteuerung eines Smartphones ernsthaft nutzen will, wird vor allem Wert auf präzise Spracherkennung und gute Integration ins Betriebssystem legen. Beides bewies die iPhone-Sprachsteuerung im Test (siehe c't 5/2012, S. 84). Aber berühmt geworden ist sie aufgrund ihres Unterhaltungswerts. Darüber mag man den Kopf schütteln - doch dass die Spracheingabe aufgrund von Siri endlich mehr Aufmerksamkeit und Akzeptanz erfährt, das ist auf jeden Fall ein positiver Effekt. (dwi)

Kommentare

Anzeige
Anzeige