Siris großer Bruder

Spracherkennungssysteme auf Smartphones ermöglichen Stimmprofile. Forscher mahnen, dass Strafverfolger und Hacker damit Personen identifizieren können.

Lesezeit: 5 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 3 Beiträge
Von
  • David Talbot

Spracherkennungssysteme auf Smartphones ermöglichen Stimmprofile. Forscher mahnen, dass Strafverfolger und Hacker damit Personen identifizieren können.

Apples Software-Assistent Siri ist eine der wichtigsten Innovationen im Mobile Computing der letzten Zeit gewesen. Millionen Smartphone-Nutzer kommunizieren inzwischen mittels Siri in natürlicher Sprache mit ihrem Gerät. Worüber sich wohl die wenigsten den Kopf zerbrechen: Jedes gesprochene Wort wird auf den Servern von Apple für unbestimmte Zeit gespeichert. Forscher mahnen nun, dass diese Aufzeichungen Stimmprofile ermöglichen, die Strafverfolgern und Hackern zur biometrischen Identifizierung einer Person verhelfen.

Apple-Sprecherin Trudy Muller bestätigt, dass Spracheingaben wie die Frage: "Wie wird das Wetter heute Nachmittag?" von dem Unternehmen gespeichert werden. "Diese Daten werden aber nur für Datenverarbeitung der Siri-Anwendung genutzt sowie zu ihrer Verbesserung." Apple nehme den Schutz der Privatsphäre "sehr ernst", betont Muller. Die Fragen der Nutzer und die Antworten von Siri würden verschlüsselt übertragen, Sprachaufzeichnungen nicht mit anderen Informationen eines Nutzers verknüpft. Das stimmt allerdings nicht ganz.

Um eine Frage an Siri zu bearbeiten, werden die Sprachdaten an Apple-Server übertragen, dort in Lautbestandteile zerlegt und die erkannten Worte dann inhaltlich analysiert. Um den Inhalt in einen Kontext zu stellen, greift das Analysesystem auch auf die Kontaktliste und die Position des Smartphones zurück, von dem die Frage stammt.

Dass ein mögliches Privacy-Problem nicht so weit hergeholt ist, zeigt schon die Praxis des US-Heimatschutzministeriums, mit Hilfe von Stimmmprofilen Reisende zu identifizieren, um sie an Grenzübergängen schneller abfertigen zu können. Die Reisenden müssen immerhin vorher eingewilligt haben, dass ein Stimmprofil von ihnen verwendet wird.

Ein anderes Beispiel: In einem Mordprozess in Florida legte die Staatsanwaltschaft als Belastungsmaterial Websuchen nach "Chloroform" vor, die auf einem beschlagnahmten Computer rekonstruiert worden waren. Die Verteidigung wandte ein, die Mutter der Angeklagten habe die Websuche vorgenommen und sich verschrieben – eigentlich habe sie nach Links zu "Chlorophyll" gesucht. Wäre die Suchanfrage auf einem iPhone an Siri gegangen, hätten Strafverfolger nachprüfen können, ob die Mutter oder die Angeklagte selbst die Suchanweisung ausgesprochen hat. Auf Nachfrage wollte sich Apple nicht dazu äußern, ob es bereits von Gerichten zur Herausgabe von Sprachaufzeichnungen gezwungen worden sei.

Prem Natarajan von Raytheon BBN, das ein Forschungzentrum zu Spracherkennung betreibt, sieht weitere Datenschutzprobleme. Repressive Regime könnten sich für Aufzeichnungen interessieren, wer sein Smartphone nach dem Ort einer politischen Demonstration gefragt habe. "Die Sprachaufzeichnungen werden so zum biometrischen Merkmal von Andersdenkenden", sagt Natarajan, und damit zu einer Waffe.

Einige IT-Unternehmen wiederum sorgen sich darum, dass ihre Mitarbeiter unwissentlich Betriebsgeheimnisse preisgeben könnten. IBM hat deshalb kürzlich seinen Angestellten verboten, Spracherkennungssysteme auf ihren Smartphones zu nutzen. "Als Großunternehmen oder Sicherheitsdienst würde ich diese Technologie auch nicht erlauben", sagt Radu Sion, einer der führenden Spezialisten für Cloud-Computing-Sicherheit an der Stony Brook University im US-Bundesstaat New York.

Das Problem ließe sich entschärfen, indem Apple einen Teil der Datenverarbeitung von der Cloud zurück aufs Smartphone verlagert. Dann würde nur noch ein Teil der Daten an Apple übertragen, die sich nicht ohne weiteres einem Nutzer zuordnen lassen. "Vielleicht sollte alles, was eine Identifizierung ermöglicht, auf dem Gerät bleiben", sinniert Prem Natarajan.

Das würde zwar den Smartphone-Prozessor stärker belasten als bislang, die Qualität der Spracherkennung aber nicht verschlechtern. Für Apple und andere Smartphone-Hersteller sei das keine Zumutung, sagt Natarajan. Microsoft handhabe es mit der Konsolensteuerung Kinect auch so, dass persönliche Daten im Gerät blieben.

Es gebe jedenfalls keinen technischen Grund, die Zerlegung in Lautbestandteile nicht schon auf dem iPhone vorzunehmen, sagt Natarajan. Die konkrete Wellenform der Sprachaufzeichnung sei für die inhaltliche Analyse unerheblich. Der MIT-Informatiker James Glass verweist darauf, dass es bereits umfangreiche Arbeiten zur "verteilten Spracherkennung" auf Endgeräten gebe. "Eine vollständige Anonymisierung ist so aber noch nicht sichergestellt", schränkt Glass ein. Dafür müsste man die Sprachdaten von der Gerätenummer entkoppeln.

Dann jedoch könnte das Spracherkennungssystem das Profil eines Nutzers nicht mehr verfeinern, um ihn im Laufe der Zeit besser zu verstehen. "Manche Menschen würden diese Option wählen, wenn dadurch der Datenschutz besser wird", sagt Glass. "Ich würde diese Lösung bevorzugen."

Je mehr Sprachanwendungen für mobile Geräte entwickelt werden, desto wichtiger werde der Schutz vor biometrischen Identifizierungsmerkmalen, glaubt Andrew Sudbury, Mitgründer von Abirre. Die Bostoner Firma entwickelt Systeme, mit deren Hilfe Nutzer das Online-Tracking im Netz blockieren können. "Wir sind eigentlich schon an einem Wendepunkt" sagt Sudbury. "Es wird immer einfacher, Menschen anhand ihrer Stimme zu identifizieren."

Vielleicht will sich Apple diese Möglichkeit als künftige Dienstleistung offenhalten, wenn es an der Speicherung von Sprachaufzeichnungen festhält. Das Siri-System würde einen Nutzer unabhängig vom Gerät erkennen, mit dem er gerade spricht, sagt Natarajan. Das sei zwar erst einmal reine Spekulation. "Aber bei Innovation geht es ja darum, Dinge zu machen, an die im Moment keiner denkt."

(nbo)