Menü
iX Magazin

Computer-Linguisten hören bei Skype mit

Von
vorlesen Drucken Kommentare lesen 127 Beiträge

In der Vergangenheit war es bereits möglich, aus VoIP-Daten die Sprache der Teilnehmer zu ermitteln und bekannte Sätze wiederzuerkennen. Jetzt haben Wissenschaftler von der Universität des US-Bundesstaats North Carolina dieselben Charakteristika des Voice-over-IP-Verfahrens ausgenutzt, um Teile von Skype-Gesprächen zu entschlüsseln (PDF).

In vier Schritten lässt sich ein VoIP-Gespräch entschlüsseln.

(Bild: http://www.cs.unc.edu/~amw/resources/hooktonfoniks.pdf)

Für ihr Projekt hat sich die Gruppe am Spracherwerb von Kleinkindern orientiert. Anders als Erwachsene können sie nicht auf ein Wörterbuch zurückgreifen, sondern müssen unter anderem soziale und linguistische Hinweise verwenden, um Wörter zu erkennen. Ähnlich wie Babys findet die Software der Forscher zunächst Phoneme, das heißt abstrakte Laute. Diese lassen sich in den VoIP-Paketen identifizieren, da eine direkte Korrelation zwischen deren Größe und Phonemen besteht und die benutzte Verschlüsselungstechnik die ursprünglichen Paketgrößen nicht modifiziert.

In einem ersten Schritt zerlegt das Programm den verschlüsselten Datenstrom deshalb anhand der Paketgrößen in Roh-Phoneme. In einer Korrekturphase untersucht es die aufeinanderfolgenden Phoneme und ersetzt selten auftretende durch häufige Kombinationen. Im letzten Schritt schließlich fügt es die Phoneme zu Wörtern zusammen. Nach Einschätzung der Forscher seien "die Ergebnisse besser als erwartet, obwohl die Leistung im Allgemeinen nicht so gut ist wie von uns gewünscht".

Damit ein Angreifer auf diesem Weg eine mitgeschnittene VoIP-Kommunikation entschlüsseln kann, muss er die verwendete Sprache kennen sowie über eine komplette Phonem-Sammlung und eine repräsentative Auswahl gesprochener Phoneme verfügen. Außerdem hängt der Erfolg des Verfahrens davon ab, dass die VoIP-Technik variable Bitraten-Kodierung verwendet und jedes Paket immer dieselbe Gesprächsdauer (ein etwa 20ms großer "Frame") enthält. Neue Codecs können jedoch je nach Übertragungsqualität mehrere solcher Frames in einem Paket zusammenfassen. (ck)