Menü

CIA hört mit – und versteht

Während die weltweite Überwachung der Kommunikation mittels des Echelon-Abhörsystems inzwischen wohl zur Routine der US-amerikanischen Geheimdienste gehört, so war eine umfassende automatisierte Analyse wegen der unglaublichen Datenmengen bisher noch problematisch. Nach US-Medienberichten hat das Office of Advanced Information Technology (AIT), eine Forschungsabteilung des CIA, ein Programm entwickelt, mit dem sich Audiosignale gezielt, auch nach Sprechern unterschieden, in Text umwandeln lassen.

Das Computerprogramm Oasis konvertiert beliebige Audiosignale in Klartext. Dabei kann das Programm nicht nur unterschiedliche englische Dialekte auseinander halten, es erkennt auch, ob der Sprecher männlich oder weiblich ist und kann unterschiedliche Gesprächsteilnehmer identifizieren. Diese werden im Text dann als "Male 1", "Male 2", "Female 1", "Female 2" usw. gekennzeichnet. Ist eine Stimme einmal namentlich identifiziert, so wird ihr Profil in einer Datenbank gespeichert und kann später jederzeit wieder zugeordnet werden. Würde man Oasis bei der Überwachung von Telefongesprächen einsetzen, könnten somit alle Gespräche eines Anrufers automatisch ausgefiltert werden, egal von welchem Apparat aus die Person telefoniert.

Anzeige

Durch diese Automatisierung verkürzt sich die Zeit, um ein 30-minütiges Audiofile umzusetzen, von 90 auf zehn Minuten. Wenn der Bearbeiter bei dem maschinell erstellten Text dann Ungereimtheiten entdeckt, kann er sich auf Mauklick das ursprüngliche Soundfile anhören. Die so erstellten Textdokumente können dann anhand von umfangreichen Dictionary-Datenbanken nach Schlüsselbegriffen und Synonymen durchsucht oder auch mit neueren Methoden einer intelligenten Kontextanalyse unterzogen werden. Neben einer englischen Version entwickelt das CIA auch Varianten für andere Sprachen wie Arabisch und Chinesisch. Laut AIT-Direktor Larry Fairchild wird Oasis derzeit vom Foreign Broadcast Information Service des CIA in einer asiatischen Stadt eingesetzt und soll aber in Zukunft auch im Nahen Osten verwendet werden.

Damit die Mitarbeiter der CIA bei der Überwachung von Kommunikationsdaten in insgesamt 35 verschiedenen Sprachen nicht erst umfangreiche Sprachkurse belegen müssen, kann das Programm FLUENT Textdokumente automatisch übersetzen. In FLUENT gibt der Benutzer Suchbegriffe wie "bomb", "assasin" oder "Osama bin Laden" ein und erhält alle zugehörigen Textdokumente in unterschiedlichen Sprachen wie Chinesisch, Koreanisch, Russisch oder Arabisch. FLUENT erstellt automatisch eine Übersetzung der Textdokumente für eine Vorauswahl. Für eine genauere Analyse sind jedoch weiterhin menschliche Übersetzer nötig.

Um in diesen Informationsfluten nicht zu ertrinken, setzt die CIA spezielle Data Mining Tools ein, die Textdokumente automatisch nach Schlüsselbegriffen indizieren. Die Häufigkeit der verwendeten Begriffe wird dabei ebenso berücksichtigt wie unterschiedliche Schreibarten. Mit einem weiteren Tool erhält der Bearbeiter eine kurze inhaltliche Zusammenfassung des Textes. Nach eigenen Angaben hat die CIA seit 1979 allein 1,2 Millionen Dokumente über "kriminelle Vorgänge" im Irak gesammelt. (hag)

Anzeige