Der maschinelle Analyst

Raytheon BBN hat ein System entwickelt, das digitale Nachrichtenquellen durchforstet und daraus Dossiers für Militär und Sicherheitsbehörden erstellen soll. Perfekt sind die Ergebnisse noch nicht.

Lesezeit: 5 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Von
  • David Talbot

Raytheon BBN hat ein System entwickelt, das digitale Nachrichtenquellen durchforstet und daraus Dossiers für Militär und Sicherheitsbehörden erstellen soll. Perfekt sind die Ergebnisse noch nicht.

Die Einträge, die auf dem Bildschirm erscheinen, wirken vertraut. Wie Wikipedia-Einträge zu Personen und Organisationen. Doch keiner der zigtausend ehrenamtlichen Autoren hat sie geschrieben - sondern die Rechner eines Forschungsprojekts. Im Auftrag des US-Verteidigungsministeriums hat die Firma Raytheon BBN ein System entwickelt, das digitale Nachrichten durchforstet und daraus, annähernd in Echtzeit, Dossiers für Militär und Sicherheitsbehörden erstellen soll.

Als Quellen dienen 40 Nachrichtenseiten in englischer, chinesischer und arabischer Sprache. Weitere Sprachen sollen folgen, ebenso die Auswertung von TV-Nachrichten. Ende des Jahres will Raytheon BBN dem Pentagon die erste Version des Systems liefern. Der Rüstungskonzern Raytheon hatte BBN Technologies 2009 übernommen.

Sucht man etwa nach Informationen über die nigerianische Islamistengruppe Boko Haram, spuckt das System folgende Zusammenfassung aus: "Gegründet 2002 von Mohammed Yusuf, wird Boko Haram von Ibrahim Abubakar Shekau geführt (Yusuf war zwischenzeitlich auch Führer). Das Hauptquartier befindet sich in Maiduguri. Die Gruppe wird beschrieben als eine 'radikale fundamentalistische Sekte', als 'Hauptunruheherd des Landes', als 'Splittergruppe ohne klare Struktur' sowie als 'irregeleitete extremistische Sekte'."

Zwar ist der Wikipedia-Eintrag zu Boko Haram eindeutiger. Doch das BBN-System erfasse alles, was auf Nachrichtenseite einlaufe und füge kontinuierlich Informationen hinzu, sagt Sean Colbath von Raytheon BBN bei einer Vorführung der Technologie. "Natürlich könnte ich selbst 200 Artikel über den syrischen Diktator Bashar Al-Assad lesen, aber ich hätte gerne eine Maschine, die das für mich erledigt." Im System ist unter anderem gespeichert, dass Assad eine Zulassung als Augenarzt hat.

Jedes Dossier beginnt, indem zunächst eine "Entität" angelegt wird. Das kann der Name einer Organisation sein wie Boko Haram oder der einer Person. Dabei werden verschiedene Schreibweisen zusammengeführt. Im nächsten Schritt erfasst das System Verbindungen zu anderen Entitäten aus deren oder aus eigenen Aussagen. "Die Beziehungen werden automatisch hergestellt", erläutert Colbath. "Die Maschine hat zuvor aus Beispielen gelernt, wie man solche Beziehungen erkennt."

Im Boko-Haram-Dossier folgt nach der Eingangsbeschreibung eine Liste von Organisationen, die mit der Gruppe in Verbindung stehen sowie Aussagen über sie. Klickt man ein Element der Liste an, gelangt man zu den Originalquellen. Viele Berichte stammen von den Seiten Al Sharq in Qatar oder Al Balad im Libanon. Manche sind aus dem Arabischen ins Englische übersetzt.

Wie so oft, hat das BBN-Projekt seinen Ursprung bei der DARPA, der umtriebigen Forschungsbehörde des Pentagons. Die fördert seit längerem die Forschung an Maschinen, die wie Menschen lesen können sollen. Neben Raytheon BBN haben auch SRI International – das an der Beteiligung von Apples Assistenzsoftware Siri beteiligt war – und IBM Prototypen entwickelt.

Mit solchen Dossiers soll das BBN-System das Pentagon unterstützen. Hier am Beispiel der Muslim-Bruderschaft.

(Bild: Raytheon BBN)

Das Maschinenlesen habe sich zuletzt verbessert, sagt Bonnie Dorr, Leiterin des entsprechenden DARPA-Programms. Inzwischen könnten die Systeme eine grundlegenden Sachverhalte aus unterschiedlichen Formulierungen herausziehen. Wenn es heißt, "Joe ist mit Sue verheiratet" und "Sue ist Joes Ehefrau", geht es in beiden Fällen darum, dass die Beziehung zwischen Joe und Sue eine Ehe ist. Ebenso ließen sich Emotionen aus Formulierungen wie "das ist wirklich toll" erschließen.

Dennoch tun sich Systeme zur inhaltlichen Textanalyse immer noch schwer, Humor, Sarkasmus, Redewendungen oder feine Bedeutungsnuancen in der Formulierung durch eine veränderte Satzstellung korrekt zu erfassen. Auch das BBN-System ist noch nicht perfekt, so dass die Dossiers manchmal seltsam klingen. Über US-Präsident Barack Obama vermerkt es: "Obama wird beschrieben als 'Friedensnobelpreisträger', als "der einzige vernünftige Kerl im Raum', als 'ein Anti-Apartheid-Campus-Aktivist' und als 'der vertrauenswürdigste Politiker in einer CR-Umfrage'." Natürlich ist Obama Nobelpreisträger und wird nicht nur als solcher von Nachrichtenquellen beschrieben, während die zweite Äußerung klar eine subjektive Wertung ist, aber keine Tatsache. Was dem BBN-System fehlt, ist Alltags- oder "Welt"-Wissen, das einem Menschen erlaubt, solche Unterschiede in Aussagen zu erkennen.

Manche Dossiers enthalten gar Punkte, die unfreiwillig komisch sind. Im Eintrag über Abraham Lincoln finden sich Zitate aus berühmten Reden - wenn auch nicht aus seiner berühmtesten, der Gettysburg-Rede vor Ausbruch des Amerikanischen Bürgerkriegs. Doch dann taucht dieser Satz auf: "Abraham Lincoln sagt, dass der Honigpunkt man Fliegenfischen besser als Fischbehälter einer bitteren Pille, ebenso der Fall für Menschen'." So schnell werden Menschen als Analysten wohl nicht durch Maschinen ersetzt werden. (nbo)