Burstiness

Schlüsselworte, welche das Reden der Politiker, die Tagesnachrichten und die E-Mails beherrschen

Die explosionsartige Zunahme bestimmter Worte in Reden oder Artikeln zeigt wachsendes Interesse oder die Hinwendung zu einem neuen Thema. Deshalb verrät die Analyse des Wortstroms die beherrschenden Gedanken, im historischen Zusammenhang ebenso wie im Austausch von Emails.

Sie treten zunächst sporadisch auf, werden immer häufiger und bestimmender, um nach der Lösung oder weil das Interesse abflaut, in den normalen Redefluss zurückzufallen: gemeint sind Schlüsselworte, die das Reden der Politiker, die Tagesnachrichten oder die Diskussion mit Freunden wie eine aufsteigende und wieder auslaufende Welle beherrschen. Jon Kleinberg, Professor für Computer Science an der Cornell University, Ithaca, N.Y., hat eine Methode entwickelt, um die Themen der Zeit festzumachen. Er analysierte die Ansprachen (State of the Union Addresses) der amerikanischen Präsidenten seit 1790 und fand eine Liste von Worten, die Historikern als Zeitspiegel dienen können.

Häufigkeit und Aufeinanderfolge des Wortes "prelim" im Emailverkehr

Der Algorithmus sucht nach "Burstiness": das meint nicht nur die Häufigkeit der Worte, sondern die Zunahme im Gebrauch des Wortes über eine Zeitperiode. "Die Methode ist aus der Wahrscheinlichkeitsberechnung entstanden wie man sie für das Verhalten in einem Netzwerk benutzt, wo der Verkehr zu Staus oder heißen Zonen führt," erklärt Jon Kleinberg.

Diese Sicht schafft bemerkenswerte Einsichten. Die Auswahl in der Tabelle lässt erkennen, dass Frankreich nur vor 180 Jahren von Interesse war, Kuba nicht zur Zeit der Kuba-Krise, sondern 1897-99. Japaner und Krieg fanden das größte Interesse während des 2. Weltkrieges, Korea tatsächlich zur Zeit des Koreakrieges und Afghanistan beschäftigte die Präsidenten ganze acht Jahre. Öl war im Gespräch, als es knapp zu werden drohte. Das Interesse an Freiheit ist seit 10 Jahren unbedeutend geworden, dafür werden die gemeinsamen Ziele von Republikanern und Demokraten (bipartisan) anhaltend beschworen, ebenso die politische Herausforderung (challenge). Kids fanden erst vor wenigen Jahrzehnten beschränktes Interesse, noch später, allerdings weiter anhaltend Eltern seit 1990, Schulen und Lehrer seit 1996.

Müsste man der Meinung der Präsidenten nicht Zeitungsartikel aus überregionalen und regionalen Zeitungen gegenüberstellen, damit die brennenden Probleme der Bevölkerung zu Worte kommen? "Eine gute Idee," antwortet Jon Kleinberg, "die sich mit meinen Beobachtungen an meinen Emails deckt. In den Emails mit Kollegen kristallisieren sich relativ schnell brennende Themen heraus. In den Emails der Studenten nimmt das Wort "prelim" vor den Examina explosionsartig zu." Und er fährt fort:

Bei der Suche nach Terroristen oder bisher unbekannten terroristischen Zellen könnte es hilfreich sein, das "e-mail chatter" zu verfolgen. Der "burst" ungewöhnlicher Worte als Grund für die weitere Analyse unserer Sicherheitskräfte.

Jon Kleinberg gehört zu den Wissenschaftlern, die nicht von der Anarchie des Internets sprechen, sondern von der spontanen Selbstorganisation. Jede Webseite kann irgendwie von anderen erreicht werden, womit das Web eher einer Milchstraße mit Galaxien ähnelt.

Da gibt es einen dichten Kern eng miteinander verzahnter Webseiten, die von weniger verbundenen umgeben sind. Webseiten, die von vielen anderen "gelinkt" werden, sind möglicherweise "Authorities". Webseiten, die zu vielen anderen linken, sind "Hubs". Folglich ist die in der Meinung führende Webseite, die mit den meisten Hubs. Von dieser Überlegung macht Google Gebrauch, und die neue Suchmaschine Teoma.

Dennoch wäre es falsch, nur auf die Zentren zu blicken.

Die Knoten außerhalb lassen sich drei Kategorien zuordnen: "upstream", wenn der Link nur einer Richtung, nämlich zum Zentrum führt; "downstream" für das umgekehrte Verhalten, und "tendrils", die überhaupt nicht zum Kern linken.

Betrachtet man das durch die aktiven Hyperlinks charakterisierte Netzwerk zusätzlich aus der Sicht der dominierenden Worte, lichtet sich der galaktische Nebel: jetzt werden "communities" erkennbar, die sich bestimmten Interessen widmen.

Die Untersuchungsergebnisse werden nicht zufällig auf der diesjährigen Jahrestagung der American Association for the Advancement of Science in Denver, Colorado vorgestellt. Die schwelende Unsicherheit vor "Schläfern" im eigenen Lande wollen die Sicherheitsverantwortlichen mit den besten Techniken unserer Zeit in den Griff bekommen.

Nichts soll mehr dem Zufall überlassen bleiben. So tun sich Krankenhäuser zusammen und analysieren Tag für Tag sowohl die Art wie auch die Häufigkeit von Neuzugängen, um eine Pockenepedemie oder andere bioterroristische Erkrankungen frühzeitig zu erkennen. Emailfilter wie sie von Jon Kleinberg vorgeschlagen werden, sollen "Ersatzworte" erkennen lassen, so wie das Pentagon den ersten Irakkrieg mit dem Begriff "desert storm" vorbereitete.

Kommentare lesen (41 Beiträge)
Anzeige