Burstiness

19.02.2003

Schlüsselworte, welche das Reden der Politiker, die Tagesnachrichten und die E-Mails beherrschen

Die explosionsartige Zunahme bestimmter Worte in Reden oder Artikeln zeigt wachsendes Interesse oder die Hinwendung zu einem neuen Thema. Deshalb verrät die Analyse des Wortstroms die beherrschenden Gedanken, im historischen Zusammenhang ebenso wie im Austausch von Emails.

Sie treten zunächst sporadisch auf, werden immer häufiger und bestimmender, um nach der Lösung oder weil das Interesse abflaut, in den normalen Redefluss zurückzufallen: gemeint sind Schlüsselworte, die das Reden der Politiker, die Tagesnachrichten oder die Diskussion mit Freunden wie eine aufsteigende und wieder auslaufende Welle beherrschen. Jon Kleinberg, Professor für Computer Science an der Cornell University, Ithaca, N.Y., hat eine Methode entwickelt, um die Themen der Zeit festzumachen. Er analysierte die Ansprachen (State of the Union Addresses) der amerikanischen Präsidenten seit 1790 und fand eine Liste von Worten, die Historikern als Zeitspiegel dienen können.

Häufigkeit und Aufeinanderfolge des Wortes "prelim" im Emailverkehr

Der Algorithmus sucht nach "Burstiness": das meint nicht nur die Häufigkeit der Worte, sondern die Zunahme im Gebrauch des Wortes über eine Zeitperiode. "Die Methode ist aus der Wahrscheinlichkeitsberechnung entstanden wie man sie für das Verhalten in einem Netzwerk benutzt, wo der Verkehr zu Staus oder heißen Zonen führt," erklärt Jon Kleinberg.


france

1834-1835

war

1942-1945

freedom

1985-1991

slavery

1857-1860

aggression

1949-1955

bipartisan

1995-

slaves

1859-1863

defense

1951-1952

challenge

1996-

emancipation

1897-1863

korea

1951-1954

kids

1987-1995

cuba

1897-1899

oil

1974-1981

parents

1990-

depression

1930-1937

afghanistan

1980-1988

schooks

1996-

japanese

1942-1945

women

1981-1984

teachers

1996-


Diese Sicht schafft bemerkenswerte Einsichten. Die Auswahl in der Tabelle lässt erkennen, dass Frankreich nur vor 180 Jahren von Interesse war, Kuba nicht zur Zeit der Kuba-Krise, sondern 1897-99. Japaner und Krieg fanden das größte Interesse während des 2. Weltkrieges, Korea tatsächlich zur Zeit des Koreakrieges und Afghanistan beschäftigte die Präsidenten ganze acht Jahre. Öl war im Gespräch, als es knapp zu werden drohte. Das Interesse an Freiheit ist seit 10 Jahren unbedeutend geworden, dafür werden die gemeinsamen Ziele von Republikanern und Demokraten (bipartisan) anhaltend beschworen, ebenso die politische Herausforderung (challenge). Kids fanden erst vor wenigen Jahrzehnten beschränktes Interesse, noch später, allerdings weiter anhaltend Eltern seit 1990, Schulen und Lehrer seit 1996.

Müsste man der Meinung der Präsidenten nicht Zeitungsartikel aus überregionalen und regionalen Zeitungen gegenüberstellen, damit die brennenden Probleme der Bevölkerung zu Worte kommen? "Eine gute Idee," antwortet Jon Kleinberg, "die sich mit meinen Beobachtungen an meinen Emails deckt. In den Emails mit Kollegen kristallisieren sich relativ schnell brennende Themen heraus. In den Emails der Studenten nimmt das Wort "prelim" vor den Examina explosionsartig zu." Und er fährt fort:

Bei der Suche nach Terroristen oderbisher unbekannten terroristischen Zellen könnte es hilfreich sein, das "e-mail chatter" zu verfolgen. Der "burst" ungewöhnlicher Worte als Grund für die weitere Analyse unsererSicherheitskräfte.

Jon Kleinberg gehört zu den Wissenschaftlern, die nicht von der Anarchie des Internets sprechen, sondern von der spontanen Selbstorganisation. Jede Webseite kann irgendwie von anderen erreicht werden, womit das Web eher einer Milchstraße mit Galaxien ähnelt.

Da gibt es einen dichten Kern eng miteinander verzahnter Webseiten, die von wenigerverbundenen umgeben sind. Webseiten, die von vielen anderen "gelinkt" werden, sind möglicherweise "Authorities". Webseiten, die zu vielen anderen linken, sind "Hubs". Folglich istdie in der Meinung führende Webseite, die mit den meisten Hubs. Von dieser Überlegung macht Google Gebrauch, und die neue SuchmaschineTeoma.

Dennoch wäre es falsch, nur auf die Zentren zu blicken.

Die Knoten außerhalb lassen sich drei Kategorien zuordnen

"upstream", wenn der Link nur einer Richtung, nämlich zum Zentrum führt; "downstream" für das umgekehrte Verhalten, und "tendrils", die überhaupt nicht zum Kern linken.

Betrachtet man das durch die aktiven Hyperlinks charakterisierte Netzwerk zusätzlich aus der Sicht der dominierenden Worte, lichtet sich der galaktische Nebel: jetzt werden "communities" erkennbar, die sich bestimmten Interessen widmen.

Die Untersuchungsergebnisse werden nicht zufällig auf der diesjährigen Jahrestagung der American Association for the Advancement of Science in Denver, Colorado vorgestellt. Die schwelende Unsicherheit vor "Schläfern" im eigenen Lande wollen die Sicherheitsverantwortlichen mit den besten Techniken unserer Zeit in den Griff bekommen.

Nichts soll mehr dem Zufall überlassen bleiben. So tun sich Krankenhäuser zusammen und analysieren Tag für Tag sowohl die Art wie auch die Häufigkeit von Neuzugängen, um eine Pockenepedemie oder andere bioterroristische Erkrankungen frühzeitig zu erkennen. Emailfilter wie sie von Jon Kleinberg vorgeschlagen werden, sollen "Ersatzworte" erkennen lassen, so wie das Pentagon den ersten Irakkrieg mit dem Begriff "desert storm" vorbereitete.

x
Fehler melden
Telepolis zitieren
Vielen Dank!
Kommentare lesen (41 Beiträge) mehr...
Anzeige
Anzeige
Hellwach mit Telepolis
Anzeige
Cafe
Telepolis-Cafe

Angebot des Monats:
Kaffee und Espresso aus Nicaragua in der Telepolis-Edition für unsere Leser

Cover

Aufbruch ins Ungewisse

Auf der Suche nach Alternativen zur kapitalistischen Dauerkrise

Anzeige

Amok: Der ausschlaggebende Auslöser Antidepressiva?

Torsten Engelbrecht 12.09.2015

Der Psychiater David Healy zum "Medikamentenaspekt" des Amokflugs 4U95254 und bei Amokläufern

weiterlesen

"Independence Day: Wiederkehr": Zum Kern vorgedrungen

Warum man jeden neuen Emmerich-Film gesehen haben sollte

bilder

seen.by

Mit dem Schalter am linken Rand des Suchfelds lässt sich zwischen der klassischen Suche mit der Heise-Suchmaschine und einer voreingestellten Suche bei Google wählen.

Tastenkürzel:

ctrl-Taste:
Zum Wechseln zwischen Heise- und Google-Suche

esc-Taste:
Verlassen und Zurücksetzen des Eingabe-Felds

Buchstaben-Taste F
Direkt zur Suche springen

SUCHEN

Mit dem Schalter am linken Rand des Suchfelds lässt sich zwischen der klassischen Suche mit der Heise-Suchmaschine und einer voreingestellten Suche bei Google wählen.

SUCHEN

.
.