Wer hat Recht im Forum?

Ein von kalifornischen Forschern entwickeltes Verfahren soll helfen, bei Online-Diskussionen das richtige Fazit zu ziehen: Wer hat die korrekte Antwort geliefert?

Wer ist denn nun im Recht – Don Alphonso oder die Freundin-Blogger? Kann man mit dem neuen Mac-Book wirklich nicht schmerzfrei auf den Knien arbeiten? Sind Anti-Spyware-Programme wie etwa Ad-Aware nun sinnvoll oder nicht? Wer sich beim Verfolgen von Online-Diskussionen in Newsgroups oder Blogs nicht entscheiden kann, welcher Meinung er sich anschließen sollte, dem hilft in Zukunft womöglich ein in Kalifornien entwickelter Algorithmus.

Ein Wissenschaftler-Team um Eduard Hovy vom Information Sciences Institute der University of Southern California stellt das Verfahren in dieser Woche auf der Human Language Technology Conference in New York vor. Mit gängigen Lügendetektoren hat es allerdings nichts gemein – es handelt sich vielmehr um eine statistische Untersuchung menschlicher Unterhaltungen. Dabei machen sich die Forscher die Besonderheiten der in Onlinemedien vorherrschenden Diskussionsform zunutze, die sich als Abfolge aufeinander bezogener Wortbeiträge darstellt. Im Gegensatz zu allgemeiner menschlicher Unterhaltung sind diese „threaded discussions“ leichter zu behandeln, weil sie sich in der Regel um ein gemeinsames Thema drehen und ähnliche Stichwörter enthalten.

Das Programm, das die Forscher entwickelt haben, zerlegt Online-Diskussionen zunächst in nach Funktion getrennte Bestandteile: Beiträge, die Fragen stellen, solche, die Antworten liefern, und weitere, die nur soziale Interaktion enthalten – etwa Dank, Kritik oder Lob. Eine Wortanalyse untersucht anhand der in den Texten vertretenen Stichwörter, wann eine Diskussion beginnt, von ihrem ursprünglichen Thema abzuschweifen und sich neuen Fragen zuzuwenden. Schließlich führen die Wissenschaftler das Kriterium der Poster-Vertrauenswürdigkeit ein. Sie berücksichtigt, dass Nachrichten in unterschiedlichem Grad korrekt und vertrauenswürdig sein können – und dass die meisten Poster sich in dieser Beziehung konsistent verhalten. Wer stets seriöse Antworten gibt, wird selten als Foren-Troll auftreten – und umgekehrt. Mit diesen Faktoren erzeugen die Forscher eine spezielle Darstellung der Diskussion, ein Ranking ähnlich dem, das Google für Webseiten berechnet, und aus dem man mit gewisser Wahrscheinlichkeit die für die betreffende Frage korrekten Antworten herauspicken kann.

Das funktionierte in der Praxis schon gut: Die Wissendschaftler untersuchten dazu ein Forum, in dem sich Studenten der University of Southern California über IT-Probleme austauschten. Wählten sie per Zufall einen Beitrag aus, erhielten sie nur in 87 von 314 Fällen die richtige Antwort – das Software-System hingegen konnte schon in 221 von 314 Fällen das korrekte Ergebnis auswählen. Im Vergleich zu einem menschlichen Bewerter lag die Genauigkeit der Software bei 65 bis 70 Prozent.

Bis zur kommerziellen Nutzbarkeit ihres Verfahrens, schätzen die Forscher, werde allerdings noch einige Zeit vergehen. Vorstellbar wäre es, das System zur Ergänzung einer FAQ-Liste etwa beim automatisierten Kundenservice einzusetzen: Auf vielen Websites von Computerfirmen können sich die Nutzer gegenseitig bei Problemen helfen – das in Kalifornien entwickelte Programm würde dann für Neueinsteiger die Spreu vom Weizen trennen. Selbst bei allgemeinen Online-Diskussionen, bei denen es kein klares „Ja“ oder „Nein“ gibt, könnte die Software nützlich sein: sie identifiziert nebenbei auch die „Alpha-Poster“, die mit ihren Beiträgen die Richtung weisen. (Matthias Gräbner)

Anzeige