zurück zum Artikel

Was lustig ist und was nicht

Infotech
Was lustig ist und was nicht

(Bild: Rawpixel / Unsplash)

Ohne Humor funktionieren menschliche Gesellschaften nicht, aber kann man ihn auch maschinell erzeugen? Zwei Forscher haben mit einer Crowdsourcing-Datenbank zumindest die Grundlagen dafür geschaffen.

Humor scheint ein fester Bestandteil des menschlichen Wesens zu sein. Unsere Fähigkeit, zu lächeln, zu lachen oder zu kichern, spielt eine wichtige Rolle für soziale Situationen, und sie weckt das Interesse von Soziologen und Anthropologen. Aber bevor man lachen kann, muss man einen Scherz verstehen, also ist das Thema auch für Kognitionspsychologen interessant.

Und damit spielt auch Künstliche Intelligenz potenziell eine Rolle. Also haben Informatiker begonnen, sich die Frage zu stellen, ob man Humor berechnen kann – und wenn ja, wie.

Jeder Versuch, diese Frage zu beantworten, stößt allerdings rasch auf ein Problem: den Mangel an geeigneten Datenbanken, die sich in Computer-Studien auswerten lassen. Wenn es eine Datenbank von ähnlichen Sätzen gäbe, die teils lustig und teils nicht lustig sind, könnten Forscher die Unterschiede herausarbeiten und herausfinden, worauf dieser Effekt beruht. Aber eine solche Datenbank existiert nicht.

Unlustig per Crowdsourcing

An diesem Problem haben sich jetzt Robert West an der ETH Lausanne und Eric Horvitz von Microsoft Research in den USA versucht: Auf der Grundlage von satirischen Überschriften, die im Allgemeinen lustig sind, haben sie per Crowdsourcing eine Datenbank von ähnlichen, aber nicht lustigen Sätzen zusammengestellt.

Indem sie die Unterschiede zwischen den beiden Satzarten untersuchten, wollten die Forscher erkennen, wann aus lustig nicht lustig wird und wo Humor seinen Ursprung hat. „Es würde uns in die Lage versetzen, mit größerer Granularität als bisher zu verstehen, warum ein satirischer Text lustig ist, indem wir die exakten Worte identifizieren, die den Unterschied zwischen ernst und lustig ausmachen“, schreiben sie [1]. Das Ergebnis sind einzigartige Einblicke in den Charakter von Humor.

Zu ihrer Datenbank kamen die Forscher, indem sie ein Online-Spiel namens unfun.me [2] entwickelten. Wer es spielte, bekam satirische Überschriften zu Nachrichten der Satire-Website The Onion vorgelegt, die er mit so wenigen veränderten Worten wie möglich in ernsthafte Überschriften umwandeln sollte.

Art der Veränderungen

Im Jahr 2001 zum Beispiel erschien auf The Onion die satirische Überschrift „Bipolare Störung bei Gott diagnostiziert“. Ernst klingen lassen kann man sie, indem man „Gott“ durch den Namen einer echten Person ersetzt, sodass beispielsweise „Bipolare Störung bei Bob Dylan diagnostiziert“ herauskommt. Eine solche Überschrift könnte auch auf einer normalen Nachrichten-Seite stehen. Anschließend sollen die Spieler diese neuen Überschriften nach ihrer Lustigkeit bewerten.

Die so entstandene Datenbank analysierten West und Horvitz, indem sie prüften, welcher Teil einer Überschrift am häufigsten verändert wurde, um sie nicht lustig zu machen. Ebenfalls sahen sie sich die Art der Veränderungen an.

Die Ergebnisse sind interessant. Überschriften bestehen allgemein aus mehreren Teilen: Nominalausdrücke, Verbalausdrücke, Adjektivausdrücke und Propositionen. Wie sich zeigte, wurden Nominalausdrücke am häufigsten verändert, um eine Überschrift unlustig zu machen, vor allem wenn das Wort oder die Worte am Ende des Satzes kamen. Ein Beispiel: Die satirische Überschrift „Asiatische Wirtschaftsschwäche führt zu Entlassung von 700.000 Pop-Stars“ kann man leicht ernst klingen lassen, indem man „Pop-Stars“ durch „Arbeitskräfte“ ersetzt.

Erfunden oder wahr

Die Forscher bringt das zu einer wichtigen Schlussfolgerung: „Unsere Analyse zeigt, dass der Humor tendenziell am Ende der Überschriften zu finden ist“, schreiben sie. Die Ausdrücke gegen Ende eines Satzes bezeichnen sie als „Mikro-Pointen“.

Auch den Charakter der Veränderungen haben sich West und Horvitz genauer angesehen. Dabei wendeten sie eine bekannte Theorie an, die 1985 von Victor Raskin veröffentlicht wurde. Demnach muss der Unterschied zwischen lustigen und nicht lustigen Überschriften speziellen Regeln folgen. „Die beiden Varianten müssen einander entlang einer kleinen Zahl von Dimensionen widersprechen“, erklären die Forscher. „Eine Variante muss möglich sein, die andere unmöglich, die eine normal und die andere unnormal, oder die eine wahr und die andere erfunden“.

Im obigen Beispiel ist die Entlassung von 700.000 Arbeitnehmern möglich oder wahr, die Entlassung von 700.000 Pop-Stars aber unmöglich und erfunden. Im Gott-Beispiel weiter oben kann Gott – der natürlich perfekt ist – keine bipolare Störung haben, der normale Sterbliche Bob Dylan aber sehr wohl. „Unsere Ergebnisse sind also eine empirische Bestätigung der Theorie“, schreiben West und Horvitz. Derselbe Mechanismus, Testteilnehmer darum zu bitten, Sätze mit wenigen Worten zu verändern, könnte nach ihrer Einschätzung auch Erkenntnisse über Grobheit, Sexismus, Euphemismen und weiteres liefern.

Humor ist schwierig zu erzeugen

Eine interessante Frage ist, ob die Erkenntnisse der Forscher auch dabei helfen, in die andere Richtung zu kommen, also nicht lustige Sätze lustig zu machen. Das ist viel schwieriger. Wie das Team erklärt, werden selbst bei The Onion 600 Überschriften geprüft, von denen es jede Woche nur 16 in die Print-Ausgabe schaffen. Offensichtlich ist es also viel schwieriger, Humor zu erzeugen, als ihn zu entfernen.

Ändern könnte sich das, wenn es möglich wäre, Humor zu berechnen. Wenn es diese Art von Computer-Humor gäbe, wäre das Internet wahrscheinlich bald voller Überschriften, die zum Schmunzeln anregen – produziert vom größten Komiker aller Zeiten, nämlich künstlicher Intelligenz.

Wir können es gar nicht erwarten.


URL dieses Artikels:
http://www.heise.de/-4304427

Links in diesem Artikel:
[1] https://arxiv.org/abs/1901.03253
[2] http://unfun.me/