Auf dem Weg zur Antwortmaschine

"Alpha" ist ein Meilenstein der Informationstechnologie oder warum mathematische Ansätze überlegen sind: Ein Gespräch mit dem Physiker Klaus Holthausen

Stephen Wolfram hat mit der Ankündigung von Wolfram Alpha (vgl. Software-Genie verspricht keinen Google-Killer) mindestens Erstaunen hervorgerufen: Alpha soll Antworten nicht aus einer Stichwortsuche in Inhalten generieren, sondern sie mathematisch berechnen. Der deutsche Physiker Klaus Holthausen versucht mit seinem Projekt Qimaya, Computern auf andere Weise das Verständnis von Netzinhalten beizubringen. Im Interview begründet er, warum mathematische Ansätze den bisherigen Versuchen überlegen sind, dem semantischen Web durch nachträgliches und paralleles Tagging zum Durchbruch zu verhelfen.

Seit Stephen Wolfram in seinem Blog seine Antwortmaschine Alpha angekündigt hat, war zumindest in den Medien oft von einem Google-Killer die Rede. Für wie bedeutend halten Sie die Ankündigung?
Klaus Holthausen: Ich rechne mit einem bedeutenden Meilenstein der Informationstechnologie. Dabei geht es gar nicht darum, ob die neue Antwortmaschine etwas prinzipiell Neues darstellt. Ich sehe eine Analogie zur Entwicklung der Hardware: Der Schritt vom Transistor zum integrierten Schaltkreis brachte nichts prinzipiell Neues. Aber er revolutionierte unsere Welt. Sollte es Stephen Wolfram gelungen sein, Algorithmen in ein Framework zu spannen, dass sie wie ein Zellularautomat funktionieren, dann wäre es ein sehr bedeutender Schritt.
Welche Probleme wird Alpha lösen können, die Google & Co. nicht lösen?
Klaus Holthausen: Google ist passiv und langsam. Viele kennen den so genannten "Google Dance", eine periodische Schwankung des Pagerank, der durch aufwändige Update-Prozeduren zustande kommt. Wolfram Alpha berechnet Antworten dynamisch. Dynamische User-Interaktion ist ein zentrales Thema einer Patentschrift von Stephen Wolfram, die im Oktober letzten Jahres publiziert wurde. Alpha kann schneller auf ein dramatisches Ereignis - wie etwa einen Amoklauf - reagieren. Alpha würde nicht mehrfach die gleiche dpa-Meldung reproduzieren, sondern wie eine dynamische und intelligente Wikipedia sogleich Hintergrundwissen aggregieren.
Die Vision, das Web würde bald nicht nur aus Zeichenfolgen, sondern aus Bedeutung bestehen, hat Tim Berners-Lee schon vor elf Jahren gesponnen. Warum ist es nicht längst so weit?
Klaus Holthausen: Weil wir uns zu sehr von Metaphern aus der Welt der Bibliotheken leiten lassen. Für Googles Pagerank stand der Science Citation Index Pate - ein Verfahren aus der Zeit der elektrischen Schreibmaschine. Tags, RDF und Co sind alles nur Brüder und Schwestern der Zettelkästen der Bibliothekare - erfunden vor über 1000 Jahren, als Mönche eine statische Welt dokumentierten. Schopenhauer würde sagen: Jeder betrachtet die Grenzen seiner eigenen Vision als die Grenzen der Welt.
Vor welchen Problemen steht das semantische Web mit dem bisherigen Ansatz, Inhalte durch Tags mit Bedeutung aufzuwerten?
Klaus Holthausen: Wissen ist interpretierte Information. Die beste Metapher für das Wissen wäre ein Hologramm. Die Neurowissenschaften deuten darauf hin, dass wir unser assoziatives Denken und unsere Gedächtnisleistungen Prozessen verdanken, die holografischen Charakter haben. Ein Tag dagegen reduziert ein N-dimensionales Geschehen auf nur eine Dimension.
Was halten Sie von Wolframs Ansatz, Antworten stattdessen mit Hilfe von zellulären Automaten zu berechnen - und was kann ich mir überhaupt darunter vorstellen?
Klaus Holthausen: Zelluläre Automaten sind sehr einfache vernetzte Schaltelemente, die auf Basis einfacher Regeln komplexes Verhalten hervorbringen. Ich denke nicht, dass Wolfram Alpha im Wortsinn ein zellulärer Automat ist. Vielmehr gehe ich davon aus, dass man das Prinzip des zellulären Automaten - und damit den Bottom-up-Approach der KI - auf ein Ensemble von Algorithmen und Programmen übertragen hat. Zum Beispiel könnte es ein Programm A geben, das in einem Text Postleitzahlen identifiziert. Ein weiteres Programm B erkennt Personen. Und ein Programm C verwendet eine medizinische Ontologie und erkennt Krankheitssysmptome. Ich stelle mir Alpha als ein Framework vor, bei dem sich die Programme A, B und C automatisch - und dynamisch! - vernetzen können.
Welche Voraussetzungen muss Wolfram dafür schaffen - und sind die mit 100 Mitarbeitern zu bewältigen?
Klaus Holthausen: Klaus Holthausen: Den Patentanmeldungen der letzten Jahre entnehme ich, dass im Bereich der User Interfaces bereits umfangreiche Erfahrungen bestehen. Ein Beispiel ist das Kommando-Interface der Software Mathematica. Ein erheblicher Teil der 100 Mitarbeiter dürften Computerlinguisten sein, die Alpha beibringen, die jeweilige Eingabezeile zu interpretieren. In jedem Fall sind bedeutend mehr Menschen am Start als beim letzten "Google-Killer" namens Cuil.
Wenn Menschen Daten kuratieren, gibt das dem ganzen nicht einen subjektiven Aspekt?
Klaus Holthausen: In der Zeit der Klosterbibliotheken gab es den Begriff des Subjekts nicht. Die objektive Instanz hieß Gott. Heute haben wir sechs Milliarden subjektive Bewohner auf der Erde, aber nur eine "objektive" Instanz im Internet: Wikipedia. Ich bin froh über jeden Menschen, der Daten kuratiert. Der Clou bei Alpha scheint mir aber zu sein, dass der Faktor Mensch obsolet wird - wenn sich Wissen wie ein zellulärer Automat erst einmal selbst organisiert.
Welche konkurrierenden Ansätze gibt es dafür - von Qimaya, aber zum Beispiel auch von Eyeplorer? Und kommen Sie ohne menschliche Gestaltung aus?
Klaus Holthausen: Qimaya und Eyeplorer sind durch Ergebnisse aus den Neurowissenschaften inspiriert. Bei Qimaya konkret durch mathematische Modelle zum Verständnis der assoziativen Großhirnrinde und Eyeplorer durch Konzepte aus der Neurophysiologie, etwa dem Gestaltkonzept. Beide Konzepte vertrauen auf Selbstorganisation und verzichten weitgehend auf Konzepte der symbolischen KI.
Aus Sicht von Qimaya drückt sich die menschliche Gestaltung bereits in der Erstellung des Content aus. Dieser Content wird nicht zensiert, kuratiert, verändert oder mit Metadaten dekoriert. Der von Menschen generierte Content wird unverändert in eine Hologrammstruktur eingebaut und kann fortan von jedem Blickwinkel aus seine Facetten zeigen.
Lösen diese mathematischen Ansätze zugleich auch das Problem des SEO-Spam?
Klaus Holthausen: Nein. Es gibt nur eine Möglichkeit, SEO-Spam zu beenden: Das Internet abschalten. Die wirtschaftliche Bedeutung des Online-Marketing steigt von Jahr zu Jahr und SEO wird immer ein Thema sein. Der Schwerpunkt aber wird sich ändern: Kommerzielle Seiten werden Content quasi emulieren, um für Qimaya, Eyeplorer & Co interessant auszusehen.
Wenn eine Maschine mit der Suche nach Antworten betraut wird, muss dann nicht zunächst die Frage gelöst sein, was Wahrheit überhaupt ist?
Klaus Holthausen: Eine pragmatische Definition von Wahrheit wäre: Wahrheit ist die Gesamtheit aller Frage-Antwort-Paare, nach denen Günter Jauch bei "Wer wird Millionär?" fragen kann. Diese Art von Faktenwissen wird Alpha beherrschen. Wahrheiten, die mit Handlungswissen - knowing-how statt knowing-that - verknüpft sind, bleiben einer algorithmisch arbeitenden Maschine verborgen.
Wie lassen sich wahre und falsche Inhalte im Netz algorithmisch unterscheiden? Muss man sich da rein auf die Statistik verlassen?
Klaus Holthausen: Es gibt keine Wahrheit im Internet. Wissen ist interpretierte Information. Deutung von Wissen setzt Vernetzung von Wissen voraus. Computer können bestenfalls Verstandeskategorien abbilden. Wahrheit und Vernunft bleiben der limitierten, anfälligen und liebenswerten Maschine vorbehalten, die man "Mensch" nennt.
Wie wird Internetsuche in zehn Jahren aussehen - ganz anders als heute?
Klaus Holthausen: In zehn Jahren wird das Thema Suche obsolet sein. Agententechnologie wird sich durchsetzen und wir werden automatisch konfigurierte Points of Interest in unserer Hosentasche tragen. Ich persönlich werde - falls ich mich nicht bis dahin zu Tode getwittert habe - mehr Zeit für das real life haben. Ich werde dann Antworten in Büchern suchen – falls es dann noch Bücher und Verlage gibt.
Kommentare lesen (19 Beiträge)
Anzeige