Erweiterte Suche
Home
Politik
Wissenschaft
Energie & Klima
Kultur
[Medien]
-Online
-Medientheorie
-Infowar
-Aufmerksamkeit
-Außer Kontrolle
-Neben der Spur
-JJ's Datensalat
Magazin
Anzeige
__magazin__

Warum eine Matrix bauen?

Und warum Sie sich in einer befinden könnten
__umfrage__

Klimamüdigkeit

Wird die angekündigte Klimaerwärmung mit ihren Folgen mittlerweile zu wenig ernst genommen?

Wesentlich weiterentwickelt

Matthias Gräbner 03.08.2007

Suchmaschinen werden besser: Interview mit Googles Algorithmen-Entwicklerin Monika Henzinger

Eine deutsche Zeitung [extern] nannte sie vor zwei Jahren "Googles Superhirn": Monika Henzinger ist eine international bekannte Algorithmen-Expertin, die früh zu hohen akademischen Ehren kam. Schon mit 26 Jahren wurde sie Assistenzprofessorin in Princeton. Und schon 1999 war sie bei Google als Forschungsdirektorin für die Entwicklung der Suchalgorithmen verantwortlich. Derzeit ist sie "Research Director" von Google Schweiz und Professorin an der renommierten Eidgenössischen Technischen Hochschule in Lausanne ([extern] EPFL). Telepolis sprach mit ihr über Entwicklungen in der Suchmaschinentechnologie.

download   

Sie beschreiben in einem Artikel im Wissenschaftsmagazin Science den Forschungsstand in Sachen Internet-Suchtechnologien. Arbeiten Suchmaschinen heute wesentlich anders als noch vor zehn Jahren?

Monika Henzinger: Ja, die Technologie hat sich wesentlich weiterentwickelt. Suchmachinen vor 15 Jahren benutzten Techniken, die den Techniken sehr ähnelten, die zur Literatursuche benutzt werden. Allerdings sind Webdokumente viel heterogener als wissenschaftliche Artikel und das Userverhalten ist auch sehr unterschiedlich. Daher funktionierten diese Techniken nicht sehr gut.

Vor ca. 10 Jahren erfanden die Googlegründer den PageRank-Algorithmus, der die Linkstruktur des Webs analysiert. Der führte zu einer grossen Verbesserung der Suchergebnisse. Wir haben diese Technik natürlich verfeinert und auch ein besseres Verständnis der Inhalte der Webseiten hinzugefügt. Insgesamt finden Benutzer von Suchmaschinen heute wesentlich bessere Ergebnisse als vor 10 Jahren und das obwohl sich das Web um einen Faktor von 100 bis 1000 vergrössert hat.

Für lange Zeit war ein wichtiger Vergleichsfaktor für Internet-Suchdienste, welchen Umfang ihre Datenbank hatte. Warum wird es heute kaum noch als Verdienst betrachtet, wenn Search Engine A zehn Prozent mehr Dokumente erfasst hat als Suchdienst B?

Monika Henzinger: Es gibt eine grosse Anzahl von gleichen und fast-gleichen Webseiten. Ob man die mitzählt oder nicht kann die Anzahl der Webseiten in der Datenbank leicht um einen Faktor 2 beeinflussen. Und um sie nicht mitzuzählen, müsste man sich erst einmal auf eine Definition von "fast-gleich" einigen.

Welche Rolle spielt bei der Bewertung von Suchergebnissen heute noch der, wie Sie es so schön mathematisch formulieren, Eigenvektor einer aus der Linkstruktur des Web abgeleiteten Matrix - aka PageRank?

Monika Henzinger: Google benützt PageRank nach wie vor in der Bewertung von Suchergebnissen.

Es ist häufig vom "Dark Web" oder "Deep Web" die Rede - mit dem Kern des Web nicht verlinkten resp. für Suchmaschinen nicht zugänglichen Strukturen. Könnte deren Erschließung tatsächlich Suchergebnisse verbessern - oder sind die dort abgelegten Daten nicht eventuell sowieso irrelevant?

Monika Henzinger: Manche sind relevant, manche nicht, da ihre Inhalte auch auf anderen Webseiten zu finden sind. Oft sind die Betreiber von Datenbanken daran interessiert, dass ihre Inhalte in Suchmaschinen zu finden sind. Daher hat Google einen Standard veröffentlich, der es Betreibern von Datenbanken ermöglicht, Google mitzuteilen, wie Google (oder auch andere Suchmaschinene) auf ihre Inhalte zugreifen kann. Viele große Datenbanken haben diesen Standard bereits aufgegriffen und auch die anderen großen Suchmaschinen unterstützen ihn.

Das Verhalten der User hat sich nicht wesentlich verändert

Bedient der Durchschnittsuser einen Suchdienst heute anders als vor zehn Jahren? Hat sich zum Beispiel die Qualität der Suchabfragen verbessert, nutzen die Anwender Zusatz-Qualifier wie "link"-intensiv?

Monika Henzinger: Nein, das Verhalten hat sich nicht wesentlich verändert. Meiner Meinung nach liegt es daran, dass es nach wie vor viele neue Benutzer gibt, die diese Zusatz-Qualifier nicht kennen.

Werden Suchdienste zu erkennen lernen, in welchem Suchmodus ich mich gerade befinde - ob ich etwa Informationen zu einem bestimmten Produkt suche oder mich nur über ein Gebiet informieren will?

Monika Henzinger: Das ist ein Themengebiet, an dem wir arbeiten. Ob es gut genug funktionieren wird, um auch wirklich zum Einsatz zu kommen, wissen wir noch nicht.

Wie geht die Forschung heute dem Problem auf den Grund, dass dieselbe Anfrage unterschiedliche Bedeutungen haben kann? Gibt es Erfahrungen, wie frei der User seine Anfrage behandelt werden will - ist er zum Beispiel damit einverstanden, wenn sein Suchwort automatisch durch ein Synonym ersetzt wird?

Monika Henzinger: Das hängt stark vom User ab. Neulinge sind im allgemeinen damit einverstanden, solange es die Qualität der Antworten verbessert. Erfahrene Sucher lehnen es bisweilen ab, da sie sich ihre Suchbegriffe wohl überlegen.

Vom Problem des Speicherns persönlicher Daten ganz abgesehen - vor welchen Schwierigkeiten steht die Wissenschaft, wenn es darum geht, Suchergebnisse zu personalisieren?

Monika Henzinger: Selbst der gleiche User meint nicht immer der gleiche mit denselben Suchbegriffen. Heute kann ich mit "Jaguar" das Tier meinen und morgen das Auto. Aber das ist eher selten. Das Hauptproblem ist noch immer, wie man die Personalisierung am besten durchführt - soll man automatisch die vergangenen Suchen eines Users analyzieren oder soll man den User selbst erlauben, Themen zu spezifizieren.

In Ihrem Science-Artikel berichten Sie, dass sich heute für 95 Prozent aller Anfragen die örtliche Zuordnung mit 95-prozentiger Sicherheit ermitteln lässt. Wie funktioniert das technisch?

Monika Henzinger: Diese Aussage bezieht sich nicht auf die örtliche Zuordnung des Users, sondern auf die örtliche Zuordnung für Suchanfragen, z.B., wenn der User "Reichstag" eingibt, dass man weiss, dass es sich um eine Frage mit örtlicher Zuordnung "Berlin" handelt.

Die wesentliche Idee ist die Top 100 Suchantworten zu analysieren, die häufigsten Worte darin zu finden und sie dann mit einem Verzeichnis von Ortsbegriffen abzugleichen. In dem obigen Beispiel wird "Berlin" viel öfter vorkommen als "München" oder "San Francisco" und daher kann der Algorithmus schlussfolgern, dass "Berlin" die richtige Antwort ist.

Suchmaschinen fehlt heute noch jede Form von Intelligenz. Halten Sie es für möglich, dass Google & Co. in nicht allzu ferner Zeit die Anfragen der User tatsächlich verstehen, statt nur Referenzen für die angegebenen Suchwörter zu finden?

Monika Henzinger: Wirkliches Verstehen wird es nicht geben - wir Menschen missverstehen uns ja selbst sehr oft.

Social Bookmarks: Mister Wong Yigg Oneview Folkd Delicious Digg

Artikel-URL: http://www.heise.de/tp/r4/artikel/25/25855/1.html

artikel drucken artikel versenden
 
__aktuell__

"Alles tun für einen festen Job"

Wenn der Taser kommt

Tekken Fünfkommafünf

Falsch geschnitten: Wie Chirurgenfehler passieren

__topforum__

In Bayern tobt der Kampf ums Rauchverbot

WHO: Alle Impfstoffe gegen Schweinegrippe sind sicher

Die drei Reiter der akademischen Apokalypse

Jeder siebte US-Amerikaner hungert zeitweise

Die Persönlichkeit von Männern soll konsistenter als die von Frauen sein

Kreditkartenskandal erfasst ganz Europa (Update)

 
Kommentieren  
   
 Copyright © Heise Zeitschriften Verlag Datenschutzhinweis Mediadaten Impressum Kontakt