Sinnsuche im Internet
30.05.12 – Christian Buck
Nach fünf Jahren endet das große IT-Forschungsprogramm „Theseus“. Es soll Informationen mithilfe sogenannter semantischer Technologien leichter auffindbar machen – und greift damit auch Google an.
Wie viele Einwohner hat Hamburg? Tippt man diese Frage bei Google ein, bekommt man statt einer klaren Antwort eine Liste von drei Millionen Webseiten, in denen „Hamburg“ und „Einwohner“ vorkommen. Die gesuchte Information darf sich der Nutzer dann – meist aus einem Fließtext – selber herausfischen. Die neue Suchmaschine „Alexandria“ antwortet hingegen schlicht „1770629“. Die Software hat also verstanden, dass eine ganz bestimmte Eigenschaft der Hansestadt gesucht wird, und sie gibt genau diese Information aus.
Alexandria ist ein Teilergebnis des IT-Forschungsprogramms „Theseus“, an dem sich neben dem Bundeswirtschaftsministerium rund 60 Partner aus Forschung und Wirtschaft beteiligt haben. Ihr Ziel: den Zugang zu Informationen vereinfachen, Daten zu neuem Wissen verknüpfen und neue Dienstleistungen im Internet ermöglichen. Dafür flossen zwischen 2007 und 2012 rund 100 Millionen Euro Fördergelder, weitere 100 Millionen steuerte die Wirtschaft bei, darunter Schwergewichte wie SAP und Siemens. Bis heute kann Theseus auf rund 50 Patente, 800 Publikationen und etwa 130 laufende Systeme verweisen. Damit war Theseus eines der größten IT-Forschungsprojekte aller Zeiten.
Ob die Qualität der Ergebnisse ebenfalls rekordverdächtig ist, lässt sich schwer beurteilen. Zum einen sind praktisch alle einschlägigen Forscher in Deutschland mit dem Projekt verbandelt, sodass sich hierzulande kaum Experten für eine unabhängige Einschätzung finden lassen. Zum anderen richten sich die meisten Teilprojekte nicht an private Nutzer, sondern dienen professionellen Informationssystemen, zum Beispiel Archiven. Deshalb lassen sie sich nicht so einfach ausprobieren.
Eine Ausnahme bildet die Suchmaschine Alexandria, bei der sich jeder selbst von den Fortschritten der semantischen Technologien überzeugen kann. Dahinter steckt die Idee, Informationen so zu verknüpfen, dass Computer ihren Sinn „verstehen“. Bei Alexandria analysiert ein Algorithmus zunächst, welche Objekte und Beziehungen die Frage enthält. Bei der Sucheingabe „Wo wurde Angela Merkel geboren?“ wären dies eine Person, ein Ort sowie die Relation „wurde geboren in“. Im nächsten Schritt sucht die Software in ihrer Datenbank das Objekt „Angela Merkel“ und überprüft, ob es über die Relation „wurde geboren in“ mit einem anderen Objekt (einer Stadt) verknüpft ist. Aus diesem Fundus spuckt die Suchmaschine dann die richtigen Antworten aus – in diesem Fall „Hamburg“ und „Deutschland“.
