Europäische Gegenströmung

Bestrebungen zur Entwicklung europäischer Google-Konkurrenten

Trends & News | Trend

Kann eine Wissensgesellschaft es sich leisten, dass ausschließlich wenige amerikanische Unternehmen die riesigen Informationsmengen im Internet erschließen? Nein, sagen Politiker und Netzaktivisten aus Frankreich und Deutschland. Ihr Kampf für europäische, „öffentlich-rechtliche“ Google-Konkurrenten gewinnt derzeit an Fahrt.

Aufmacher

Der Argwohn gegen Google gärt im alten Europa schon länger. Die kritische Netzöffentlichkeit bemängelt seit Jahren die intransparenten Rankingmechnismen, die (weiße) Zensur und die zunehmende Monopolisierung im Suchmaschinenmarkt (siehe S. 162. c't 10/06). Im Jahr 2004 beschäftigte sich ein Ausschuss des Bundestags mit der Kritik an Google und Co., allerdings ohne konkrete Maßnahmen zu beschließen.

Das Buch-Digitalisierungsprojekt Google Print schließlich führte im Nachbarland Frankreich zu einem Aufstand gegen den Suchmaschinen-Primus. Ein amerikanisches privatwirtschaftliches Unternehmen als universeller Wissensvermittler, eine digitale Bibliothek, in der vor allem angelsächsische Werke weltweit elektronisch verfügbar gemacht werden - für viele Europäer eine Horrorvision.

Führt man derzeit Stichprobentests in dem noch im Aufbau befindlichen Dienst durch, sieht man letztere Befürchtung bestätigt: Die Abfrage „house“ liefert etwa 25 Millionen Treffer, das französische „maison“ aber nur etwa 750 000, und das „Haus“ nur gut 300 000. Die Biblioth&egraveque Nationale de France (BNF) rief zu einer europäischen „Gegenattacke“ gegen Google Print auf. „Wenn wir nichts unternehmen, droht bei der Überlieferung kulturellen Wissens eine Vorherrschaft der US-Amerikaner“, warnte der BNF-Präsident Jean-Noël Jeanneney.

Im April 2005 beschloss der deutsch-französische Ministerrat, die Entwicklung eigener Suchmaschintechnik zu fördern. Das Baby wurde „Quaero“ getauft, was auf lateinisch so viel wie „ich suche“ bedeutet. Über das Quaero-Projekt gibt es eine Menge Missverständnisse, unter anderem, weil bislang nur eine recht allgemein gehaltene Beschreibung seiner Ziele existiert [1].

Quaero soll ganz allgemein die Entwicklung von Werkzeugen für das Management von Multimedia-Inhalten fördern - im Internet-Zeitalter schließt das die Suche im Web ein, aber es geht um weit mehr als um die Internet-Recherche. Die Projektbeschreibung liest sich recht ambitioniert. Es geht um nicht weniger als die „Initialisierung von technischen Durchbrüchen in der Produktion, dem Managements und der Nutzung von Multimedia-Inhalten“. Aus Quaero sollen Lösungen hervorgehen, die in Multimedia-Inhalten aller Art recherchieren können, Bilderkennung und die automatische Übersetzung mehrsprachiger Information inklusive. Anwender sollen die Ergebnisse des Projekts am PC, auf dem Handy oder am TV nutzen können. So ambitioniert die Projektziele sein mögen, so offen ist es derzeit, wie sie erreicht werden sollen. Auch gibt es noch mehr als ein Jahr nach dem Beschluss von Quaero keinen Zeitplan.

In seiner Neujahrsansprache für das Jahr 2006 hat der französische Präsident Quaero zudem zu einem künftigen Gegengewicht zu Google und Yahoo hochstilisiert. Die Presse hat diese Vorlage gerne aufgenommen; einige Medien schrieben bereits von einem Google-Killer. Spricht man hinter den Kulissen mit am Projekt beteiligten Firmen, so ist ihnen dieser Wirbel alles andere als recht. Kein am Projekt Beteiligter, so erfährt man hinter vorgehaltener Hand, glaubt ernsthaft, der riesigen Entwicklerschaft und der einzigartigen Performance von Google mit einem öffentlich geförderten Projekt etwas Gleichwertiges entgegenstellen zu können.

Quaero ist bislang noch nicht so recht ins Rollen gekommen. Bei dem öffentlich geförderten Projekt müssen Anträge gestellt, geprüft und bewilligt werden. Und das dauert seine Zeit. So soll sichergestellt werden, dass die Forschungsschwerpunkte richtig gesetzt werden. Dass Quaero ein französisch-deutsches Projekt ist, erhöht den Abstimmungsbedarf zusätzlich.

Insbesondere die deutsche Seite ist bisher noch nicht so recht vorangekommen, weil ihr die Bundestagswahl 2005 in die Quere gekommen ist. Erst Anfang dieses Jahres konnte das das Wirtschaftsministerium (BMWI) die Firmen und Forschungsinstitutionen bekannt gegeben, die sich auf deutscher Seite an Quaero beteiligen.

Dazu zählen laut Homepage des BMWI die Unternehmen empolis, Siemens, MediaSec Technologies, Thomson-Brandt, Lycos Europe und Grass Valley Germany. Aus der Wissenschaft beteiligen sich das Deutsche Forschungszentrum für Künstliche Intelligenz, die Fraunhofer Gesellschaft für angewandte Forschung, die Universität Karlsruhe und die RWTH Aachen. Andere Quellen nennen außerdem das Software-Haus SAP und das Verlagshaus Holtzbrink.

Die Bertelsmann-Tochter Empolis, Spezialist für Wissensmanagement, soll die Federführung des Projekts in Deutschland übernehmen. Die Programmpartner definieren derzeit ihre Beiträge und reichen sie beim Bundesministerium für Wirtschaft und Technologie zur Prüfung ein. Zudem wird an einem gemeinsamen deutsch-französischen Programmpapier gearbeitet. Bis der Quaero-Fahrplan steht, so schätzen Insider, ist später Sommer oder sogar Herbst.

Die Zusammenarbeit zwischen den Partnern der beiden beteiligten Länder koordiniert eine deutsch-französische Arbeitsgruppe [1]. Die federführende Institution auf französischer Seite ist die im August gegründete Agence de l’Innovation Industrielle (Agentur für Industrielle Innovation). Neben diversen Forschungseinrichtungen beteiligen sich auf französischer Seite das Technikunternehmen Thomson, die France Telecom und der Suchmaschinenbetreiber Exalead.

Die französischen Partner sind offenbar schon weiter als die deutschen. Obwohl Quaero nicht (nur) als Google-Konkurrent verstanden werden soll, ist eine Suchmaschine für das Web das erste Ergebnis des Projekts, das jedermann testen kann. Auf der Homepage von Exalead findet sich eine Volltextsuchmaschine, die nach eigenen Angaben bereits vier Milliarden Webseiten indexiert. Unter exalead.de ist auch eine deutschsprachige Version am Netz.

In punkto Indexgröße kann die Exalead-Suchmaschine noch nicht mit der Googles mithalten. Bei der Suche nach „quaero bmwi“ zum Beispiel fördert Exalead nur 14 Treffer zu Tage, Google dagegen 332. Ansonsten macht der schlanke und schnelle Web-Rechercheur einen ausgereiften Eindruck. Er enthält sogar eine Reihe interessanter Funktionen, die der Platzhirsch nicht bieten kann.

So generiert er eine Ergebnisliste, in der er neben jeden Verweis eine Miniatur der entsprechenden Site einblendet. Der Benutzer kann die Miniaturen ausblenden lassen, oder auf eine Ansicht mit Miniaturen, aber ohne Trefferliste umschalten. In einer Spalte am linken Rand der Ergebnisse stellt Exalead eine Reihe von Optionen bereit, mit denen der Benutzer das Ergebnis konkretisieren kann. Damit schränkt er die Ergebnisse auf bestimmte Dokumenttypen, Sprachen, Herkunftsländer, Kategorien oder Themen ein.

Die Kategorien generiert Exalead offenbar automatisch aus den Treffersites, die Themen aus dem Inhalt der Trefferseiten - mit erstaunlich guten Resultaten. Bei der Suche nach Jaguar bietet Exalead zum Beispiel die Kategorie Wirtschaft mit der Unterkategorie Fahrzeuge sowie die Kategorie Computer an. Schränkt man die Ergebnisse auf Computer ein, so zeigt Exalead nur Seiten an, die mit dem Apple-Betriebssystem oder dem Atari-Modell zu tun haben.

Außer einer Volltextsuche bietet Exalead auch die Recherche nach Audio-, Video- und RSS-Dateien. Eine Desktop-Suchmaschine hat Exalead ebenfalls im Portfolio [2]. Für die Web-Suchmaschine hat Francois Bourdoncle, der CEO von Exalead, ambitionierte Pläne. Noch in diesem Jahr soll sie acht Milliarden Seiten indexieren und nach Bildern fahnden.

In Deutschland gibt es neben dem Quaero-Projekt eine weitere Organisation, die sich der Entwicklung alternativer Suchmaschinen-Technik beschäftigt. Der „Verein zur Förderung der Suchmaschinentechnologie und des freien Wissenszugangs“, kurz SuMa e. V., sieht in der Machtposition einzelner weniger Unternehmen eine Gefährdung des freien Zugangs zum Wissen [3].

Der Verein will die Politik für das Thema sensibilisieren und Fördermittel und Spenden für konkrete Projekte akquirieren. Er veranstaltet Vorträge, auf denen unter anderem alternative Suchmaschinen-Konzepte diskutiert werden und fördert diese, indem er mit seinem Suchmaschinenlabor eine Testplattform zur Verfügung stellt.

Eines der vom SuMa e. V. geförderten Projekte ist YaCy. Anders als bei klassischen Suchdiensten gibt es bei YaCy keinen zentralen Server; stattdessen arbeitet das System ähnlich wie Datei-Sharing-Programme dezentral nach dem Peer-to-Peer-Prinzip. Entsprechend gibt es auch nicht nur einen Crawler und eine Suchmaschine; wer die Rechenpower und Bandbreite zur Verfügung hat, kann einen YaCy-Peer betreiben. Bei einer Suchanfrage werden immer auch die Indexdaten von allen gerade aktiven YaCy-Nutzern abgefragt.

YaCy lässt sich über mehrere Peers ausprobieren, etwa auf der Projekt-Homepage [4] oder im Labor des SuMa e. V.. Die Ergebnisse sind allerdings noch recht dürftig. Zu obiger Abfrage „quaero bmwi“ zum Beispiel liefert YaCy keine Treffer. Die YaCy-Betreiber suchen noch Mitstreiter, die weitere Peers betreiben - je mehr Teilnehmer das YaCy-Netz hat, desto reichhaltiger werden die Ergebnisse. Die YaCy-Software wurde unter Java entwickelt und läuft auf diversen Linux-Varianten, Mac OS X und Windows. Die Installation der Software wird auf der Homepage detailliert beschrieben.

Wer nicht die Möglichkeit hat, eine vollständige Server-Software zu installieren, der kann das Projekt auch mit der YaCy-Toolbar für Firefox unterstützen. Mit der Werkzeugleiste lassen sich Anfragen direkt an YaCy senden oder Seiten zum Indexieren an einen der Peers übermitteln. Der Benutzer kann Spam-Seiten melden; YaCy setzt sie auf eine schwarze Liste.

Unterstützung vom SuMa e. V. erhält auch die Metasuchmaschine Metager2, eine Weiterentwicklung des Klassikers Metager, wie im Namen schon anklingt. Anders als der Vorläufer und viele andere Metasuchmaschinen sammelt Metager aber nicht nur die Treffer mehrerer Suchdienste ein und bereitet sie auf. Stattdessen lädt Metager2 die Trefferseiten, analysiert sie und generiert daraus eine Übersicht. Dies soll es ermöglichen, Spam auszufiltern und das Ranking wesentlich zu verbessern.

Der Abruf der einzelnen Trefferseiten dauert natürlich ein wenig länger als die Recherche mit Google oder Yahoo. Metager2 benutzt derzeit die Ergebnisse von Google, Yahoo, MSN, Ask und Exalead. Etwa fünf bis zehn Sekunden muss der Benutzer warten, bis Metager2 die Ergebnisse eingesammelt und zu einer langen Liste zusammengestellt hat. Die Resultate können sich aber sehen lassen: In Stichproben lieferte die Suchmaschine gute, relevante Treffer; Spam-Sites hatten Seltenheitswert. Außer der Volltextsuche hat Metager2 derzeit keine weiteren Funktionen. (jo)

[1] Homepage der „deutsch-französischen Arbeitsgruppe“ mit einer Beschreibung des Quaero-Projekts

[2] Vielfinder, One:desktop 4.0 free, c't 9/06, S. 84

[3] Homepage des SuMa e. V.

[4] Homepage von YaCy

[5] Metager 2

Soft-Link

"Info-Krake Google"
Weitere Artikel zum Thema "Info-Krake Google" finden Sie in der c't 10/2006:
Der unheimliche Erfolg S. 162
Datenschutzprobleme S. 168
Gegenwind aus Europa S. 172
Alternative Service-Anbieter S. 176

Infos zum Artikel

Kapitel
  1. Bilateral suchen
  2. Rechercheur aus Frankreich
  3. Verteilt suchen
  4. Metasucher
  5. Literatur
0Kommentare
Kommentieren
Kommentar verfassen
Anzeige

Anzeige

Anzeige