Übereifriger Filter bei Google

Ben Edelman vom Berkman Center for Intenet & Society hat sich den führenden Suchmaschinenbetreiber vorgeknöpft und festgestellt, dass der Service SafeSearch mehr URLs ausfiltert als er eigentlich sollte.

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 49 Beiträge
Von
  • Andreas Wilkens

Ben Edelman vom Berkman Center for Internet & Society an der Havard Law School, unter anderem bekannt geworden durch seine Anfeindungen des Digital Millennium Copyright Act, hat sich Google für seine Forschung über Internet-Filtersysteme vorgenommen. Dabei hat er 2500 Suchbegriffe getestet und insgesamt rund 15.800 URLs ermittelt, die bei aktiviertem Filter SafeSearch nicht gefunden werden konnten, aber keinen "explizit sexuellen Inhalt" im Sinne US-amerikanischer Gesetze haben, schreibt er in seinem Bericht.

SafeSearch sucht automatisch mit einem Algorithmus nach "Inhalten für Erwachsene" und schließt diese von den Ergebnislisten aus. Google-Mitarbeiter mischen sich dabei nicht ein. Der führende Suchmaschinenbetreiber bietet den Service seit dem Jahr 2000 an. Dabei können die Nutzer auf Google.com bei den Einstellungen unter SafeSearch Filtering per Radio-Buttons auswählen, ob die Suche nicht gefiltert wird, ob nur "explizite" Bilder oder alle Inhalte ausgeschlossen werden sollen, die eindeutiges pornografisches Material enthalten. Bei eingeschaltetem Filter wird über den Suchergebnissen die Anmerkung "Searched the web for * with Safesearch on" eingeblendet. Der Filter lässt sich jederzeit auf der Einstellungs-Seite ausschalten.

Ben Edelman will nun herausgefunden haben, dass der Filter übereifrig arbeitet. Er habe zum Beispiel dafür gesorgt, dass URLs des Weißen Hauses, von IBM und der American Library Association, aber auch von anderen staatlichen Stellen bei der Suche nach Seiten wie "I hate McDonalds" ausgeschlossen würden. Gibt man bei eingeschaltetem SafeSearch "AOL Time Warner" ein, würden unter den ersten 100 gefundenen Treffern 3 ausgeschlossen, obwohl sie keine inkriminierten Inhalte enthielten. Beim Suchbegriff "war blog" würden gar 19 der ersten 100 Treffer ausgeblendet.

Edelman merkt selbst an, dass Google keinen Anspruch auf ein perfektes Filtersystem erhebt. Es heißt auch auf der Hilfe-Seite für SafeSearch, dass kein Filter 100 Prozent genau arbeitet. Aber dadurch, dass Google den Filter zur Verfügung stellt, stehe ein prominenter Name hinter dieser Art Suchergebnis-Ausschluss, auf den sich viele Nutzer verlassen, meint Edelman. Die Marktführerschaft des Unternehmens und vage Angaben über die Suchmethodik und die Filtertechnik hätten eine genauere Analyse notwendig gemacht.

Künftige Forschungsvorhaben sollten erkunden, wieviel "wertvoller Inhalt" durch SafeSearch oder andere Filtertechniken wie zum Beispiel der US-amerikanischen Firma N2H2 ausgeblendet werden. Auch sollten statistische Vergleiche zu zufälligen Ausblendungen durch Netzwerk- oder Server-Fehler angestellt werden. Mit N2H2 hatte Edelmann sich bislang auch beschäftigt. Vor kurzem hatte ein Bundesgericht die Klage der Vertreter Edelmans abgewiesen, die Softwarefirma solle Listen von gefilterten Websites herausgeben.

Im vergangenen Jahr haben die Wissenschaftler von der Harvard Law School dokumentiert, in welchem Umfang Saudi-Arabien den Zugriff auf das Internet im Land zensiert. Unter den insgesamt 2038 zensierten Webpages befanden sich neben Sites mit eindeutigem "Adult-Content" auch viele Seiten mit Inhalten zu den Themen Religion, Gesundheit, Bildung, Humor und Unterhaltung. Daraufhin haben sich die Wissenschaftler auch die Filterregeln für Chinas Internet vorgeknöpft und festgestellt, dass dort sogar noch mehr Websites als in Saudi Arabien gefiltert werden. (anw)