Komm, laß uns eine Suchmaschine mißbrauchen !
Über die Manipulierbarkeit von Suchmaschinen.
Angenommen, eine Einzelperson oder eine Gruppe von Menschen beschließt, die tumbe Funktionalität von Webcrawlern für sich und die eigenen Interessen nutzbar zu machen, eröffnet er/sie eine Folge an Aktionen und Reaktionen, an deren Ende die Suchmaschine das Nachsehen hat. Denn Maschinen können kein "Nachsehen" erzeugen, deshalb sind hier die Betreiber die Verlierer.
Ein Verdacht tut sich auf. Surfer im Web scheinen zwei Inhalte besonders zu interessieren: Pornographie und Suchmaschinen. Scheinbar erfüllen die einen durch stumpfe Wiederholung auswechselbarer Nacktheit das Bedürfnis nach verstohlenen Blicken in Büropausen und Singlenächten. Der Reiz der durch das Web krabbelnden Suchroboter liegt andererseits darin, den Service eines virtuellen Schlüssellochs zu bieten. Theoretisch jedes Wort, das in Usenet und/oder Web bereitliegt, kann aufgespürt werden.
Glaubt man der zugänglichen Liste der 100 meistgesuchten Wörter in einer deutschen Suchmaschine, wie sie bei Kolibri zu finden ist, interessiert scheinbar ausschließlich die Schnittmenge aus Sex, Spannertum und Suchabfrage. Die ersten 20 Begriffe haben eindeutig mehr mit Sexualverhalten als mit Informationsverarbeitung zu tun. Es sieht danach aus, als würden Menschen, die in den Umfragen der GFK und der W3C immer noch News und Software als wichtigsten Content im Web definieren, ausschließlich nach Pinups und harten Bildern suchen.
Doch halt: Mehr als 15 Millionen Visits bei deutschen Suchmaschinen wie Fireball oder Schlagwortverzeichnissen wie Yahoo scheinen auch andere Gründe zu haben. Letztendlich sind diese Abrufzahlen fast allen Angeboten des deutschen Webs haushoch überlegen. 6 Millionen Page-Impressions von Focus online nehmen sich dagegen sogar eher bescheiden aus. Und die 4 Millionen der Bild sind selbst mit einer ausgiebigen Nacktecke nicht wesentlich ausbaubar. Die Abrufzahlen herkömmlicher Websites können lange nicht mit den immer noch immens anschwellenden Nutzer-Abrufen der Suchmaschinen konkurrieren. Und letztendlich geben User bei den genannten Umfragen auch an, daß die Unübersichtlichkeit des Webs am meisten stört, dem sie mit dem Klick in eine der angebotenen Datenbanken zu begegnen suchen.
Ein ideales Feld für Interessengruppen
Das Opfer scheint ausgemacht. Arme, heimatlose Surfer, die in großer Aufmerksamkeit versuchen, die Website ihres Herzens zu finden (aus welchen Gründen auch immer...). Größere Eyeballs sind kaum denkbar.
Wir stellen uns also eine Person, eine Gruppe oder Organisation von Personen vor, die es sich zur Aufgabe gestellt hat, diese Zielgruppe aufs Korn zu nehmen und mit einer gezielten Aussage zu beeinflußen.
Die einfachste Möglichkeit der Einflußnahme wäre die Buchung eines Werbebanners auf möglichst vielen Pages dieser Suchmaschine. Da sich der Markt in Deutschland unter einem halben Dutzend Anbietern aufteilt, ist er zumindest bei bundesdeutschen Produkten überschaubar, aber auch teuer. Soll die Werbebotschaft weltweit gestreut sein, wird das hier schnell an die Grenzen des Schaltbaren stoßen. Kostenintensivere Werbeplätze gibt es - aus Gründen der PageViews - im Web nicht.
|
|
Selbst wenn es Werbekunden gelänge, ihre Banner oben in der Site zu plazieren und zu verlangen, daß die Grafiken ohne Pixelangaben ins HTML-Layout gelangen - die meisten eingesetzten Browser werden so mit der Darstellung der Page warten, bis die ganze Grafik vor den Augen der Surfer geladen ist -, kann der Erfolg nicht wirklich für sich verbucht werden. Eilige Sucher haben die Darstellung von Grafiken einfach ausgeschaltet. Die Anstrengungen verpuffen. Und die Motivation, auf ein Werbebanner zu klicken, ist so gering, wie die Lust auf TV-Spots, die man sich per Video zusammenstellt. Wer macht das schon?
Schlechte Lösung
Besser scheint die Plazierung von Werbung schon in einem Umfeld und in einer Form zu funktionieren, die der beworbenen Nachricht mehr entsprechen. Die Branchendienste werben&verkaufen und Horizont schalten deshalb ihre Banner da, wo sie ihrer Meinung nach möglichst wenig Streuverluste erzeugen: in den Mediensuchseiten von Yahoo. Und sie tun das in einer Form, die ihnen Erfolg verspricht: Die Werbungen sind als Abfragen innerhalb der eigenen Datenbanken aufgebaut. Wer sich hier zu einem Klick verführen läßt, sucht mitten im dortigen Content weiter. Werbung also als "Geht doch besser"-Prinzip. "Convienience" in Verbindung mit "penetration".
Leider muß man sagen, daß der führende unter den Branchendiensten, Kress, immer noch ohne diese Sperenzchen auskommt. Seine Überzeugungsarbeit leistet Chefredakteur Turi durch schnellere und bessere Informationen. Das führt zu mehr PageViews als sie die anderen beiden Konkurrenten zusammen aufweisen können. Tendenz: ausbauend.
Irgendwie scheint offene Werbung den Zweck nicht zu erfüllen
Schon seit es Suchmaschinen gibt, versuchen deshalb immer wieder gewitzte Page-Anbieter einen anderen Weg, um - dann sogar ohne Werbungskosten - die Aufmerksamkeit möglichst stark auf sich zu ziehen. META-Befehle innerhalb von HTML, die genau aus Gründen der Verschlagwortung in den Tag-Katalog aufgenommen wurden, bieten sich an. Sie ermöglichen die Addition von theoretisch beliebig vielen Verschlagwortungen, unter denen das File in der Suchmaschine dann abgelegt werden kann. Eine sinnvolle Vorgehensstrategie wäre es deshalb, durch diese META-Befehle den Webrobots die eigenen Contents möglichst so schmackhaft zu machen, daß die bei Anfragen von Usern möglichst oft auf den Screens aufleuchten.
Zwei Wege bieten sich an: Zum einen kann man sich den eingangs erwähnten Fakt zunutze machen, daß Websurfer durchschnittlich häufiger bei Rezeption zu ejakulieren scheinen als andere Mediennutzer. Die auf dem Bildschirm nicht sichtbare Verschlagwortung von HTML-Files mit den hinlänglich bekannten Wörtern wie Sex, Busen, etc. etc. wird den Inhalt deshalb häufiger aus der Datenbank des Webcrawlers hervorholen als ein ähnlicher, der themengerecht gespeichert wurde. Einen klaren Nachteil hat diese Strategie. Nicht jeder, der ein Schamhaar sucht und eine Datei über den deutschen Schwarzwald findet, schätzt sich darüber glücklich. Wer auf diese Art mehr Hits erzeugen will, wird deshalb nicht zum Hit. Die Verärgerung über den Fehlgriff wird manchen User schnell lustlos weiterklicken lassen.
Eine andere Strategie wäre es, die Verschlagwortung mit den häufigsten deutschen Wörtern zu verbinden oder thematisch ähnliche Wörter in einem Thesaurus zu verarbeiten. Aber Suchmaschinen haben sich sowohl gegen dieses als auch gegen die erstgenannte Methode zunehmend zu schützen begonnen. Sie sparen die META-Tags aus und berücksichtigen lieber den Volltext (Lycos hat einst als Suchmaschine nur die ersten 30 Wörter gespeichert, da man in der Logik sicher war, daß die wichtigsten Suchbegriffe sich in alter journalistischer Tradition im ersten Drittel des Textes oder gar der Überschrift befinden...). Allerdings sind die genauen Verarbeitungsmechanismen eines der bestgehütetsten Geheimnisse...
Denn das ist das Ziel: Oben auf der Liste zu stehen. Die Klickraten eines Suchergebnisses fallen umgekehrt proportional zu ihrer Rangfolge. Logisch. Niemand nimmt sich die Zeit, um 31822 Treffer zum Thema Aids (z. B. in Alta Vista) durchzuklicken, wenn er sich schnell aus Angst informieren will.
Hier beginnt der Kampf der Manipulateure gegen die Robot-Betreiber. Die einen werden versuchen, genau diese Hitparade immer wieder anzuführen, die anderen werden Maßnahmen ausknobeln, die ihren Datenbestand nicht einseitig umdeuten, sondern eine möglichst getreue Wiedergabe der Ist-Situation im Web darstellen.
Ab hier öffnen sich die Giftschränke im Kampf um den ersten Klick
Gewitzte Verfechter der Methode, die Suchmaschinen weiter zuzuschütten, werden statt der META-Tags auf Kommentarzeilen ausweichen oder Fließtext zwischen SCRIPT-Tags schreiben, wo er keine funktionalen oder darstellerischen Auswirkungen hat. Jetzt werden Betreiber der Datenbanken schon größere Schwierigkeiten haben, diese Einsprengsel auszusondern. Gerade weil die Trefferlisten in solchen Datenbanken nach einem Häufigkeitsprinzip entstehen, wäre eine reine Wiederholung des Textinhalts kaum mit wesentlich mehr Ladezeiten verbunden, würde aber die Chance auf einen vorderen Platz mehr als verdoppeln. Wenn sich Datenbankbetreiber hier einen Algorithmus ausdenken, genau diese Mogeleien zu unterdrücken, dann werden sie sich an den Tags orientieren müssen, die die Unsichtbarkeit der Wortware unterstützen. Es wäre also denkbar, den Inhalt von Scripts und Kommentarzeilen auszumerzen.
Aber wie stark wäre der Erfolg solcher Maßnahmen, wenn die Verschlagwortung zum Beispiel an verschiedenen Stellen im Layout stattfindet und sich eines banalen aber wirkungsvollen Tricks bemächtigt? Durch extrem lange und leere Tabellen wird für User nicht bemerkbar das File nach unten hin verlängert, und die betreffenden Signalwörter stehen am Fußende des Files in der gleichen Färbung wie die des Hintergrunds. Auf diese Weise werden Wörter unsichtbar, und kein logischer Filter kann sie dann noch vom wirklichen Content trennen, ohne auch dort erhebliche Einbußen im eigenen Datenbestand zu erzeugen.
Eine formale Aussonderung über Signal-Tags entfällt daher, und es bliebe nur noch eine semantische. Aber hier begänne eine qualitative Aussonderung, die bisher keine Suchmaschine auch nur in Angriff genommen hat. Robots sind wie Club-Med-Urlauber: Sie fressen alles verfügbare in sich hinein und fragen nicht nach dem Sinn oder dem Mehrgewinn. Wie absurd solche semantisch orientierten Auslesen wären, zeigen Versuche, sexistische Sprachprodukte aus den eigenen Datenbanken zu entfernen. (Scheinbar eine klare Aufgabe, nur leider ist Sprache nicht eineindeutig. Sie lebt vielmehr von Mehrdeutigkeiten.) So wird man sich schwer tun, Sätze wie "Blasen beim Hinknien" oder "Das war ein sehr gutes Sextett" oder "BMW empfiehlt den flotten Dreier" maschinell sinnvoll auszusondern oder ohne angeschlossene Duden-Redaktion klar zu flagen.
Spätestens ab hier haben Suchmaschinen verloren
- oder vielmehr ihre Betreiber. Das Geschäftsmodell dieser Technik basiert darauf, daß tumbe Maschinen sich ohne Pause durch das Netz fressen und die dabei gefundenen ASCII-Strings ablegen. Muß zu diesem vollautomatischen Prozeß des Content-Samplings eine menschliche Entscheidungsinstanz hinzugezogen werden, die diesem Content bewertet und dadurch die Aufnahme als Datensatz zensiert, entstehen zwei entscheidende Nachteile: Zum einen geraten so die Kosten für diesen Content aus dem Ruder. Zum anderen verlangsamt sich die Aufnahme der Daten immens, und das bei einem Bestand von 60-80 Millionen Seiten (wer weiß das schon) in großen Suchmaschinen wie Alta Vista oder Hotbot ...
Nun wird bei den Betreibern eine ganz klare Strategie gefahren, die auf Masse statt Klasse arbeitet. Das heißt, daß das eine oder andere schwarze Schaf schon in den Daten versteckt sein mag, daß auch genügend inaktive Files im Web schlummern und daß schließlich jeder mit den gleichen Mitteln mogeln kann. Man geht letztendlich von einem vernachlässigbaren Restrisiko aus. So einfach ist das aber nicht immer.
Die smarteste und damit fast unwiderstehlichste Möglichkeit, eine Suchmaschine für seine eigenen Contents, also auch für seine eigenen Interessen zu mißbrauchen, besteht sicher darin, diese Suchmaschinen mit soviel Futter zu versorgen, daß sie sich möglichst lange auf den eigenen Servern tummeln. Wer einen Robot in sein eigenes Schlaraffenland locken kann, hat gewonnen.
Folgende Grundüberlegungen liegen dem zugrunde. Eigentlich ist es nicht wichtig, daß User auf ein bestimmtes File durch eine Suchmaschine kommen. Es ist viel wichtiger, daß sie auf einem bestimmten Server landen, der eine ganz bestimmte URL besitzt und damit auf die eigene Web-Marke hinführt. Besteht der Content dieser Marke nun aus unzähligen Files, die durch unzählige Links miteinander verbunden sind, so entstehen immer mehr Einträge im Schlagwortregister der Datenbank, die die Chance, daß ein User sich diesen Link anklicken wird, heftig steigen läßt.
Im idealen Fall ensteht so eine Meta-Strategie ohne META-Tag, denn im extremen Fall können ein oder mehrere große deutsche Verlage beschließen, soviel Content auf einen Server zu stellen, daß bei jedem denkbaren deutschsprachigen Suchwort mindestens ein, möglichst viele Treffer innerhalb der Suchmaschine entstehen. Es muß so zwangsläufig mehr Traffic auf den eigenen Seiten entstehen, denn erfahrungsgemäß klicken sich Surfer noch eine Ebenen hoch, wenn sie Passendes auf einem Server gefunden haben (Und das heißt ja meistens, daß sie im mittleren Ebenenbereich eingestiegen sind, selten auf der Homepage landen.).
Jeder Verlag, der also der die Sucht mach Masse auf Seiten von Webcrawlern mit der Masse seiner Angebote bedienen kann, wirbt kostenlos durch die meistgenutzten Sites. Werbebanner für vereinzelte Angebote sehen hier alt aus.
Wenn man so will, entsteht durch diese Strategie zum ersten Mal ein Medien-Subliminal, das zu ganz unterschiedlichen Themen die User immer wieder auf die gleichen Server führt und so den Eindruck suggeriert, daß diese URL einen Nutzwert hat, die dem einer Suchmaschine vielleicht ebenbürtig ist.
Es bedarf dann nur noch eines technischen Zusatzfeatures, das den Besucher willkommen heißt, ihm den Nutzen der Site naheführt und ihn weiter in die Zielsite hineinführt. Welche Suchmaschine will hier noch gegensteuern, zumal der Sinn einer Suchmaschine ja erfüllt wurde? Sie hat zu Content geführt.
Schön und gut. Doch man übersieht nach dem technischen K.O. durch Contentmasse, daß auch Suchmaschinen eine subtile Art der Rache in sich bergen. Nach einem Bericht der Zeitschrift WIRED im Jahr 1996 könnten mehr als 10% des gesamten Webtraffics von Suchmaschinen stammen ... auf der Suche nach neuem Content. Tendenz steigend, denn je aktueller eine Suchmaschine, desto begehrter.
http://www.heise.de/tp/artikel/1/1407/1.htmlDarstellungsbreite ändern
Da bei großen Monitoren im Fullscreen-Modus die Zeilen teils unleserlich lang werden, können Sie hier die Breite auf das Minimum zurücksetzen. Die einmal gewählte Einstellung wird durch ein Cookie fortgesetzt, sofern Sie dieses akzeptieren.

Börsenstrompreise bei Null
Warum wählt (uns) keiner?
Der 3-Cent-Wahnsinn
Mehr als 20 Prozent billige Arbeitskräfte
17. Juni 1953 - Sozialrevolte oder deutscher Aufstand?