Echtzeitkontext für bessere Suchergebnisse auf Websites

Suchanfragen können mehrdeutig sein, das heißt mehreren Suchintentionen entsprechen. Im Idealfall, wenn die wahre Intention der Nutzer bekannt ist, will man ihnen jedoch nur die dazu passenden Suchergebnisse zeigen. Der Versuch einer Lösung.

Architektur/Methoden  –  1 Kommentare
Echtzeitkontext für bessere Suchergebnisse auf Websites

Suche spielt auf Websites eine zunehmend größere Rolle. Nutzer können darüber die relevanten Informationen so finden, wie sie sie benötigen. Das erfordert allerdings eine intensive Vorbereitung seitens des Content-Anbieters. Denn eine schlecht funktionierende Suche ist eher ein Ärgernis als eine Hilfe. Üblicherweise werden die für die Suche genutzten Ranking-Algorithmen daher in einem langwierigen iterativen Prozess von Hand optimiert, bis sich bestimmte Qualitätskriterien erfüllen lassen. Dazu zählt man Metriken des Nutzerverhaltens wie Konversionsraten sowie Relevanzmetriken wie Precision und Recall. Da Nutzer verschiedene Interessen haben und daraufhin unterschiedliche Ergebnisse für gleiche Suchanfragen als relevant ansehen können, wird die Suchoptimierung oft kunden- beziehungsweise kundengruppenspezifisch durchgeführt.

Weil eine Suchmaschine aber kein Orakel ist, haben die Autoren ein Verfahren entwickelt, mit dem sich die Suchintention von Nutzern vorhersagen lässt. Basis dafür sind historische Logdaten, die bei jeder Website anfallen, und der Echtzeitsuchkontext, der die Information über Nutzer, ihre Aktivitäten und die aktuelle Sitzung umfasst. Das Wissen lässt sich anschließend nutzen, um Suchergebnisse so zu verbessern, dass sie der wahrscheinlichsten Suchintention entsprechen, oder Navigationsempfehlungen auszusprechen.

Um die vorgestellte Optimierung verstehen und bewerten zu können, sei zunächst der übliche Prozess betrachtet, wie Suche in Online-Angeboten optimiert wird. Dabei steht an erster Stelle immer die Bestimmung einer repräsentativen Menge häufiger Suchbegriffe, die typisch für die Mehrheit der Nutzer sind und verschiedene Suchthemen abdecken. Normalerweise ist das nicht schwierig – entsprechende Informationen finden sich in den Logfiles. Allerdings kann es passieren, dass die Verteilung der Suchbegriffe flach ist und sich daher nur schwer ein Ausschnitt wählen lässt, um dennoch repräsentativ die Interessen aller Nutzer zu erfassen.

Manueller Suchoptimierungsprozess (Abb. 1)

Für jeden der gewählten Suchbegriffe wird anschließend die Ergebnisliste betrachtet, und die Häufigkeiten der Klicks (oder anderer Konversionen wie Kauf eines Produkts aus der Ergebnisliste in einem Online-Shop) auf die einzelnen Ergebnisse werden gemessen. Dabei ist der sogenannte Position Bias zu beachten: Begriffe am Anfang der Liste werden mit höherer Wahrscheinlichkeit angeklickt, weil man davon ausgeht, dass die Ergebnisliste nach Relevanz sortiert ist (und Nutzer von oben nach unten lesen). Besonders kritisch ist es folglich, wenn Ergebnisse am Ende der Liste höhere Klickraten erzeugen. Dann ist dringender Optimierungsbedarf angesagt.

Nachdem die Reihenfolge (z. B. durch manuelle Eingriffe, Boosting, Hidden Keywords etc.) geändert wurde, ergibt sich eine neue Situation, die wiederum zu messen und zu optimieren ist.

Mehr Infos

Boosting und Hidden Keywords

Die Suche in Online-Shops ist nicht immer "fair". Oft sollen bestimmte Produkte bevorzugt werden, man spricht dann von Boosting. Bei anderen Produkten möchte man, dass sie auch gefunden werden, obwohl die Worte aus der Suchanfrage gar nicht in ihrem Beschreibungstext vorkommen. Man spricht hier von Hidden Keywords, die zwar nicht am Frontend angezeigt, aber mit hohem Gewicht durchsucht werden.

Neben diesem Zyklus kommt es häufig zu saisonalen Schwankungen in den Suchbegriffen selbst (im Herbst wird häufiger nach Laubrechen gesucht), aber auch in den Klickhäufigkeiten (Grill wird im Sommer häufiger angeklickt als Schneeschaufel). Auch das ist zu berücksichtigen und führt dann zu neuen Optimierungsiterationen.

An dieser vereinfachten Beschreibung ist zu erkennen, dass die Suchoptimierung einen zeitaufwendigen, manuellen und iterativen Prozess darstellt. Dabei können viele Fehler geschehen. Der am weitesten verbreitete ist allerdings, diese Optimierung aus Zeit- oder Budgetgründen gar nicht vorzunehmen. Leider ist genau das in der Praxis häufig zu beobachten, was bei den entsprechenden Online-Angeboten zu erheblichen Verlusten an Reichweite, Umsatz et cetera führt.

Dazu kommt, dass alle Optimierungen nur die Website als Ganzes betreffen, sich aber mit diesem Verfahren nicht individuell auf Nutzer eingehen lässt. Die Suchanfragen der Nutzer bestehen aus Keywords, sind meistens kurz, und deshalb ist nicht immer klar, wonach Nutzer genau suchen. Dabei richten sich die gewünschten Suchergebnisse oft danach, wer die Nutzer sind, wie sie mit der Website interagieren oder in welchem Bereich sie sich befinden. Das und andere Merkmale einer Websession definieren den sogenannten Suchkontext und enthalten wertvolle Informationen, um die wahre Suchintention eines Nutzers zu erahnen.