Wie Techniken des maschinellen Lernens das Online-Kaufverhalten lenken können

Der Bereich des Natural Language Processing beschäftigt sich seit Jahren mit der sinnvollen Extraktion und Verarbeitung von Datenstrukturen. Insbesondere die Konzepte und Techniken rund um das Thema Deep Learning wecken neue Hoffnungen bei der Entwicklung effizienter Anwendungen.

Know-how  –  3 Kommentare
Wie Techniken des maschinellen Lernens das Online-Kaufverhalten lenken können

Betreiber von Online-Shops und anderen Online-Plattformen stehen zunehmend stärkerem Konkurrenzdruck gegenüber. Die klassischen Werkzeuge der Suchmaschinen-Optimierung gehören mittlerweile zum Einmaleins des E-Commerce. Google Adwords wird immer preisintensiver. Die Usability der eigenen Seite lässt sich längst für schmales Budget durch Crowdtesting-Anbieter optimieren. Die rein technischen Lösungen sind weitgehend ausgereizt. Es bedarf demnach eines neuen Ansatzes, um die Konversionsrate zu steigern.

So wie das Konzept des Content Marketing den Unternehmenskontakt mit Mehrwert auflädt, wird auch im Bereich E-Commerce zukünftig ein Mehrwertmodell von Nöten sein, um sich von Konkurrenten abzuheben und seine Kunden bei Laune zu halten.

Am Beispiel eines Online-Shops für Genussmittel wie Weine lässt sich das gut aufzeigen. Will man sich nicht nur durch Rabattaktionen von den Konkurrenten abheben, reicht es in Zukunft nicht mehr aus, einfach nur Weine anzubieten. Die Verpackung – der Shop – muss ebenfalls stimmen. Und dazu gehören neben Bewertungen und Empfehlungen auch Hintergrundinformationen, die das Produkt in eine größere Geschichte einbetten. Nicht umsonst gilt im Online-Marketing derzeit das Storytelling als beste Chance, Kunden für sich zu gewinnen. Der Einkauf wird zum Erlebnis, der Weinkauf zur kulinarisch-kulturellen Reise.

Hintergrundinformationen, die dieses Storytelling unterstützen, könnten zum Beispiel sein:

  • Informationen zum Winzer
  • Informationen zur Rebart
  • Informationen zu den meteorologischen (Sonnentage, Durchschnittstemperaturen) oder geologisch-morphologischen (Boden, Geologie, Hanglage) Besonderheiten des Winzerorts
  • Informationen zu den kulinarischen Spezialitäten der Region
  • Rezepte für passende Gerichte
  • Rezensionen auf anderen Webseiten oder in sozialen Netzen
  • Angabe der Aromen, um eine aromenbezogene Suche im Shop zu erlauben

Der Effekt ist eine persönlichere Präsentation des Produkts. Es wird ein neuer Kontext geschaffen, der über es hinausgeht. Im Englischen wird dabei von "Enrichment" gesprochen, dem Anreichern durch Informationen. Der Kunde bekommt eine bessere Vorstellung vom Produkt. Der vermeintlich rationale Kauf wird zur Fantasiereise. Das ermöglicht nicht zuletzt gezieltes Upselling.

Natürlich ist solch eine Mehrwertschaffung auf einer Webseite bereits möglich. Nur bedarf es eines enormen logistischen und vor allem manuellen Aufwands, die Informationen zu recherchieren und aktuell zu halten. Um den Ansatz des Erlebniskaufs kosteneffizient zu gestalten, brauchen Online-Shops zumindest teilautomatisierte Prozesse der Informationsbeschaffung und -veredlung.

An Lösungen für diese Herausforderung der (teil-)automatisierten Informationsverarbeitung semi- bis unstrukturierter Daten arbeitet der Teilbereich Text Mining des Natural Language Processing (NLP). NLP zielt darauf ab, Informationen aus Fließtexten jeglicher Art (Webseiten, Dokumenten, Beiträgen in sozialen Netzen) zu extrahieren und sinngebend zu verarbeiten.

Die Herausforderungen des NLP sind im Unterschied zu den eindeutigen Datenbankabfragen weitaus komplexer:

  • nicht eindeutige Zuordnung der Informationen durch Einbettung in Fließtexte
  • individuelle oder regionale sprachliche Besonderheiten (Dialekt)
  • Tippfehler, Rechtschreibfehler
  • plattformabhängige Besonderheiten wie die verkürzte, oft grammatikalisch falsche Sprache in sozialen Netzen
  • Phänomene wie Synonymie (Gleichbedeutung), Polysemie (Mehrdeutigkeit), Deklination und Konjugation von Worten sowie Phrasen
  • unterschiedliche Schreibweisen in verschiedenen Sprachen
  • Frage der Authentizität und Vertrauenswürdigkeit

In Bezug auf die Anreicherung von Webseiten mit Bildern steht das NLP zudem vor der Hürde, dass viele Bilder nicht sauber mit Tags versehen sind. So sind die Metadaten entweder fehlerhaft, unvollständig oder sie fehlen ganz. Eine eindeutige Identifizierung und Kontextualisierung wird unmöglich. Hier kann jedoch die semantische Bildanalyse unterstützen. Erste Ansätze, Bildunterschriften automatisch zu generieren, sind bereits im Einsatz.

Auf dem Feld des NLP geht es vor allem um die Named Entity Recognition (NER) und die Named Entity Disambiguation (NED). NER beschreibt das Ziel, in Texten bestimmte Entitäten zu identifizieren und zu klassifizieren, um nachfolgend die Inhalte zu verknüpfen. NED dagegen soll die spezifische Bedeutung der jeweiligen Entitäten im Kontext ihres Auftretens herausfinden. Entitäten beschreiben hierbei sowohl bestimmte Schlüsselbegriffe – zum Beispiel die Namen eines Weines oder seines Anbaugebiets – als auch Schlüsselkategorien, etwa Ort, Person oder Getränketyp.

Derzeit stehen für die Umsetzung der NER drei wesentliche Methoden zur Verfügung:

  1. Wörterbuchbasiertes NLP
  2. Regelbasiertes NLP
  3. Maschinelles Lernen, speziell Deep Learning und neuronale Netze

Vergleich der verschiedenen Ansätze anhand des Automatisierungsgrades: Die dunkelblauen Boxen können automatisch von ihrer Eingabe lernen und eine Ausgabe erzeugen (Abb. 1).

(Bild: (in Anlehnung an http://www.deeplearningbook.org))