27.06.2017 Personalisierung im Online-Handel

So klappt das algorithmische Geschäft

Von: Alex Ciorapciu*

Wie Big Data, Künstliche Intelligenz (KI) und einheitliche Nutzer-IDs im algorithmischen Geschäft helfen und das Ausliefern personalisierter Web-Inhalte ermöglichen

Die „Omnichannel-Personalisierung“ in Kombination mit Künstlicher Intelligenz und Big-Data-Technologien trägt dazu bei, dass die „Customer Journey“ kanal- und geräteübergreifend reibungslos verläuft.

Hand aufs Herz – wie oft sind Sie offline? Vermutlich nicht so oft und Schuld daran dürften Smartphones sein. Denn wie aus einer ARD-/ZDF-Online-Studie hervorgeht, ist die allgemeine Internetnutzung in Deutschland deutlich gestiegen. Die Web-Nutzungsdauer betrug 2016 in der Gesamtbevölkerung erstmals mehr als zwei Stunden täglich, dabei hat das Smartphone den Laptop als wichtigstes Internet-Device überholt. Besonders die mobile Nutzung zog stark an.

Ein typischen Szenario heutiger mobiler Web-Nutzung: Morgens auf dem Weg zur Arbeit schnell E-Mails checken. Eine Werbe-Mail mit interessanten Produkten sticht ins Auge und schon surft man das Angebot des Online-Händlers an. Dann fährt der Zug ein, man steckt das Smartphone in die Tasche und vergisst die Angebote. Erst abends erinnert man sich wieder daran und besucht nochmals die Seiten, aber vom Tablet aus. Doch das Produkt, das man morgens bei Surfen entdeckt hat, findet sich nicht mehr. Nicht gefunden, nicht gekauft – eine vertane Chance für den Händler.

Das muss nicht so sein. Eine kohärente Strategie für die sogenannte „Omnichannel-Personalisierung“ in Kombination mit Künstlicher Intelligenz und Big-Data-Technologien trägt dazu bei, dass die „Customer Journey“ kanal- und geräteübergreifend reibungslos verläuft. Omnichannel-Personalisierung bedeutet in diesem Zusammenhang, dass nutzerspezifische Daten allen Kanälen in Echtzeit zur Verfügung stehen und Künstliche Intelligenz nicht nur dafür sorgt, dass die Daten ausgewertet werden, sondern auch, dass Applikationen automatisiert zur Ausführung gebracht werden. Das Analystenhaus Gartner spricht in diesem Zusammenhang auch vom algorithmischen Geschäft. Damit dieses funktioniert, müssen verschiedene Voraussetzungen auf drei Ebenen erfüllt werden.

Data Lake und Datenverarbeitung in Echtzeit

Auf der Datenebene müssen Daten aus allen Systemen und Quellen entlang aller Kanäle und Kunden-Touchpoints erfasst und zusammengeführt werden, sodass eine einheitliche Sicht auf die Daten von allen Anwendungen aus möglich ist.

Big-Data-Technologien wie Hadoop ermöglichen es, Daten in unterschiedlichen Formaten und in großen Mengen kostengünstig als Data Lake zu speichern. Um diese aber in Echtzeit, also innerhalb von ein bis zwei Sekunden, tatsächlich nutzen zu können, braucht man spezielle Datenverarbeitungssysteme, wie z.B. Apache Spark. Die unmittelbare Datenverarbeitung ist wichtig, um auf der nächsten Ebene das Nutzerverhalten vollständig auswerten zu können.

Wenn also ein Nutzer eine Webseite aufsucht, werden verschiedene Daten automatisch erfasst und in Echtzeit verarbeitet, wie z.B. wie ist der Besucher auf die Seite gelangt (über eine E-Mail-Kampagne, über Suchmaschinen, hat sich als Kunde eingeloggt oder die Adresse direkt in den Browser eingegeben), welche Produkte oder Inhalte schaut er sich wie lange an oder was sucht er auf der Seite.

Künstliche Intelligenz und maschinelles Lernen

Diese einheitliche und unmittelbare Sicht auf die Daten ist allerdings nur der Startpunkt. Um Werte zu generieren, müssen die Daten nun weiter verarbeitet und in Handlungsanweisungen übersetzt werden. Das können personalisierte Produktempfehlungen oder Inhalte sein, die einem Nutzer angezeigt werden, personalisierte Suchergebnisse oder auch die Reihenfolge, wie die Produkte aufgelistet werden.

Auf der Logikebene wird dazu Künstliche Intelligenz und maschinelles Lernen genutzt. Dazu stehen verschiedene Algorithmen zur Verfügung, wie z.B. “Kunden, die sich diesen Artikel angesehen haben, interessierten sich auch für”, “zuletzt angesehen Artikel” oder “ähnliche Artikel”.

Welcher Algorithmus zum Einsatz kommt wird von vielen Händlern oftmals immer noch durch manuelle Filter und Regeln bestimmt. Je fortschrittlicher allerdings die verwendeten Tools, desto mehr wird hier automatisiert. Maschinelles Lernen erlaubt es, dass alle Algorithmen miteinander konkurrieren und für jede Situation basierend auf den Kontext (Welcher Algorithmus ist in diesem Kontext relevant?), und auf den vorherigen Erfolg (Welcher Algorithmus hat die höchste Revenue per Session?) der optimale Algorithmus in Echtzeit ausgewählt wird.

Diese Information muss dann auch in Echtzeit entlang aller Kunden-Touchpoints verteilt werden, sodass die zuletzt angesehenen Artikel in unserem Beispiel nicht nur morgens auf dem Smartphone, sondern auch abends auf dem Tablet vorliegen.

Nutzer-IDs

Um diese Information entlang aller Kanäle entsprechend zu verteilen, bedarf es auf Nutzerebene eindeutig zuordbare IDs. Im Idealfall loggen sich die Nutzer von jedem Gerät aus ein wenn sie das Angebot des Online-Händlers nutzen. Und es gibt durchaus viele Möglichkeiten durch Anreize und Preisvorteile den Anteil der eingeloggten Nutzer deutlich zu erhöhen. In der Realität loggt sich die Mehrzahl der Nutzer jedoch erst ein, wenn es zur Kasse geht. Allerdings lassen sich auch nicht eingeloggte Nutzer sich mittels Soft-Logins oder vorläufigen IDs tracken.

Bei einem Soft-Login wird die ID des eingeloggten Nutzers von einem Erstanbieter-Cookie gespeichert und für nachfolgende Besuche vom gleichen Gerät aus genutzt. Eine vorläufige ID speichert das Nutzerverhalten und verlinkt es dann beim Einloggen automatisch zu dem genutzten Kundenkonto.

Dass immer mehr Nutzer mit dem Smartphone oder dem Tablet shoppen hat den Vorteil, dass App-Nutzer sozusagen permanent eingeloggt sind und dadurch eine Nutzer-ID haben. Bei Kunden, die sich für E-Mail-Up-Dates oder Newsletter anmelden, nutzen viele Händler auch die E-Mail-Adresse als langfristige ID.

Darüber hinaus gibt es Drittanbieter, die probabilistische Matching-Dienste anbieten. Zum einen nutzen sie deterministische Methoden, die erkennen, wenn sich die gleiche E-Mail-Adresse auf verschiedenen Geräten einloggt. Zum anderen werden Daten wie IP-Adresse, Netzbetreiber der IP-Adresse, Standort der IP-Adresse, GPS-Standort, besuchte Seiten oder Gerätetyp gesammelt, um die Wahrscheinlichkeit zu berechnen, ob Geräte von einem oder mehreren Personen genutzt wird, bzw. ob die gleiche Person auf verschiedenen Kanälen und von verschiedenen Geräten aus das Angebot des Online-Händlers nutzt.

Wahrung von Datenschutz

Sobald die Nutzer-ID erkannt wird, sollten die Verhaltensdaten via APIs an alle weiteren Kanäle geteilt werden, sodass die gleiche Informationen zu gleichen Zeit auf allen Kanälen vorliegen.

Wichtig zu erwähnen ist, dass entsprechend des Datenschutzes die gespeicherten Daten zwar einer einheitlichen ID zugeordnet werden, aber nicht einer bestimmten Person. So bleiben die hinter den IDs stehenden Personen anonym, bekommen aber trotzdem auf sie zugeschnittene Empfehlungen.

Im oben genannten Internet-Beispiel gelangt der Nutzer morgens auf den Weg zur Arbeit über den Klick auf die Werbe-Mail zu den Händlerseiten. In diesem Falle liegt also die E-Mail-Adresse und mit ihr die langfristige Nutzer-ID vor. Abends nutzt er die Tablet-App, die die am Morgen angesehen Produkte anzeigt, sodass der Nutzer den Kauf abschließen kann.

* Der Autor Alex Ciorapciu ist als Director Global Solution Engineering & Partnerships bei Rich Relevance für technologische Partnerschaften und Innovation zuständig.

Bildquelle: Thinkstock/iStock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH