Was bedeutet Online-Segmentierung

die Frage scheint trivial: „Was ist Online-Segmentierung?“ Dieser Beitrag ist der Versuch eine einfache, Antwort darauf zu geben. Bevor ich dorthin komme, widme ich mich aber der Frage – „Was ist Segmentierung?“ Ich werfe einen Blick auf Modelle, die der Segmentierung dienen und stellen mir dann die Frage, was eine Online Segmentierung so speziell macht.

Segmentierung

UserAttributeDer Ausgangspunkt einer Segmentierung ist immer ein Modell der realen Welt. Dazu reduzieren wir die Welt auf ein kleines Set an beschreibenden Attributen. In der realen Welt haben wir Kunden, unser Modell davon sind die Stammdaten im Kundenstamm unseres Online-Shops. In eben diesem Beispiel reduzieren wir einen Menschen mit Augenfarbe, Essensvorlieben und Freunden auf ein Modell aus Transaktionsinformationen, verschiedenen demographischen Informationen und vielleicht noch ein paar Informationen mehr.

Wir sollten bei einem solchen Modell immer vor Augen haben, welchen Ausschnitt der Realiät wir damit modelliert haben und worüber wir Aussagen treffen können. Dies ist für die Segmentierung im eigentlichen Sinn noch nicht relevant, wird uns aber bei der Verwendung unserere Segmente beschäftigen.

Mit einem Modell haben wir das Set an Attribute, das die Grundlage des Modells darstellt. Die einzelnen Attribute liegen dabei in unterschiedlichen Ausprägungen vor. Die Ausprägung oder der Wert eines Attributs stellt dabei ein Faktum in der realen Welt dar.

z.B. das Attribut Alter mit der Ausprägung 38 Jahre oder das Attribut Produktinteresse mit der Ausprägung Männerbekleidung.

Der Wert eines Attributs wird in einer Skala mit einem speziellen Skalenniveau angegebe. Da bedeutet, dass es sich bei den  Ausprägungen des Attributs um eine Benennung, eine Vergleichsgröße, oder eine Rechengröße handelt.

Benutzer Segment anhand von AttributenFür eine Segmentierung wird die Grundgesamtheit, die durch unser Modell abgebildet wird, also z.B. unsere Kunden, anhand der Ausprägung eines oder mehrere Attribute in Teilmengen zerlegt. Die Ausprägung der Attribute, die wir zur Segmentierung herangezogen werden, lassen dabei einen Rückschluss auf die reale Welt zu.

In unseren Kundendaten könnte als Attribut für den Kunden die Anrede enthalten sein. Diese kann die Ausprägung Herr oder Frau annehmen. Wir segmentieren unsere Kunden anhand des Attributs Anrede nach dem Geschlecht. Das Skalenniveau der Anrede oder des Geschlechts ist dabei eine Nominalskala, die der reinen Faktenbenennung dient. Die Segmentierung unserer Kunden nach dem Geschlecht könnte hinreichend sein, wenn wir eine Werbemaßnahme für ein Produkt speziell für den Herrn vornehmen wollen. Oft ist die Segmentierung auf einem Attribut für eine praktische Fragestellung zu grob.

In unserem Online-Shop Beispiel haben wir aus den Transaktionen unserer Kunden den Betrag der einzelnen Transaktionen. Bei unseren Stammkunden kann das eine ganze Serie von Beträgen sein. Wir haben also einen Kunden, der uns in zwanzig Transaktionen jeweils einen Umsatz von 10€ beschert hat, in einer 21. Transaktion100€. Ein zweiter Kunde kaufte uns einmalig Waren im Wert von 50€ ab. Die Ausprägung der Transaktion, ist dabei als Attribut für eine Segmentierung kaum zu verwenden. Das Skalenniveau ist das einer Absolutskala. Hier wird von dem realen Transaktionswert weiter abstrahiert. Wir könnten z.B. den Transaktionswert in Intervalle zerlegen. Also sagen uns interessieren Transaktionen von 0-50€, von 51-100€ u.s.w. Damit wurde die Anzahl der möglichen Werte des Attributs von „beliebig viele“ auf „einige“ reduziert. In der Statistik spricht man hier von einem Wechsel des Skalenniveau.

  • Absolutskala: 10€, 50€ 100€
  • Intervallskala: 0-50€, 51-100€
  • Ordinalskala:  beliebig viele, einige
Bei den Transaktionen sind noch weitere für eine Segmentierung u.U. sinnvolle Einschränkungen denkbar. Anstatt Einzeltransaktionen heranzuziehen werden Metaattribute gebildet: Anzahl der Transaktionen, Durchschnittliche Transaktionshöhe, Umsatz im Quartal (Intervall). Der Vorteil dieser Vorgehensweise ist, dass die unbestimmte Anzahl der Transaktionen auf einen festen Satz von Attributen abgebildet wird. Wir haben hier also ein Beispiel dafür, dass eine spezielles Weltmodell gebildet wird, das ausschliesslich der Segmentierung dienen wird.

Nach einer Segmentierung verfügen wir über eine Unterteilung unserer Grundgesamtheit in Teilmengen, die dadurch bestimmt sind, dass bestimmte Attribute in speziellen Ausprägungen vorliegen. Dabei wird keine Aussage über alle anderen Attribute getroffen. Diese Aussage ist wichtig, da sie eine häufige Fehlerquelle darstellt. So wird die Segmentierung der Grundgesamtheit Internetnutzer in meinem Shop auf dem Attribut Alter mit den Intervallen 0-50 Jahre und 51- Jahre, also die Segmentierung nach den ominösen „Silver Surfern“ oft  mit dem kleinen (aber falschen Zusatz) versehen, dass dieses Segment besonders Kaufkräftig sei. Diese Aussage ist nicht generell falsch, sie ist aber leider auch nicht  immer richtig. Läßt sich aber im Segment anhand des Attributs  Umsatz im Quartal verifizieren.

Online Segmentierung

Was ist nun das besondere an einer Online Segmentierung?

Das besondere an der Online Segmentierung sind die Daten. Wenden wir uns wieder den Internetnutzer in meinem Shop zu, dann enthält diese Menge nicht nur die bereits besprochenen Kunden sondern ebenso den anonymen Interessenten. Entsprechend sollten wir über die folgenden Daten verfügen:

  • Kunde: Stammdaten, Bewegungsdaten
  • Interessent: Bewegungsdaten

Leider ist dies nur bedingt richtig. Unter den Interessenten tummeln sich auch unsere Kunden – wir wissen es nur nicht, da sie sich nicht eingeloggt haben und unserer permanenter Cookie der automatischen Datenreinigung des Browsers zum Opfer gefallen ist. Wir bewegen uns also in einer realen Welt, die uns sehr wenig Sicherheit bzgl. der verfügbaren Daten läßt.

Es gibt mehrere Wege diesem Problem zu begegnen.

  1. Context Snapshot
    hier von Targeting zu sprechen ist fast schon verwegen. Wir wenden uns nur dem momentanen Kontext des Users zu. Er sieht eine Seite auf der Fahrräder angeboten werden und wir blenden ihm immer die Fahrradpumpe dazu ein. Das geht einfach, kann auf der Basis einer Stammdatensegmentierung (Crossselling Analyse) entwickelt werden und ist einfach zu implementieren. Es handelt sich um statisches Verhalten.
  2. Behaviour Snapshot
    Wir betrachten das Verhalten des Users innerhalb einer User-Session. Er interessiert sich für das Thema Fahrrad. Das signalisiert er durch ein „fahrradaffines“ Verhalten. Indem er z.B. eine bestimmte Anzahl Seiten zum Thema fahrradfahren ansieht. Dieser Besucher kann auch dann, wenn der Seitenkontext nicht exakt stimmt, über die Zugehörigkeit zu einem Verhaltenssegmentangesprochen werden. D.h. wir können ihm eine Fahrradpumpe anbieten, wenn er niemals eine Fahrraddetailseite angesehen hat, oder wir bieten ihm eine Fahrradpumpe an sobald er vom Thema Fahrrad zum Thema Tourenplanung wechselt. Bei der verhaltensabhängigen Bewertung oder Segmentierung können auch Parameter wie die Betrachtungsdauer ein Rolle spielen.
  3. Behaviour Profile
    Wenn wir von einem Besucher ein längerfristiges Profil bauen können und dürfen, so bietet sich die Möglichkeit, auf vergangene Aktionen und vergangenes Verhalten zu reagieren. Das kann z.B. in der Form stattfinden, dass einem Besucher das Fahrrad, welches ihn lange beschäftigt hat (hohe Verweildauer) wieder angeboten wird – zu einem rabattierten Preis.
    Bei den langfristigen Profilen spielt in Europa der Datenschutz eine große Rolle und läßt vergleichsweise geringe Spielräume.

Kommentar verfassen