« Zurück zum Magazine

Online Marketing ohne Badewanne – Pragmatische Ansätze zur Attribution

Jeder Erfolg hat in der Regel viele Väter und Mütter – und damit fangen häufig einige Probleme an. So auch bei einer der komplexesten Aufgaben im Online Marketing, der Attributionsmodellierung.

Väter und Mütter sind dabei alle an einer Conversion beteiligten Online Marketing Kanäle. Die Verheißungen klingen dabei verlockend: Mit Hilfe der Attributionsmodellierung erfährt jedes Unternehmen, wie es seine Online Marketing Spendings zu maximalen Renditen führt, indem es jeden Kanal mit den renditeträchtigsten Spendings ausstattet. Die Realität der Attribution sieht allerdings leider häufig anders aus.

Valide Attributionsergebnisse erfordern ein umfassendes Tracking der Customer Journey, dessen Ergebnisse ausreichend valide sein müssen. Schon allein daran scheitern viele Unternehmen. Und selbst, wenn man die Customer Journey genau bestimmen kann, ist noch nicht gesagt, dass die zutreffende Attribution modelliert werden kann. Immerhin bedeutet Attributionsmodellierung ja nichts anderes als die Kaufentscheidung eines Kunden nachzuvollziehen. Häufig genug aber wissen die Kunden noch nicht einmal selbst, wie ihr Entscheidungsprozess verlaufen ist.

Aber sollte man deswegen auf die Attributionsmodellierung verzichten? Keineswegs, allerdings ist es an der Zeit für einige pragmatische Ansätze, die in diesem Beitrag präsentiert werden. Diese sollten vor allem ein Ziel haben: die Attributionsmodellierung immer weiter zu verbessern und eigenständige Attributionsmodelle aufzubauen.

1500x800-Attributionsmodell

Customer Journey oder Blindflug – woran Attributionsmodellierung scheitern kann

Um erfolgreich Attributionsmodellierung betreiben zu können, müssen Unternehmen ein hohes Niveau in der Web- und Datenanalyse erreicht haben. Das zentrale Versprechen, das Online Marketing gegenüber traditionellem Marketing macht, sind unmittelbare Einblicke in das Verhalten von Nutzern und Kunden und deren Reaktionen auf Kampagnen, Werbemittel und Landingpages. Dieses Versprechen kann aber nur eingehalten werden, wenn im Rahmen der datenschutzrechtlichen Grenzen eine umfassende Erhebung von Nutzerdaten erfolgt. Steffen Wagner zeigt in einem hilfreichen Aufsatz, welche Herausforderungen dabei zu bewältigen sind und woran Attributionsmodellierer regelmäßig scheitern. Damit unterstreicht er zurecht Datenqualität als den Startpunkt einer Neubewertung und Neuausrichtung der Attributionsmodellierung.

„It’s the data, stupid!“

"It’s the data, stupid" möchte man in Anlehnung an Bill Clintons berühmtes Zitat ausrufen. Auf Daten kommt es an, wenn diese fehlen und von schlechter Qualität sind, endet die Attributionsmodellierung bevor sie überhaupt begonnen hat. Daten für die Attributionsmodellierung sind in allererster Linie eigene Tracking-Daten, die im Rahmen der WebAnalyse erhoben werden. Aber auch Daten, die Werbeplattformen –etwa Affiliate- oder Remarketing-Anbieter- bereitstellen, können verwendet werden.

Unmittelbar aus den Systemen eines E-Commerce Unternehmens stammen etwa Warenkorbdaten sowie Informationen aus dem CRM. Diese geben Auskunft über die Bestellhäufigkeit, das Retourenverhalten und viele andere Interaktionen mehr. Ein zentraler Punkt, der häufig übersehen wird: Nur wenn all diese Datensätze über eine Nutzer- oder Kunden-ID miteinander verknüpft werden können, ist die Customer Journey überhaupt vollständig erfassbar und Zusammenhänge zwischen Conversion und Kanälen zu ermitteln. Diese Verknüpfung kann partiell über das Standard-Analytics-Tracking oder über den Onlineshop bzw. das CRM-System erfolgen.

Datenprobleme in der Attributionsmodellierung

In einer umfassenden Liste zeigt Steffen Wagner mögliche Datenprobleme auf und beginnt mit einem Klassiker:

1. Cross-Device-Nutzung: Da das Analytics-Cookie nur auf einem Gerät gesetzt wird, kann ein Gerätewechsel nicht erfasst werden. Bei sehr deutlich zunehmenden Cross-Device-Customer Journeys ist das ein echtes Problem. Die Lösung ist eine gleichzeitige Anmeldung von Nutzern in mehreren Geräten.

2. Cookie-Blocker und Cookie-Löschung: AdBlocker und Cookie-Blocker sind weit verbreitet. Folglich stößt die Datenerhebung bereits da an Grenzen, wo Nutzer das Tracking verhindern, was ihr gutes Recht ist. Hier ist es der Online Marketing Industrie noch nicht gelungen, für die Vorteile des Trackings zu werben.

3. Nicht-Erfassung von Touchpoints: So ist es in vielen Analytics-Lösungen nicht möglich, Ad Impressions, die ohne Klick bleiben, zu erfassen. Somit hat hier die erfasste Customer Journey eine weitere Lücke.

4. Unvollständige On-Site-Metriken, die auf Javascript basieren: Deutlich wird das, wenn Blogseiten hohe Absprungraten, aber hohe Time-on-Site-Werte haben. Da bei der Bloglektüre kein in Javascript erfasstes Ereignis stattfindet, wird der Seitenbesuch als Absprung gewertet. Fokussiert man nur auf die Absprungrate, würde man die Seiten als irrelevant und nicht attraktiv ansehen.

5. Fehlende Verknüpfung zwischen WebAnalyse und CRM: Ein Lock-in des Nutzers erfolgt in der Regel nur, wenn er auch kauft. Damit wird gerade bei den für die Attribution interessanten Nicht-Käufen eine Verknüpfung der beiden Daten-Bereiche WebAnalyse und CRM ausgeschlossen.

6. Datenbrüche aller Art wie etwa Umbenennung von Kanälen, Änderungen des Trackings in verschiedenen Kanälen etc. erschweren die vollständige Erfassung der Customer-Journey-Daten weiter. Das gleiche gilt für substanzielle Änderungen an einer Website oder einem Onlineshop. Wenn sich etwa der Checkout verändert, können Daten über zuvor erfasste Microconversions im Checkout obsolet werden.

7. Schließlich spielt der Analysezeitraum eine große Rolle. Wählt man diesen zu kurz, können wichtige Touchpoints ausgeschlossen werden. Wagner schlägt entweder ein branchenbezogenes Zeitfenster, in dem für die Branche oder Produktkategorie typische Entscheidungslängen angesetzt vor, oder einen möglichst langen Zeitraum. Bei letzterem ergibt sich aber das Problem, dass für eine unverfälschte Analyse keine substanziellen Änderungen an den Touchpoints durchgeführt werden darf.

All diese Probleme sind aktuell und relevant, so dass jeder Attributionsmodellierer zunächst kritisch prüfen sollte, wie es um die eigene Datenqualität bestellt ist. Nur wenn diese gegeben ist, sollte man sich im nächsten Schritt mit der eigentlichen Attributionsmodellierung beschäftigen.

Attributionsmodelle – von Last-Click und Badewannen

Sind die Daten erfasst, bietet etwa Google Analytics auch in der Basisvariante eine stattliche Menge an Attributionsmodellen. Diese unterscheiden sich darin, wie der Einfluss auf eine Kaufentscheidung auf die Kanäle aufgeteilt wird. Dabei ist die Reihung der Kanäle stets chronologisch. So erklärt sich die Vorgehensweise eines Last-Click- und eines First-Click-Modells.

Bei diesen beiden Modellen wird jeweils dem letzten oder dem ersten Touchpoint das volle Ergebnis der Conversion zugerechnet. Natürlich ist das sehr einseitig und kann kaum als sinnvoll betrachtet werden. Das Gleiche gilt für das Modell, bei dem der letzte indirekte Click, also der vorletzte Klick vor der Conversion den Erfolg zugeschrieben bekommt. Leider ist das das Standard-Attributionsmodell von Google Analytics. Wenn Du etwa den "Channel Report" mit Umsätzen aus der Rubrik "Akquisition" aufrufst, bekommst Du dort eine Zuordnung nach dem "Last Indirect Click"-Modell.

Eher dem Gedanken der Attribution zuzuordnen sind alle Modelle, die versuchen, den Conversion-Erfolg mehreren Kanälen zuzuordnen. So ordnet die hier titelgebende "Badewanne" sowohl dem ersten als auch dem letzten Touchpoint große, dazwischenliegenden mittleren Touchpoints nur eine kleine Bedeutung zu. Ein lineares Modell verteilt einfach den Erfolg gleich auf alle Kanäle, während das Modell zum Zeitablauf am ehesten dem "gesunden Menschenverstand" entspricht. Bei diesem Modell wird der Zuordnung des Conversion-Erfolgs nach zeitlicher Nähe zur Conversion durchgeführt. Der letzte Klick bekommt die höchsten "Credits", der vorletzte die zweithöchsten usw. Dieses auch von Avinash Kaushik empfohlene Modell kommt aber ebenfalls über einen Makel nicht herum, den alle Modelle haben. Sie sind reine Heuristiken, können also nicht detailliert begründet werden. Die Verwendung der Modelle kann nur Sinn machen, wenn man für ein gegebenes Conversion Ziel in einem der Modelle ein typisches Verhaltensmuster der Nutzer wiederentdeckt.

Interessengeleitete Attribuierung

Eine weitere Herausforderung der Attributionsmodellierung sind Vorgaben von Werbepartnern oder –plattformen, die in ihren Reports eigene Attributionsmodelle einsetzen. Bei allen ergebnisorientiert abgerechneten Werbemodellen sollte stets die Frage nach der der Abrechnung zugrunde gelegten Attribution gestellt werden. Werden etwa über einen langen Zeitraum so genannte "nachlaufende Conversions" als Erfolg des Werbepartners gewertet, so kann das durchaus im Widerspruch zu dem ansonsten zugrunde gelegten Zeitfenster für die Attribution stehen.

Attribution ist also, gerade von Werbepartnern, die mit der Vermittlung von Conversions Geld verdienen, in der Regel interessengeleitet. Auch innerhalb des Unternehmens wird es Interessen geben, den einen Kanal auf-, den anderen abzuwerten. Das ist nicht verwerflich, nur sollte sowohl bei externen als auch internen Partnern nicht darauf verzichtet werden, nach einer Begründung für eine gewählte Attribuierung zu fragen. Kann diese nicht gegeben werden, ist das ein Grund, sich auf den Weg zu einem eigenständigen, pragmatischen Weg der Attributionsmodellierung zu machen.

Pragmatische Ansätze zur Attribution – Abschied von der Perfektion

Wenn man die Unzulänglichkeiten bestehender Lösungen zur Attributionsmodelle ernst nimmt, sollte die Konsequenz nicht sein, deshalb auf Attributionsmodellierung zu verzichten. Allerdings, und auch das ist zunächst ein großer Schritt, sollte man sich von vermeintlicher Perfektion (zunächst) verabschieden und Attributionsmodellierung als Prozess verstehen. Es ist ein Lernprozess, bei dem es darum geht, die Bedeutung der Kanäle für die eigenen Ziele zu verstehen. Wenn das gelingt, kann ein individuelles Attributionsmodell helfen, den Return on Advertising Spendings zu steigern.

Der Deckungsbeitrag und seine Entstehung

Mittelpunkt dieser Zielbetrachtung sollten die erzielten Deckungsbeiträge und ihre Entstehung sein. Die Frage lautet also, welcher Kanalmix im E-Commerce den operativen Ertrag maximiert. Dabei setzt sich der operative Ertrag im E-Commerce aus

**

  • den erzielten Umsätzen

  • abzüglich der Wareneinstandskosten und Fulfillment-Kosten

  • abzüglich der direkten Online Marketing-Aufwendungen.

**

Damit entspricht der operative Ertrag dem Deckungsbeitrag der Stufe II, also nach Waren- und Fulfillment-Kosten sowie direkten Online Marketing-Aufwendungen.

Die Attributionsmodellierung beeinflusst bei dieser Zielgröße über die Steuerung der Conversions die Umsätze und über die Auswahl der Kanäle die direkten Online Marketing-Kosten. Wenn einem Kanal ohne direkte Online Marketing-Aufwendungen, wie etwa SEO, ein höherer Einfluss auf die Conversions zugesprochen wird und deswegen die Online Marketing-Aufwendungen in anderen Kanälen reduziert werden, steigt auf jeden Fall –in einem ersten Schritt- der operative Ertrag. Allerdings würde er parallel simultan sinken, wenn die Attribution falsch wäre. Prädestinierte Kennziffer, um dieses abzubilden, ist der Return on Advertising Spendings (ROAS). Liegt dieser etwa bei 400%, wurden zB. aus einer Ausgabe von 100 € ein Umsatz von 400 €, was gleichzeitig einer Kosten-Umsatz-Relation (KUR) von 25% entspricht.

Welcher Kanal ist der beste?

Um zu einer eigenen Attributionsmodellierung zu kommen, sollte man zunächst eine eigenständige Vorstellung entwickeln, welcher Kanal den höchsten Einfluss auf die Conversions hat. Häufig hat man dazu bereits Erfahrungen und auch in den verfügbaren Attributionsmodellen Erkenntnisse gesammelt. Ein Kanal, der im Tracking vollständig erfasst wird und der in den meisten Attributionsmodellen die meisten Conversions erzielt, sollte auch im individuellen Modell einen vorderen Platz einnehmen.

Marktforschung hilft – der ungläubige WebAnalyst

Es sollte aber nicht schädlich sein, wenn man jede noch so offensichtlich scheinende Erkenntnis kritisch prüft. In unserem Fall können Nutzer und oder Kundenbefragungen helfen. Diese kann man fragen, über welchen Kanal sie auf die Seite gelangt sind, bevor sie konvertiert haben. Führt man diese Nutzerbefragung regelmäßig durch, können vor allem Unzulänglichkeiten beim Cross Devicetracking oder fehlender Cookie-Ortung zumindest teilweise kompensiert werden. Auch andere Einsichten wie etwa Benchmark-Partnerschaften, Referenzen, Kundenlabore oder Befragung der Mitarbeiter können helfen, ein Grundverständnis der Attribution zu entwickeln und dieses mit den Tracking-Daten abzugleichen.

Schließlich bietet Google Analytics mit den "Top Conversion-Pfaden" und den "vorbereitenden Conversions" zwei Standard-Berichte mit Informationen zur Bedeutung einzelner Kanäle für die Attribution an. Während die „Top Conversion Pfade“ einen allgemeinen Überblick über mögliche Varianten der Customer Journey geben, sind die "vorbereitenden Conversions" interessant, um langfristig wirkende Kanäle zu identifizieren. Diese Informationen können mit weiteren direkten oder indirekten Tracking-Insights zu einem eigenen Attributionsmodell verarbeitet werden.

top-conversions-pfade

Abbildung 1: Google Analytics Bericht "Top Conversion-Pfade"

vorbereitenden-conversions

Abbildung 2: Google Analytics Bericht "Vorbereitende Conversions"

Welches Attributionsmodell ist das beste? – Das eigene!

Wenn es also darum geht, eine zuverlässige Attribution durchzuführen, ist der beste Weg, ein eigenes Attributionsmodell zu erstellen. Auch dazu gibt Google Analytics eine gute Option, denn es lässt sich ohne großen Aufwand ein benutzerdefiniertes Attributionsmodell zum bereits bestehenden Katalog hinzufügen. Avinash Kaushik erklärt, wie es funktioniert und gibt auch Empfehlungen, welche Parameter das Modell haben sollte. Empfehlenswert ist danach ein dreistufiges positions-basiertes Modell, bei dem mittleren Kanal der höchste Kredit, dem letzten der zweithöchste und dem ersten der geringste Kredit zugeordnet werden kann. Weiter lässt sich ein bis zu 90 Tage dauernder Zeitraum für die Attribuierung festlegen. Eine weitere Festlegung ist der Maßstab für das Nutzerinteresse. Hier stehen als Metriken die Zeit auf der Seite oder die Seitentiefe zur Verfügung. Schließlich kann man noch eigene Attributionsregeln festlegen. So kann man etwa als relevanten Interaktionstyp den Klick festlegen (und damit reine Impressions ausschließen).

Fazit: Attribution 2.0

Doch kann die Entwicklung eines eigenen Standardmodells auch nur ein erster Schritt sein. Denn auch dieses Modell ist vor den oben beschriebenen Datenproblemen nicht gefeit, allerdings weniger anfällig, da es ja durch eine Prüfung der Hypothesen außerhalb der Trackingdaten begleitet wird. Steffen Wagner schlägt in seinem Beitrag ein "Attribution 2.0" vor und meint damit, die "perfekte" Welt der Attribuierung, bei der Datenprobleme gelöst sind und Methoden fortgeschrittener Datenanalyse wie etwa die logistische Regression durchgeführt werden können.

Auch wenn diese Verfahren sicher nicht trivial sind, dürfte doch die Regressionsanalyse weniger die größte Herausforderung sein, als vielmehr durchgehende Daten zum Customer Journey zu erhalten. Bei der derzeitigen geringen Akzeptanz des Tracking und auch bei der Weiterentwicklung des Datenschutzrecht dürfte immer wichtiger werden, Nutzer zur Anmeldung auf einer Seite zu motivieren und ihnen mit der nötigen Transparenz Vorteile dieser Anmeldung zu vermitteln. Wer sich Amazon Prime als hocheffektives Kundenbindungsprogramm ansieht, erhält eine Vorstellung wie richtige Anreize für Registrierung und Anmeldung aussehen können. Da nicht jeder Onlineshop eine eigene Video- und Musikplattform aufbauen kann wie Amazon müssen andere Anreize her. Eine gute Möglichkeit, nicht nur Daten sondern auch Alleinstellungsmerkmale zu erhalten.

Theorie ist gut - Praxis ist besser! Jetzt Webseite analysieren mit Ryte FREE

Veröffentlicht am Nov 2, 2017 von Dominik Große Holtforth