Modele atrybucji – łańcuchy Markowa

Modele atrybucji – łańcuchy Markowa
Na przestrzeni ostatnich lat wzrasta świadomość dotycząca podejmowania decyzji marketingowych w oparciu o konwersje. Mamy dostęp do coraz większej ilości danych, w analizie których pomagają nam takie narzędzia jak chociażby Google Analytics.
O autorze
3 min czytania 2019-11-21

Pomimo dostępnych tam informacji dotyczących ścieżek wielokanałowych czy też dostępnych modeli atrybucji nadal większość decyzji marketingowych dotyczących efektywności poszczególnych działań są podejmowane na podstawie ostatniej interakcji.

Zgodnie z teorią customer journey – użytkownik zazwyczaj wykonuje więcej niż jedną interakcję ze stroną, aby podjąć decyzję zakupową.

Jeżeli chcemy podejmować bardziej efektywne decyzje alokacji budżetów marketingowych – warto pochylić się nad tematem atrybucji konwersji.

LinkedIn logo
Na LinkedInie obserwuje nas ponad 100 tys. osób. Jesteś tam z nami?
Obserwuj

Czym jest atrybucja?

Z definicji model atrybucji jest regułą albo zbiorem reguł, które określają sposób przypisywania sprzedaży i konwersji do punktów styczności na ścieżkach konwersji. Innymi słowy – atrybucja wskazuje nam, jakie jest procentowe prawdopodobieństwo udziału źródła ruchu w każdorazowym wystąpieniu konwersji.

Przypisywanie istotnych wag do źródeł ruchu jest o tyle ważne, że marketer może podejmować bardziej racjonalne decyzje związane z alokacją budżetu marketingowego. Tak jak wcześniej zostało to opisane – znaczna większość konwersji wymaga więcej niż jednej interakcji ze stroną. Nierzadko są to także interakcje przy wykorzystaniu zdywersyfikowanych źródeł ruchu.

Słuchaj podcastu NowyMarketing

Jakie są dostępne modele?

Google Analytics, jedno z najpopularniejszych jak dotąd narzędzi do modelowania atrybucji, wskazuje nam siedem predefiniowanych modeli atrybucji:

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się
  1. Ostatnia interakcja – oznacza przypisanie 100% konwersji do ostatniej interakcji z www.
  2. Ostatnie kliknięcie niebezpośrednie – jeżeli ostatnią interakcją na ścieżce konwersji będzie Direct, zostanie ono pominięte, a wartość zostanie przypisana do poprzedniego kroku.
  3. Ostatnie kliknięcie Google Ads – podobnie jak ostatnie kliknięcie niebezpośrednie, jednak gros konwersji zostanie przypisane do Google Ads.
  4. Pierwsza interakcja – oznacza przypisanie 100% konwersji do pierwszej interakcji ze stroną bez znaczenia, jakie było źródło wejścia.
  5. Model liniowy – oznacza równomierne przypisanie równej wagi każdej interakcji na ścieżce. Jeżeli np. było 5 kroków – każdy z nich otrzymuje 20% wartości.
  6. Model rozkładu czasowego – oznacza dopisanie coraz wyższej wartości procentowej dla źródła, które znajduje się bliżej dokonania konwersji.
  7. Uwzględnienie pozycji – pierwsza i ostatnia interakcja otrzymują po równo 40%, a pozostałe 20% jest równomiernie rozłożone na pozostałe źródła ruchu.

Oczywiście w zależności od dobranego celu kampanii warto stosować różne modele atrybucji oraz je porównywać w czasie, aby wyciągać racjonalne wnioski.

Obok predefiniowanych modeli – istnieje jeszcze ósmy, który dostępny jest tylko w płatnej wersji Analytics 360 – model o nazwie Data Driven Attribution, który w teorii powinien dostarczyć dane najbardziej zbliżone do rzeczywistości.

A co na to rachunek prawdopodobieństwa?

W algorytmicznym modelowaniu atrybucji wykorzystywane są dwie główne metody: wartość Shapleya – wykorzystywana w modelach DDA od Google oraz łańcuchy Markowa, które możemy wykorzystać przy danych o mniejszej istotności statystycznej.

Proces Markowa z definicji to ciąg zdarzeń, w którym prawdopodobieństwo każdego zdarzenia zależy jedynie od wyniku poprzedniego zdarzenia. Ze względu na to, iż atrybucja konwersji to w dużej mierze przypisywanie wartości prawdopodobieństwa do poszczególnych źródeł ruchu, a łańcuch Markowa można odwzorować na ścieżce konwersji – możemy ten proces wykorzystać do obliczania wartości atrybucji.

Dla uproszczenia modelu załóżmy, że analizowana kampania reklamowa składa się z 4 źródeł ruchu: paid search, remarketing, paid social, display RTB, a ich ścieżki konwersji wyglądają w sposób następujący:

Powyższe ścieżki możemy rozrysować na grafie, otrzymując proces Markowa:

Obliczając dalej prawdopodobieństwo wystąpienia oraz niewystąpienia źródła na ścieżce do konwersji, otrzymamy procentową wartość przypisania atrybucji.

Warto stosować różne metody do analizy atrybucji, jednak należy pamiętać że zdecydowana większość algorytmów, takich jak wskazany proces Markowa, opiera się na analizie korelacji pomiędzy interakcją ze stroną internetową (wejściem z określonego źródła) a dokonaniem konwersji. Wskazana korelacja nie jest jednak pewnym założeniem, że za każdym razem związek pomiędzy interakcją a konwersją będzie występował – więc należy traktować wszystkie dane przez pryzmat doświadczeń i wiedzy marketera.

Czy mierzyć atrybucję?

Jedną z głównych zalet modelowania atrybucji według łańcuchów Markowa jest uwzględnienie sekwencyjności poszczególnych zdarzeń na ścieżce do konwersji, przez co można lepiej odwzorować cykl użytkownika. Z drugiej strony, ta sekwencyjność ma również swoje ograniczenia. Mianowicie zgodnie z teorią, prawdopodobieństwo w łańcuchach Markowa zależy tylko i wyłącznie od zdarzenia poprzedzającego. Aby uwzględnić dłuższą ścieżkę konwersji, należy wprowadzić do analizy łańcuch wyższego rzędu, analizując poszczególne pary interakcji.

Podsumowując, warto analizować różne modele atrybucji, aby podejmować bardziej świadome decyzje dotyczące m.in. alokacji budżetów marketingowych. Oczywiście istnieje wiele narzędzi zwracających nam dane dotyczące efektywności poszczególnych źródeł, natomiast są one obarczone błędem statystycznym, brakiem kompletu informacji czy też zwykłym rachunkiem prawdopodobieństwa. Jeżeli chcemy oszacować rzeczywistą wartość atrybucji oraz zbadać inkrementalny wzrost liczby konwersji – warto prowadzić badania jakościowe czy też korzystać z narzędzi Conversion Lift.