Kulisy publikacji: Yudi Zhang odkrywa bardziej zaawansowaną metodę analizy ścieżki klienta

Klienci, którzy robią zakupy w witrynie Amazon, często analizują wiele różnych produktów, zanim dokonają ostatecznego wyboru. Kiedy klient podejmuje decyzję o złożeniu zamówienia i co go do tego skłania? Yudi Zhang chce zrozumieć, jak doświadczenia klientów wpływają na ich decyzje zakupowe.
W publikacji zaprezentowanej podczas warsztatów AI4Differential Equations in Science zorganizowanych w ramach konferencji International Conference on Learning Representations 2024 Zhang i jej zespół przedstawili innowacyjne podejście do problemu identyfikacji najistotniejszych elementów ścieżki klienta. Publikacja została opracowana w czasie, gdy Zhang pełniła funkcję analityka ds. zastosowań w dziale Amazon Web Services (AWS), do którego dołączyła jesienią 2023 roku.
Zhang, która uzyskała doktorat w zakresie statystyki na Uniwersytecie Stanowym Iowa, dołączyła do Amazon Ads jako analityk ds. zastosowań w lipcu 2024 roku. Podczas tej rozmowy omawia szczegóły dotyczące publikacji i interesujące ją obszary badań.
Co skłoniło Cię do pracy w Amazon Ads?
Uważam, że badania prowadzone przez dział Amazon Ads są naprawdę interesujące. Dostarczają cennych danych, dzięki którym mogę pracować nad zaawansowanymi systemami rekomendacji i personalizacją, mającymi bezpośredni wpływ na wrażenia klientów. Tego typu systemy są wykorzystywane w wielu dużych firmach, co czyni Amazon Ads doskonałym miejscem do rozwoju zawodowego. Amazon wspiera naukowców, organizując konferencje i badania, co pozwala nam utrzymać czołową pozycję w branży reklamowej. Ostatnimi czasy obserwujemy również dynamiczny rozwój działu Amazon Ads.
Jaka jest główna dziedzina Twoich badań?
Moim podstawowym obszarem zainteresowań są systemy rekomendacji i personalizacja, a celem mojej pracy jest opracowywanie modeli i algorytmów, które umożliwiają prezentowanie klientom produktów wzbudzających ich zainteresowanie. Typowy system rekomendacji składa się z dwóch etapów. Pierwszym z nich jest pozyskiwanie, w ramach którego staramy się zebrać jak najwięcej odpowiednich produktów, które zamierzamy zaprezentować klientowi. Drugim elementem jest ranking, w ramach którego ustalamy kolejność wybranych produktów w taki sposób, aby jak najwięcej osób kliknęło reklamy najbardziej dopasowane do ich potrzeb. W mojej pracy koncentruję się na etapie pozyskiwania.
Co jest głównym celem Twojej publikacji „Neuronowe równanie różniczkowe zwyczajne (ODE) w kontekście atrybucji wielokanałowej”?
Głównym tematem publikacji jest atrybucja obejmująca wiele punktów kontaktu, czyli obszar badawczy zajmujący się analizą ścieżek klientów i wskazywaniem tych interakcji, które w największym stopniu przyczyniają się do konwersji, rozumianej jako kliknięcie lub dokonanie zakupu. W cyfrowym środowisku zakupowym klienci często korzystają z wielu punktów kontaktu przed dokonaniem zakupu: oglądają reklamy, przeglądają strony produktów, czytają opinie innych klientów. Wszystkie te różnorodne działania i interakcje to tzw. punkty kontaktu.
Zazwyczaj modele bazują na atrybucji ostatniego kontaktu, co oznacza, że największą wagę przypisują pierwszemu lub ostatniemu działaniu w procesie prowadzącym do konwersji. Niemniej jednak ścieżka klienta jest wyjątkowo skomplikowana. W większości przypadków to punkty kontaktu w środkowej części ścieżki mają większe znaczenie w kształtowaniu decyzji klientów. Celem badania było opracowanie bardziej kompleksowego modelu, który pozwoliłby lepiej zrozumieć, jak te interakcje będą ze sobą współdziałać na przestrzeni całej ścieżki klienta.
Co sprawia, że te badania są tak ekscytujące?
Według mnie najciekawszym aspektem tej publikacji jest to, że stosuje ona mechanizm uwagi na potrzeby modelowania atrybucji. Prosty model oparty na wielu atrybucjach rozpatruje każdą interakcję oddzielnie lub przypisuje każdej z nich równą wagę. Z kolei mechanizm uwagi analizuje całą sekwencję punktów kontaktu i na bieżąco ocenia znaczenie każdego z nich w kontekście ścieżki klienta. Wiele narzędzi opartych na sztucznej inteligencji jest obecnie trenowanych przy użyciu mechanizmu uwagi, który pozwala na wskazanie kluczowych punktów w dużych zbiorach danych. Sprawdza się on również bardzo dobrze w przypadku naszej pracy nad atrybucją.
Mechanizm uwagi to jedna część publikacji, natomiast druga poświęcona jest neuronowemu równaniu różniczkowemu zwyczajnemu (ODE). Inne typy modeli mogą korzystać z szeregów czasowych do modelowania ścieżki klienta, w której każdy krok jest wykonywany w stosunkowo regularnych odstępach czasu. Jednak w rzeczywistości czas między poszczególnymi etapami ścieżki klienta może się znacznie różnić. Dzisiaj klient może zainteresować się jedną rzeczą, a za 10 sekund lub 10 dni czymś zupełnie innym. ODE potrafi uchwycić te nieregularne przerwy czasowe.
Model został poddany testom, do których użyto danych dotyczących interakcji klientów z różnymi kanałami marketingowymi AWS, takich jak płatne i organiczne wyszukiwanie. Na tej podstawie staraliśmy się określić, który z tych kanałów miał większe znaczenie dla konwersji. Przyniosło to znacznie lepsze wyniki niż tradycyjne metody atrybucji.
W jaki sposób to badanie wpływa na reklamę?
Mimo że badanie skupiało się na kanałach marketingowych AWS, użyta metoda może znaleźć zastosowanie także w reklamie. Wpływ przeprowadzonego badania obejmuje trzy kluczowe obszary. Po pierwsze, zrozumienie, w jakiej kolejności i w jakim czasie zachodzą interakcje z klientami pozwala nam określić, które reklamy najlepiej ze sobą współdziałają i w jakiej kolejności powinny być wyświetlane. Zdobyta wiedza może posłużyć do opracowania strategii, które inicjują zaangażowanie poprzez reklamy budujące świadomość, a następnie kierują potencjalnych klientów do reklam generujących konwersje. Po drugie, poznanie skuteczności poszczególnych punktów kontaktu pozwala reklamodawcom na bardziej precyzyjne dostosowanie kampanii do grupy odbiorców. Na przykład dzięki analizie wcześniejszych interakcji możemy kierować reklamy do tych odbiorców, którzy okazywali szczególne zainteresowanie konkretnymi formatami reklam i treściami, zwiększając tym samym skuteczność poszczególnych punktów kontaktu na całej ścieżce klienta. Po trzecie, na podstawie zgromadzonych danych na temat wpływu różnych punktów kontaktu na zachowanie klientów możemy tworzyć modele predykcyjne, które określają prawdopodobny wpływ kampanii jeszcze przed ich rozpoczęciem.
Co lubisz w pracy w Amazon Ads?
Amazon Ads ma imponującą skalę oddziaływania i oferuje przestrzeń do wdrażania innowacyjnych rozwiązań, a nasz dział w znacznym stopniu przyczynia się do ogólnego wzrostu firmy — to wszystko czyni tę pracę niezwykle ekscytującą. Mam dostęp do licznych zestawów danych o wysokiej jakości, co stanowi ogromną wartość przy tworzeniu skutecznych modeli uczenia maszynowego. Dzięki temu mogę eksperymentować z zaawansowanymi technikami i zdobywać cenne doświadczenie.
Analitycy w dziale Amazon Ads ściśle ze sobą współpracują, a nasza sieć pozwala na swobodną wymianę pomysłów i szybsze wprowadzanie innowacji. Na przykład w ramach projektu dotyczącego systemu rekomendacji specjaliści od uczenia maszynowego mogą współpracować z ekspertami w dziedzinie przetwarzania języka naturalnego i wnioskowania przyczynowego, aby opracować bardziej kompletne i skuteczne rozwiązanie. Regularnie poddajemy nasze modele wzajemnej weryfikacji, sprawdzamy poprawność uzyskanych wyników i poszukujemy alternatywnych rozwiązań, aby zapewnić ich dokładność i efektywność. Ściśle współpracujemy również z inżynierami oprogramowania nad integracją modeli z infrastrukturą Amazon, optymalizując je pod kątem skuteczności i skalowalności w czasie rzeczywistym. Pracujemy również ramię w ramię z kierownikami ds. produktu, aby zapewnić zgodność modeli z celami biznesowymi, co przekłada się na lepsze doświadczenia użytkowników i większe zaangażowanie.
Amazon zatrudnia wiele utalentowanych osób, a współpraca z nimi to doskonała okazja do nauki.
W jaki sposób Twoja praca na obecnym stanowisku wpływa na zmianę postrzegania reklamy?
Moim celem jest poprawa czytelności naszych modeli. Chcę zadbać o ich większą przejrzystość, aby reklamodawcy nie tylko mieli dostęp do wskaźników skuteczności, ale również rozumieli, z czego wynikają przedstawiane statystyki. Jeżeli dostarczymy reklamodawcom więcej interpretacji, będziemy w stanie zaoferować klientom jeszcze bardziej wartościowe i odpowiednie doświadczenia.