리드 업 전략을 통해 BFCM 퍼포먼스를 높이는 뷰티 브랜드

작성자: 광고 실험 책임자 Chen Ma

회색 배경 위 주황색 그래픽 요소

이 연구에서는 아마존 광고 연구원이 A/B 테스트를 실시하여 대규모 이벤트(블랙프라이데이 및 사이버먼데이)를 앞두고 리드업 캠페인을 활성화하면 이벤트 기간에 고려도를 높이고 더 많은 전환을 유도하는 데 도움이 될 수 있는지 평가합니다.

아마존 광고를 통한 뷰티 브랜드 광고의 어려움

2021년 아마존에서 광고하는 독일 뷰티 브랜드BFCM(블랙프라이데이 및 사이버먼데이) 이벤트 기간에 광고 캠페인 퍼포먼스를 개선할 방법을 찾고자 했습니다. 특히 해당 브랜드들은 구체적으로 상세 페이지 조회수, 구매율, 브랜드 신규 고객 구매율을 개선할 방법을 알고 싶었습니다.

실행: 아마존 DSP 디스플레이 캠페인에서 A/B 테스트를 실시하는 뷰티 브랜드

결과를 위해 BFCM 기간에 두 가지 전략 간 A/B 테스트를 실시하여 어느 전략이 더 뛰어난 성과를 기록했는지 확인했습니다.

  1. 대조 전략: 이벤트 기간에만 아마존 DSP를 통해 제공된 디스플레이 광고
  2. 실험 전략: BFCM 이전(2주 전)과 BFCM 기간 중에 아마존 DSP를 통해 제공된 디스플레이 광고

BFCM 이전에 광고하는 것과 BFCM 기간에만 광고하는 것의 효과를 테스트하기 위해 단일 상품 ASIN(아마존 표준 식별 번호)의 상세 페이지 조회수, 구매율, 브랜드 신규 고객 구매율의 차이를 비교했습니다.

BFCM을 앞두고 리드업 캠페인을 활성화하자 고려도와 전환율이 높아짐

참고: 이러한 퍼포먼스 메트릭은 특정 시점의 단일 광고주를 기반으로 하며 결과는 상황과 계절성의 차이로 인해 다를 수 있습니다.

BFCM을 앞두고 리드업 아마존 광고 캠페인을 활성화하면 이벤트 기간에 고려도와 전환율이 높아진다는 사실을 알게 되었습니다.

실험 캠페인의 세 가지 메트릭 모두 통제 캠페인의 메트릭보다 더 높았습니다.

통제 캠페인을 능가한 실험 캠페인

상세 페이지 조회율: 25%

상세 페이지 조회율

구매율: 55%

구매율

브랜드 신규 고객 구매율: 60%

브랜드 신규 고객 구매율

무작위 대조 실험을 실행하는 것의 이점(예: A/B 테스트, 다변량 분할 테스트)

  • 학습 극대화: 적격 광고주는 연간 예산의 일부를 사용하여 실험을 원활하게 진행할 수 있습니다. 미디어 플랜에 테스트를 추가함으로써 광고주는 기존 캠페인 퍼포먼스 보고를 넘어서는 과학 인사이트를 수집할 수 있습니다.
  • 맞춤형 인사이트: 광고주는 실제 캠페인을 테스트하여 맞춤형 인사이트를 창출할 수 있습니다. 실험 인사이트는 아마존 광고 권장 사항을 추가로 검증하는 데 도움이 될 수 있습니다.
  • 엄격한 실험: 무작위 대조실험과 통계 분석을 통해 구현한 전략과 성과의 인과 관계를 도출합니다.

방법론

  1. 비즈니스 문제를 실행 가능한 가설로 변환: (1) BFCM을 앞두고 광고를 하면 상세 페이지 조회율, 구매율, 브랜드 신규 고객 구매율이 개선되나요?
  2. 성공 척도 정의: (1) BFCM을 앞두고 아마존 DSP를 통한 디스플레이 광고의 가치를 입증하는 멀티터치 처리로 인한 통계적으로 유의미한 상승. (2) 멀티터치 처리 중 하나에 의한 통계적으로 유의미한 상승. (3) 관찰된 상승이 우연이 아니라 처리로 인한 것일 가능성이 있다는 것을 시사하는 유의미한 발견. 통계적으로 유의미하지 않은 테스트 결과는 처리 효과가 존재한다고 주장할 충분한 증거가 없으며 테스트한 변이 간에 차이가 없다고 주장하는 귀무 가설을 논리적으로 받아드리는 것으로 간주해야 합니다.
  3. 실험 설계: (1) 이 실험에서 실험 전략은 2021년 11월 11일부터 2021년 11월 29일까지 지속된 2주 리드업 캠페인과 BFCM 캠페인을 포함했습니다. 대조 전략은 2021년 11월 25일부터 2021년 11월 29일까지 지속된 독립형 BFCM 캠페인을 실행했습니다. (2) 실험 전략은 관련 잠재고객에게 상품을 홍보하는 리드업 리마케팅 캠페인을 활용했습니다. (3) DSP 설정의 대부분의 요소(전략 예산, 홍보 및 추천 ASIN, 크리에이티브, 빈도, 입찰액 등)는 처리 전반에 동일하게 적용됐습니다. 실험 중 예산 최적화는 사용되지 않았습니다. 예산 변동은 실험 변수로 정의할 수 있는 이상의 차이를 야기할 수 있기 때문입니다.
  4. 실험 주요 퍼포먼스 지표(KPI) 식별: 이 실험에서 테스트한 주요 메트릭은 상세 페이지 조회율, 구매율, 브랜드 신규 고객 구매율입니다. 다른 메트릭에 미치는 효과를 측정할 수는 있지만 이 실험은 2차 KPI에 적합한 규모가 아니기 때문에 유의미한 상승을 감지할 가능성이 낮습니다.
  5. 실험 샘플 크기 추정: 일반적으로 샘플 크기가 클수록 실제 효과와 랜덤 노이즈를 더 잘 구분할 수 있습니다. 예산이 한정되어 있기 때문에 통계적으로 유의미한 결과를 탐지하는 데 드는 비용과 이점이 균형을 이루는 바람직한 표본 크기를 찾아야 합니다. 샘플 크기는 통계적 검정력 80%~90%, 신뢰 수준 95%, 유의 수준 5%, KPI 기준, 최소 탐지 가능한 효과를 기반으로 하는 검정력 분석을 실행하여 추정합니다. 이러한 샘플 크기 추정치는 통계적 유의성을 위한 권장 최소값을 나타냅니다.
  6. 실험 설정: 아마존 광고는 잠재고객을 상호 배타적인 그룹으로 분할하여 교차 오염을 방지합니다.
  7. 결과 검토: 실험은 평균적으로 4주 동안 진행됩니다. 아마존 광고 실험 팀은 실험 중간 진행 상황을 모니터링하고 어트리뷰션 기간이 종료된 후 실험 종료 분석을 제공합니다. 광고주는 실험 학습을 향후 캠페인에 통합하여 퍼포먼스를 개선할 수 있습니다.

출처: 아마존 내부 데이터 2021년