ما وراء الورقة البحثية: يكتشف أناند موراليدهار النقرات الروبوتية على الإعلانات

تعد ثقة العملاء أولوية بالنسبة لـ Amazon، لذلك لا يوجد مجال للنقرات الاحتيالية على الإعلانات في منصاتها. مع تزايد تطور الجهات الضارة في برمجة الروبوتات لتقليد تصرفات البشر عند النقر على الإعلانات، قامت Amazon Ads برفع مستوى الأمان لديها. تم وصف النموذج الناتج في هذه المقالة وفي ورقة بحثية تم تقديمها في مؤتمر 2023 حول التطبيقات المبتكرة للذكاء الاصطناعي، وهو جزء من الاجتماع السنوي لجمعية النهوض بالذكاء الاصطناعي.
يتحدث المؤلف الرئيسي والعالم الرئيسي في Amazon Ads أناند موراليدهار، الحاصل على درجة الدكتوراه في هندسة الكهرباء وهندسة الكمبيوتر من جامعة إلينوي في إربانا-شامبين، هنا عن الورقة البحثية وأبحاثه الحالية.
لماذا انضممت إلى Amazon Ads؟
في البداية، لأكون صادقًا، لم أكن على دراية بنوع العمل الذي تقوم به Amazon Ads. في عام 2016، كنت أنهي عملي في شركة ناشئة وأبحث عن دور يسمح لي بالعمل على نماذج التعلم الآلي، وظهر هذا الدور. لقد دخلت في هذا الأمر دون أدنى فكرة عن حجم العمل أو مدى تعقيده، لذا كانت مفاجأة سارة بمجرد انضمامي إلى الفريق.
ما مجالات البحث التي تركز عليها؟
لقد تطور تركيزي البحثي. فقد قضيت ربما الثلاثة أرباع الأولى من مسيرتي المهنية في Amazon في اكتشاف الزيارات الروبوتية. في العامين الماضيين أو نحو ذلك، بدأت أبحث في الإعلانات السياقية. ويُعد هذا أحد مجالات التركيز المهمة في Amazon Ads، حيث نحاول فهم محتوى صفحة الويب أو التطبيق الذي يشاهده المستخدم ثم نعرض الإعلانات المطابقة لذلك. لذلك إذا كنت في صفحة تتحدث عن وصفة لكعكة الشوكولاتة، على سبيل المثال، فأنا أريد أن أعرض لك إعلانات ذات صلة بكعكة الشوكولاتة — ربما مقلاة الخبز والزبدة ورقائق الشوكولاتة وما إلى ذلك.
ما هي الزيارات الروبوتية، ولماذا تحدث؟
كل يوم على Amazon.com، نعرض مليارات الإعلانات التي تتلقى ملايين النقرات، ونفرض رسومًا على المُعلنين في كل مرة ينقر فيها شخص ما على الإعلان. هناك بعض العناصر عديمة الضمير على الويب التي تريد استغلال ذلك، وتقوم بإنشاء روبوتات للنقر على هذه الإعلانات.
قد تكون هناك عدة أسباب وراء إنشاء روبوت للنقر على الإعلانات. لنفترض أنك تريد استنفاد الميزانية الإعلانية لبائع يبيع ساعات اليد. عندما يبحث شخص ما عن ساعات على Amazon وتظهر ساعات البائع كإعلانات، إذا نقر روبوت على كل إعلان من هذا القبيل، فستستنفد ميزانية إعلانات البائع بسرعة كبيرة دون أن يرى أي إنسان إعلانًا على الإطلاق. مثال آخر على الزيارات الروبوتية هو عندما يرفع الروبوت ترتيب الإعلان لمنتج ما من خلال النقرات حتى إذا كانت هناك إعلانات أخرى أكثر ملاءمة لطلب البحث. قد يؤدي ذلك إلى إرباك أنظمة التعلم الآلي وتعزيز الترتيب دون قصد.
أصبح الأشخاص الذين يبتكرون هذه الروبوتات متطورين للغاية، وهم يواصلون تحسين وتطوير خوارزمياتهم.
كيف تعالج ورقتك البحثية، اكتشاف الزيارات الروبوتية في الوقت الفعلي في الإعلان عبر الإنترنت، هذه المشكلة؟
تتحدث هذه الورقة البحثية تحديدًا عن نموذج التعلم الآلي لتحديد مثل هذه الزيارات الروبوتية: اكتشاف الروبوتات على مستوى الشرائح (SLIDR). يعمل SLIDR في الوقت الفعلي، ويبحث في كل نقرة يتم تسجيلها على Amazon.com بواسطة شخص يشاهد إعلانًا. وهو يحدد ما إذا كانت النقرة قد تمت بواسطة إنسان أم روبوت — وإذا كانت من روبوت، فإننا لا نفرض رسومًا على المُعلن.
تم نشر SLIDR في عام 2021، وهو يعالج عشرات الملايين من النقرات وبضع مليارات من مرات الظهور كل يوم. قد يبدو اليوم أن نشر نموذجًا للتعلم العميق لا يمثل مشكلة كبيرة لأن الجميع يفعل ذلك. ولكن عندما بدأنا هذا في عام 2020، ربما كان أول نموذج من هذا القبيل يعمل بهذا الحجم على Amazon.com، وكان تحديًا كبيرًا بالنسبة لنا.
يبحث نموذج SLIDR في شرائح الزيارات القادمة من أجهزة مختلفة، مثل سطح المكتب أو تطبيق الهاتف المحمول أو الويب على الهاتف المحمول. يجب التعامل مع كل ذلك بشكل مختلف للحصول على أفضل أقصى أداء من النظام، وقد توصلنا إلى بعض التقنيات للقيام بذلك. كما أدركنا بمرور الوقت أننا بحاجة إلى حواجز حماية لضمان عدم حدوث أي خطأ عند نشر هذه الأنظمة في الإنتاج، وأن يكون لدينا دائمًا وضع آمن من الفشل. تحتوي الورقة البحثية أيضًا على بعض التفاصيل الفنية الأخرى حول كيفية تحضيرنا للمشكلة: بنية النموذج ونوع المقاييس التي نستخدمها لتقييم الأداء وكيفية عمل النموذج على شرائح مختلفة من الزيارات وما إلى ذلك.
ما المثير في هذا البحث وتأثيره؟
ينتهي الأمر بـ SLIDR إلى توفير إيرادات المُعلنين التي كانت ستضيع لولا ذلك.
شيء آخر مهم هو النطاق: هناك عدد قليل جدًا من الأنظمة التي تتوافق مع Amazon Ads في هذا الصدد. حتى عندما يتحدث الناس عن إنشاء نماذج للبيانات الضخمة، فإنهم لا يقومون حقًا بتشغيل هذه النماذج على هذا النطاق.
هذه واحدة من الأشياء الرائعة حول العمل في Amazon Ads — فأنت تعمل مع البيانات على نطاق لا يمكن تصوره. نحن نتعامل مع مليارات السجلات في اليوم، وتصبح كمية هائلة من البيانات على مدار الشهر. لذا يجب أن تكون أنواع النماذج التي ننشئها قوية وفعالة للغاية وتتم مراقبتها عن كثب. في الوقت نفسه، نستخدم التعلم الآلي، لذا نحتاج أيضًا إلى ضمان الأداء بناءً على أي مقاييس نختارها.
كل هذا يجعل العمل في هذا المجال صعبًا ومثيرًا إلى حد ما. ينتهي بنا الأمر إلى رؤية الكثير من الغرابة في البيانات، وهو ما لن تراه إذا كنت تقوم فقط بالبحث النظري أو تعمل على إثبات المفهوم. فقط عندما تبدأ في تشغيل الأشياء بهذا الحجم، حيث يمكن حتى لحركة صغيرة في أداء نموذجك أن يكون لها تأثير كبير على إيرادات Amazon أو ميزانية العميل، يصبح التعقيد واضحًا.
كان أحد الآثار الأخرى لهذا البحث هو أنه منحنا الكثير من الثقة حول كيفية نشر نماذج التعلم العميق في إطار الإنتاج. قبل ذلك، لم تكن لدينا خبرة في القيام بذلك، ولم نكن متأكدين من كيفية تحقيق ذلك. نحن الآن مرتاحون جدًا لتشغيل نماذج التعلم العميق على نطاق واسع، وكانت هذه قفزة كبيرة إلى حد ما بالنسبة لنا.
لماذا قرر فريقك متابعة استخدام نموذج SLIDR؟
استندت بعض الحلول الأولية التي أنشأها فريقي لتحديد الزيارات الروبوتية إلى قواعد بسيطة نسبيًا أصبحت معقدة للغاية بمرور الوقت. كنا نتتبع العديد من المعلمات مثل المعدل الذي يقوم به عنوان IP أو مستخدم معين بتسجيل نقرات وعدد النقرات التي تم تسجيلها في الساعات القليلة الماضية والدقائق القليلة الماضية والثواني القليلة الماضية وما إلى ذلك.
ومع نمو Amazon Ads، ازداد أيضًا حجم الزيارات الروبوتية وتعقيد الخوارزميات التي تستخدمها الروبوتات المُرتكبة للجرائم. لقد أدركنا أن القواعد التي وضعناها لا تتناسب مع التحدي، ومعايرتها يدويًا كل عام أو ربما كل ثلاثة أشهر كانت عملية تستغرق وقتًا طويلاً إلى حد ما.
قادنا هذا إلى التساؤل عما إذا كان ينبغي علينا الانتقال من القواعد المُصاغة يدويًا إلى نموذج التعلم الآلي. كانت هذه مشكلة يجب حلها في البداية، ليس فقط بسبب الحجم ولكن أيضًا بسبب طبيعة الوقت الفعلي. لدينا فقط بضعة أجزاء من الثانية لتقييم النقرات فور حدوثها. قمنا بإنشاء بعض النماذج التي تسمى الأشجار المعززة بالتدرج، وقد عملت بنجاح كبير لبضع سنوات. ولكن بعد ذلك مررنا بموجة التعلم العميق، التي أتاحت الفرصة لنقل نماذجنا إلى المستوى التالي. تستمر هذه النماذج في التطور، ونحن نعمل على إنشاء تقنيات أكثر تعقيدًا يمكنها التمييز بين النقرات البشرية والنقرات الروبوتية بشكل أفضل.
لقد ذكرت أنك فوجئت بشكلٍ سار بحجم العمل في Amazon Ads ومدى تعقيده عند انضمامك. ما الذي لاحظته أيضًا؟
قد تعتقد أن العلماء يجلسون في ركنٍ بعيد لتطوير نماذج التعلم الآلي ثم يكتفون بكتابة المواصفات للنشر وإعطائها للمهندسين الذين يجلسون في مكان آخر. لكن الأمر ليس كذلك. هنا، نجلس جميعًا في نفس الطابق بجوار بعضنا البعض، وهذا يجعلها بيئة ممتعة للغاية حيث يمكننا تطوير الأفكار جنبًا إلى جنب مع المهندسين.
قام فريقنا ببناء أطر عمل تسمح للعلماء بنشر النماذج في نظام الإنتاج بأقل جهد. كانت دورة الخروج بمفهوم النموذج إلى نشره في الإنتاج تمتد لعدة أشهر، لكننا الآن قلصناها إلى بضعة أسابيع. يستطيع أي شخص أن يتوصل لفكرة جديدة رائعة أو نموذج جديد للتعلم الآلي، ويختبره بسرعة، ويطلقه في الإنتاج، وسيتم تشغيله مباشرةً. وهذا أمر رائع لأنه يسمح لشخص ما برؤية تأثير ما قام به خلال فترة قصيرة جدًا. لا أعتقد أن هذا النوع من الفرص متاح في مكان آخر، حيث يمكنك حقًا تحريك الأمور في شركة تقاس بمليارات الدولارات.
كيف تعيد تصوّر الإعلان في دورك؟
مع استمرار متصفحات الإنترنت في الابتعاد عن ملفات تعريف الارتباط التابعة لجهات خارجية، انتقل بحثي إلى الإعلانات السياقية. تحدد هذه الإعلانات الموضوع الرئيسي والمحتوى وأهم الكلمات الرئيسية لصفحة الويب وتعرض الإعلان الأنسب بناءً على هذه المعلومات. هذه هي مسؤوليتنا في Amazon — ضمان استمرار المُعلنين الذين يضعون ثقتهم فينا في الحصول على نفس الأداء الذي كانوا يحصلون عليه من قبل.
أنا متحمس لأننا نقود الابتكار في مساحة الإعلانات السياقية باستخدام أحدث تقنيات الذكاء الاصطناعي لتقديم أفضل تجربة لكل من المُعلن والمستخدم.