التعرّف على التشويش في التقارير التلخيصية

تعرَّف على معنى التشويش ومكان إضافته وكيفية تأثيره في جهود القياس.

تنتج التقارير التلخيصية عن تجميع التقارير القابلة للتجميع. عند تجميع التقارير القابلة للتجميع بواسطة مجمّع وتعالجها خدمة التجميع، تتم إضافة التشويش - وهو كمية عشوائية من البيانات - إلى التقارير التلخيصية الناتجة. تتم إضافة التشويش لحماية خصوصية المستخدم. والهدف من هذه الآلية هو وضع إطار عمل يمكن أن يدعم القياس الخاص بشكل تفاضلي.

تتم إضافة التشويش في تقرير الملخص النهائي.

مقدّمة عن التشويش في التقارير التلخيصية

على الرغم من أنّ إضافة التشويش لا تكون عادةً جزءًا من قياس أداء الإعلانات في الوقت الحالي، فإنّ التشويش الذي تتم إضافته لن يؤدي في كثير من الحالات إلى إحداث تغيير كبير في طريقة تفسيرك لنتائجك.

قد يكون من المفيد التفكير في الأمر بالطريقة التالية: هل ستكون واثقًا من اتخاذ قرار بناءً على جزء معين من البيانات إذا لم تكن هذه البيانات مزعجة؟

على سبيل المثال، هل سيكون المعلِن واثقًا من تغيير استراتيجية حملته أو ميزانياته استنادًا إلى أنّ الحملة (أ) حصلت على 15 إحالة ناجحة والحملة (ب) تتضمّن 16 إحالة ناجحة؟

إذا كانت الإجابة لا، فإن الضوضاء ليست ذات صلة.

ما عليك فعله هو ضبط استخدام واجهة برمجة التطبيقات على النحو التالي:

  1. الإجابة عن السؤال السابق هي نعم.
  2. تتم إدارة الضوضاء بطريقة لا تؤثر بشكل كبير في قدرتك على اتخاذ قرار بناءً على بيانات معيّنة. يمكنك التعامل مع هذا الأمر على النحو التالي: بالنسبة إلى الحد الأدنى المتوقع لعدد الإحالات الناجحة، عليك إبقاء التداخل في المقياس الذي تم جمعه أقل من نسبة معيّنة.

سنوضِّح في هذا القسم وما يلي بعض الاستراتيجيات لتحقيق 2.

المفاهيم الأساسية

تضيف خدمة التجميع تشويشًا مرة واحدة إلى كل قيمة ملخص - أي مرة واحدة لكل مفتاح - في كل مرة يتم فيها طلب تقرير ملخص.

يتم استنتاج قيم التشويش هذه عشوائيًا من توزيع احتمالية محدّدة، كما هو موضَّح أدناه.

تعتمد جميع العناصر التي تؤثر على الضوضاء على مفهومين أساسيين.

  1. توزيع التشويش (يُرجى الاطّلاع على التفاصيل أدناه) هو نفسه بغض النظر عن قيمة الملخّص أو المنخفضة أو المرتفعة. وبالتالي، كلما ارتفعت قيمة الملخّص، قلّ تأثير التشويش بالنسبة إلى هذه القيمة.

    على سبيل المثال، لنفترض أنّ إجمالي قيمة الشراء المجمَّعة التي تبلغ 20,000 دولار أمريكي وإجمالي قيمة الشراء المجمّعة 200 دولار أمريكي عرضة للتشويشات المحدَّدة من التوزيع نفسه.

    ولنفترض أن التشويش الناتج عن هذا التوزيع يتفاوت تقريبًا بين -100 و+100.

    • بالنسبة إلى ملخص قيمة الشراء الذي تبلغ قيمته 20,000 دولار أمريكي (أو ما يعادله بالعملة المحلية)، تختلف التشويش بين 0 و 100/20,000=0.5%.
    • بالنسبة إلى ملخص قيمة الشراء الذي تبلغ قيمته 200 دولار أمريكي (أو ما يعادله بالعملة المحلية)، تختلف نسبة التشويش بين 0 و 100/200=50%.

    لذلك، من المرجَّح أن يكون للتشويش تأثير أقل على قيمة الشراء المجمَّعة التي تبلغ 20,000 دولار أمريكي مقارنةً بقيمة 200 دولار أمريكي. نسبيًا، من المرجح أن تكون 20,000 دولار أمريكي أقل ضوضاءً، أي أنّه من المحتمل أن تكون نسبة الإشارة إلى الضوضاء أعلى منها.

    إنّ القيم المجمّعة الأعلى يكون لها تأثير أقل تشويشًا نسبيًا.

    وله بعض الآثار العملية المهمّة والموضّحة في القسم التالي. هذه الآلية هي جزء من تصميم واجهة برمجة التطبيقات، والآثار العملية طويلة المدى. وستستمر هذه التكنولوجيات في أداء دور مهم عندما تصمّم تقنيات الإعلانات وتقيّم استراتيجيات مختلفة لتجميع البيانات.

  2. في حين أن التشويش يتم استخلاصه من نفس التوزيع بغض النظر عن قيمة الملخص، فإن هذا التوزيع يعتمد على عدة معلمات. يمكن تغيير إحدى هذه المَعلمات، وهي epsilon، باستخدام تكنولوجيا الإعلان أثناء مرحلة التجربة والتقييم المنتهية، وذلك بهدف تقييم التعديلات المختلفة المتعلّقة بالاستفادة من الخدمات أو الخصوصية. ومع ذلك، ضع في اعتبارك القدرة على تعديل إبسيلون على أنها مؤقتة. نرحّب بملاحظاتك حول حالات الاستخدام وقيم إبسيلون التي تعمل بشكل جيد.

مع أنّ شركة تكنولوجيا الإعلان لا تتحكّم بشكل مباشر في طرق إضافة التشويش، يمكنها التأثير في بيانات القياس الخاصة بها. في الأقسام التالية، سنتعمّق في كيفية تأثّر التشويش عمليًا.

قبل أن نقوم بذلك، لنلقِ نظرة فاحصة على طريقة تطبيق التشويش.

التكبير: كيفية تطبيق التشويش

توزيع ضوضاء واحد

يتم استنباط التشويش من توزيع لابلاس باستخدام المَعلمات التالية:

  • متوسط (μ) بقيمة 0. وهذا يعني أنّ قيمة التشويش المرجّح هي 0 (بدون إضافة تشويش)، ومن المرجّح أن تكون القيمة المزعجة أصغر من القيمة الأصلية بينما تكون أكبر (يُسمّى ذلك أحيانًا غير متحيزة).
  • مَعلمة مقياس للمقياس b = CONTRIBUTION_BUDGET / epsilon
    • يتم تحديد CONTRIBUTION_BUDGET في المتصفح.
    • تم إصلاح epsilon في خادم التجميع.

يوضّح الرسم البياني التالي دالة الكثافة الاحتمالية لتوزيع "لابلاس" عندما تكون قيمة ميكرو=0، ب = 20:

دالة كثافة الاحتمالية لتوزيع لابلاس عندما تكون قيمة ميكرومتر=0، ب = 20

قيم التشويش العشوائية، توزيع تشويش واحد

لنفترض أنّ إحدى تكنولوجيا الإعلان تطلب تقارير موجزة لمفتاحَي تجميع، هما المفتاح1 والمفتاح2.

تختار خدمة التجميع قيمتين للتشويش x1 وx2، وفقًا لتوزيع التشويش نفسه. تتم إضافة x1 إلى قيمة الملخّص للمفتاح1، وتتم إضافة X2 إلى قيمة الملخّص للمفتاح2.

في المخطّطات البيانية، سنمثل قيم التشويش متطابقة. وهذا أمر تبسيطي. ففي الواقع، ستختلف قيم التشويش، حيث يتم رسمها عشوائيًا من التوزيع.

يوضح هذا أن جميع قيم التشويش تأتي من نفس التوزيع، وتكون مستقلة عن قيمة الملخص التي يتم تطبيقها عليها.

خصائص أخرى للضوضاء

يتم تطبيق التشويش على كل قيمة ملخّص، بما في ذلك القيم الفارغة (0).

حتى قيم الملخص الفارغة عرضة للتشويش.

على سبيل المثال، حتى إذا كانت قيمة الملخّص الحقيقية لمفتاح معيّن هي 0، لن تكون قيمة الملخّص الصاخبة التي تراها في تقرير الملخص لهذا المفتاح (على الأرجح) 0.

يمكن أن تكون الضوضاء رقمًا موجبًا أو سالبًا.

أمثلة على الضوضاء الإيجابية والسلبية.

على سبيل المثال، بالنسبة إلى مبلغ الشراء بقيمة 327,000، قد يكون هناك تشويش +6,000 أو -6,000 (هذه أمثلة على القيم العشوائية).

تقييم التشويش

حساب الانحراف المعياري للتشويش

الانحراف المعياري للتشويش هو:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
مثال

عندما يكون إبسيلون إبسيلون = 10، يكون الانحراف المعياري للضوضاء هو:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

تقييم الحالات التي تكون فيها اختلافات القياس كبيرة

بما أنّك ستعرف الانحراف المعياري للتشويش الناتج عن كل قيمة ناتجة من خدمة التجميع، يمكنك تحديد الحدود المناسبة للمقارنة لتحديد ما إذا كانت الاختلافات المرصودة قد تكون ناتجة عن تشويش.

على سبيل المثال، إذا كان معدّل التشويش المُضاف إلى قيمة معيَّنًا تقريبًا +/- 10 (مع احتساب التحجيم) وكان الفرق في القيمة بين حملتَين أكبر من 100، من المحتمل أن نستنتج أنّ الفرق في القيمة المقاسة بين كل حملة لا يرجع إلى التشويش وحده.

التفاعل مع الملاحظات ومشاركتها

يمكنك المشاركة والتجريب باستخدام واجهة برمجة التطبيقات هذه.

الخطوات التالية