تعرَّف على معنى الضوضاء ومكان إضافتها وتأثيرها في جهود القياس.
التقارير الموجزة هي نتيجة تجميع التقارير القابلة للتجميع. عندما يجمع أحد أدوات جمع البيانات التقارير القابلة للتجميع معًا وتعالجها خدمة التجميع، تتم إضافة قدر عشوائي من البيانات إلى التقارير التلخيصية الناتجة، ما يُعرف بالضوضاء. تتم إضافة الضوضاء لحماية خصوصية المستخدم. والهدف من هذه الآلية هو توفير إطار عمل يمكنه إتاحة القياس بخصوصية مختلفة.

مقدمة عن الضوضاء في التقارير الموجزة
على الرغم من أنّ إضافة الضوضاء لا تشكّل عادةً جزءًا من قياس الإعلانات اليوم، إلا أنّ الضوضاء المُضافة لن تغيّر بشكلٍ كبير طريقة تفسير النتائج في كثير من الحالات.
قد يكون من المفيد التفكير في الأمر على النحو التالي: هل ستكون واثقًا من اتخاذ قرار استنادًا إلى جزء معيّن من البيانات إذا لم تكن هذه البيانات صاخبة؟
على سبيل المثال، هل سيكون المعلِن واثِقًا من تغيير استراتيجية حملته أو ميزانياتها استنادًا إلى حقيقة أنّ "الحملة أ" سجّلت 15 إحالة ناجحة و"الحملة ب" سجّلت 16 إحالة ناجحة؟
إذا كانت الإجابة "لا"، يعني ذلك أنّ الضوضاء غير ذات صلة.
عليك ضبط استخدام واجهة برمجة التطبيقات بطريقة تحقّق ما يلي:
- الإجابة عن السؤال أعلاه هي نعم.
- تتم إدارة الضوضاء بطريقة لا تؤثّر بشكل كبير في قدرتك على اتخاذ قرار استنادًا إلى بيانات معيّنة. يمكنك معالجة ذلك على النحو التالي: بالنسبة إلى الحدّ الأدنى المتوقّع لعدد الإحالات الناجحة، عليك إبقاء الضوضاء في المقياس الذي تمّ جمعه أقلّ من نسبة مئوية معيّنة.
في هذا القسم والقسم التالي، سنوضّح استراتيجيات لتحقيق الهدف 2.
المفاهيم الأساسية
تُضيف خدمة التجميع بيانات عشوائية مرة واحدة إلى كل قيمة تلخيصية، أي مرة واحدة لكل مفتاح، في كل مرة يتم فيها طلب تقرير تلخيصي.
يتم اختيار قيم الضوضاء هذه عشوائيًا من توزيع احتمالي محدّد، كما هو موضّح أدناه.
تعتمد جميع العناصر التي تؤثّر في الضوضاء على مفهومَين أساسيَّين.
توزيع الضوضاء (التفاصيل أدناه) هو نفسه بغض النظر عن قيمة الملخّص، سواء كانت منخفضة أو مرتفعة. وبالتالي، كلما ارتفعت قيمة الملخّص، قلّ احتمال تأثير الضوضاء بالنسبة إلى هذه القيمة.
على سبيل المثال، نفترض أنّ إجمالي قيمة الشراء المجمّعة التي تبلغ 20,000 دولار أمريكي وإجمالي قيمة الشراء المجمّعة التي تبلغ 200 دولار أمريكي يخضعان للضوضاء التي تم اختيارها من التوزيع نفسه.
لنفترض أنّ الضوضاء الناتجة عن هذا التوزيع تتراوح تقريبًا بين -100 و100.
- بالنسبة إلى قيمة الشراء الإجمالية التي تبلغ 20,000 دولار أمريكي، تتراوح قيمة الضوضاء بين 0 و100/20,000=0.5%.
- بالنسبة إلى قيمة الشراء الإجمالية التي تبلغ 200 دولار أمريكي، يتراوح الضوضاء بين 0 و100/200=%50.
لذلك، من المرجّح أن يكون للضوضاء تأثير أقل على قيمة الشراء المجمّعة التي تبلغ 20,000 دولار أمريكي مقارنةً بالقيمة 200 دولار أمريكي. من الناحية النسبية، من المرجّح أن يكون سعر 20,000 دولار أمريكي أقلّ تشويشًا، أي من المرجّح أن يكون له نسبة أعلى بين الإشارة والضوضاء.
ويؤدي ذلك إلى بعض النتائج العملية المهمة التي يتم توضيحها في القسم التالي. تشكّل هذه الآلية جزءًا من تصميم واجهة برمجة التطبيقات، وتكون الآثار العملية طويلة المدى. وستستمرّ في لعب دور مهمّ عند تصميم تقنيات الإعلان لاستراتيجيات التجميع المختلفة وتقييمها.
على الرغم من أنّه يتم استخراج الضوضاء من التوزيع نفسه بغض النظر عن القيمة التلخيصية، يعتمد هذا التوزيع على عدة مَعلمات. يمكن أن تُغيّر تكنولوجيات الإعلان إحدى هذه المَعلمات، وهي epsilon، أثناء تجربة المصدر التي تمّ إجراؤها لتقييم مختلف التعديلات المتعلقة بالخصوصية أو الأداء. ومع ذلك، ننصحك بالتعامل مع إمكانية تعديل مقياس epsilon على أنّها مؤقتة. نرحب بملاحظاتك حول حالات الاستخدام وقيم مقياس epsilon التي تعمل بشكل جيد.
على الرغم من أنّ شركة تكنولوجيا الإعلان لا تتحكّم بشكل مباشر في طرق إضافة الضوضاء، يمكنها التأثير في تأثير الضوضاء على بيانات القياس. في الأقسام التالية، سنوضّح كيفية التأثير في الضوضاء من الناحية العملية.
قبل إجراء ذلك، لنلقِ نظرة عن كثب على طريقة تطبيق الضوضاء.
التكبير: كيفية تطبيق الضوضاء
توزيع واحد للضوضاء
يتم استخراج الضوضاء من توزيع لابلاس، باستخدام المَعلمات التالية:
- متوسط (
μ
) يساوي 0 وهذا يعني أنّ القيمة الأكثر احتمالًا للضوضاء هي 0 (بدون إضافة أيّ ضوضاء)، وأنّه من المرجّح أن تكون القيمة التي تتضمّن ضوضاء أصغر من القيمة الأصلية أو أكبر منها (يُطلق على ذلك أحيانًا غير متحيّز). - مَعلمة مقياس
b = CONTRIBUTION_BUDGET
/epsilon
- تم تحديد
CONTRIBUTION_BUDGET
في المتصفّح. - يتم استخدام
epsilon
في "خدمة تجميع البيانات".
- تم تحديد
يوضّح الرسم البياني التالي دالة الكثافة الاحتمالية لتوزيع لابلاس مع μ=0 وb = 20:

قيم الضوضاء العشوائية، توزيع الضوضاء واحد
لنفترض أنّ تقنية عرض الإعلانات تطلب تقارير تلخيصية لمفتاحَي تجميع، هما المفتاح1 والمفتاح2.
تختار خدمة التجميع قيمتَي تشويش x1 وx2، وفقًا لتوزيع التشويش نفسه. تتم إضافة x1 إلى القيمة التلخيصية للمفتاح1، وتتم إضافة x2 إلى القيمة التلخيصية للمفتاح2.
في المخططات البيانية، سنمثّل قيم الضوضاء على أنّها متطابقة. هذا تبسيط، وفي الواقع، ستختلف قيم التشويش، لأنّه يتم اختيارها عشوائيًا من التوزيع.
يوضّح ذلك أنّ قيم الضوضاء كلها تأتي من التوزيع نفسه، وأنّها مستقلة عن القيمة التلخيصية التي يتم تطبيقها عليها.
خصائص الضوضاء الأخرى
يتم تطبيق الضوضاء على كل قيمة تلخيصية، بما في ذلك القيم الفارغة (0).

على سبيل المثال، حتى إذا كانت القيمة الإجمالية الفعلية لمفتاح معيّن هي 0، لن تكون القيمة الإجمالية الصاخبة التي ستظهر في تقرير الملخّص لهذا المفتاح (على الأرجح) 0.
يمكن أن يكون الضوضاء رقمًا موجبًا أو سالبًا.

على سبيل المثال، إذا كان مبلغ الشراء قبل الضوضاء هو 327,000، قد يكون الضوضاء +6,000 أو -6,000 (هذه قيم عشوائية).
تقييم الضوضاء
حساب الانحراف المعياري للضوضاء
الانحراف المعياري للضوضاء هو:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
مثال
عند ضبط القيمة epsilon على 10، يكون الانحراف المعياري للضوضاء على النحو التالي:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
تقييم الحالات التي تكون فيها الاختلافات في القياس كبيرة
وبما أنّك ستعرف الانحراف المعياري للضوضاء المُضافة إلى كل قيمة تُخرجها خدمة التجميع، يمكنك تحديد الحدود الدنيا المناسبة للمقارنة لتحديد ما إذا كانت الاختلافات المرصودة قد تكون بسبب الضوضاء.
على سبيل المثال، إذا كان الضوضاء المُضافة إلى قيمة معيّنة تبلغ +10 أو -10 تقريبًا (مع مراعاة التوسّع) وكان الفرق في القيمة بين حملتَين يتجاوز 100، من المرجّح أن يكون من الآمن الاستنتاج أنّ الفرق في القيمة المقاسة بين كلّ حملة ليس ناتجًا عن الضوضاء وحدها.
التفاعل مع الملاحظات ومشاركتها
يمكنك المشاركة والتجريب باستخدام واجهة برمجة التطبيقات هذه.
- يمكنك الاطّلاع على التقارير المجمّعة وخدمة التجميع وطرح الأسئلة واقتراح الملاحظات.
- اطّلِع على أدلة إعداد تقارير الإحالة.
- يمكنك طرح أسئلة والانضمام إلى المناقشات من خلال نسخة دعم مطوّري برامج "مبادرة حماية الخصوصية".
الخطوات التالية
- لمعرفة المتغيّرات التي يمكنك التحكّم فيها لتحسين نسبة الإشارة إلى الضوضاء، يُرجى الاطّلاع على مقالة العمل مع الضوضاء.
- راجِع التجربة مع قرارات تصميم التقارير التلخيصية للحصول على مساعدة في التخطيط لاستراتيجيات إعداد تقارير التجميع.
- جرِّب Noise Lab.