التعامل مع التشويش

تعرّف على كيفية التعامل مع التشويش في التقارير المجمَّعة وأخذه في الاعتبار والحد من تأثيره.

قبل البدء

قبل المتابعة، للحصول على فهم مفصّل لماهية التشويش وتأثيره، راجِع مقالة فهم وظائف إخفاء هوية المستخدمين في التقارير التلخيصية.

عناصر التحكّم في الضوضاء

على الرغم من أنّه لا يمكنك التحكّم مباشرةً في تشويش البيانات التي تتم إضافتها إلى التقارير المجمّعة، هناك خطوات يمكنك اتّخاذها لتقليل التأثيرات. وتوضّح الأقسام التالية هذه الاستراتيجيات.

زيادة الميزانية بما يصل إلى ميزانية المساهمة

كما هو موضّح في مقالة "التعرّف على التشويش"، فإنّ التشويش المطبَّق على قيمة الملخّص لكل مفتاح يعتمد على المقياس من 0 إلى 65,536 (من 0 إلى CONTRIBUTION_BUDGET).

يعتمد توزيع الضوضاء على الميزانية.

ولهذا السبب، لزيادة الإشارة إلى أقصى حد مقارنةً بالتشويش، يجب زيادة كل قيمة قبل إعدادها كقيمة قابلة للتجميع، أي ضرب كل قيمة في عامل التقدير بعامل معيّن، مع ضمان بقائها ضمن حدود ميزانية المساهمة.

التشويش النسبي مع زيادة الحجم وبدونه.

حساب عامل قياس

يمثّل عامل القياس المقدار الذي تريده لقياس قيمة تجميعية معيّنة. ويجب أن تكون قيمتها ميزانية المساهمة مقسومة على الحدّ الأقصى للقيمة القابلة للتجميع لمفتاح معيّن.

تحديد عامل القياس استنادًا إلى ميزانية المساهمة.

على سبيل المثال، لنفترض أنّ المعلنين يريدون معرفة إجمالي قيمة الشراء. أنت تعلم أنّ الحدّ الأقصى لقيمة الشراء المتوقّعة لأي عملية شراء فردية هو 2,000 دولار أمريكي، باستثناء بعض القيم الشاذّة التي قرّرت تجاهلها:

  • احتساب عامل القياس:
    • لزيادة نسبة الإشارة إلى التشويش إلى أقصى حد، عليك تغيير هذه القيمة إلى 65,536 (ميزانية المساهمة).
    • وينتج عن ذلك عامل قياس يبلغ 65,536 / 2,000 بمقدار 32x تقريبًا. من الناحية العملية، يمكنك تقريب هذا العامل إلى أعلى أو أسفل.
  • توسيع نطاق القيم قبل تجميعها: مقابل كل $1 من عمليات الشراء، يجب زيادة المقياس الذي يتم تتبُّعه بمقدار 32. على سبيل المثال، لإجراء عملية شراء بقيمة 120 دولار أمريكي (أو ما يعادله بالعملة المحلية)، اضبط قيمة قابلة للتجميع تبلغ 120*32 = 3,840.
  • تصغير القيم بعد تجميع البيانات بعد تلقّي تقرير الملخّص الذي يحتوي على قيمة الشراء التي تم جمعها على مستوى عدة مستخدمين، يمكنك تقليل قيمة الملخّص باستخدام عامل القياس الذي استخدمته قبل التجميع. في المثال الذي ذكرناه، استخدمنا عامل قياس وهو 32 للتجميع المسبق، لذا نحتاج إلى قسمة قيمة الملخّص التي تم استلامها في تقرير الملخّص على 32. وبالتالي، إذا كانت قيمة الشراء الموجز لمفتاح معيّن في التقرير الملخّص هي 76,800، تكون قيمة الشراء في الملخّص (مع وجود تشويش) هي 76,800/32 = 2,400 دولار أمريكي.

تقسيم ميزانيتك

إذا كانت لديك عدة أهداف للقياس، مثل عدد عمليات الشراء وقيمة الشراء، قد تحتاج إلى تقسيم ميزانيتك على هذه الأهداف.

في هذه الحالة، ستختلف عوامل القياس لديك بالنسبة إلى القيم المجمّعة المختلفة، بناءً على الحد الأقصى المتوقّع لقيمة تجميع معيّنة.

تعرَّف على التفاصيل في التعرُّف على مفاتيح تجميع البيانات.

على سبيل المثال، لنفترض أنّك تتتبّع عدد عمليات الشراء وقيمة عملية الشراء، وأنّك قرّرت تخصيص ميزانيتك بالتساوي.

يمكن تخصيص 65,536 / 2 = 32,768 لكل نوع قياس ولكل مصدر.

  • عدد عمليات الشراء:
    • يتم تتبع عملية شراء واحدة فقط، لذا فإن الحد الأقصى لعدد عمليات الشراء لإحالة ناجحة معينة هو 1.
    • لذلك، قرَّرت ضبط عامل القياس لعدد عمليات الشراء على 32,768 / 1 = 32,768.
  • قيمة الشراء:
    • لنفترض أنّ أقصى قيمة شراء متوقعة لأي عملية شراء فردية هي 2,000 دولار أمريكي.
    • لذلك، قرَّرت ضبط عامل القياس لقيمة الشراء على 32,768 / 2,000 = 16.384 أو 16 تقريبًا.

استخدام مفاتيح تجميع أقل دقّة لتحسين نسبة الإشارة إلى الضوضاء

بما أنّ المفاتيح التقريبية تلتقط أحداث إحالات ناجحة أكثر من المفاتيح الدقيقة، تؤدي المفاتيح التقريبية بشكل عام إلى قيم ملخّص أعلى.

القيم الملخّصة الأعلى هي أقل تأثرًا بالتشويش مقارنةً بالقيم المنخفضة، ومن المرجح أن يكون التشويش على هذه القيم أقل بالنسبة إلى هذه القيمة.

من المرجّح أن تكون القيم التي يتم جمعها باستخدام مفاتيح أكثر دقّة أقل تشويشًا نسبيًا من القيم التي يتم جمعها باستخدام مفاتيح أكثر دقة.

مثال

إذا كانت كل العناصر الأخرى متساوية، فإنّ المفتاح الذي يتتبّع قيمة الشراء على مستوى العالم (يتم جمعه في جميع البلدان) سيؤدي إلى قيمة عملية شراء مجمَّعة أعلى (وملخّص أعلى لعدد الإحالات الناجحة) مقارنةً بمفتاح يتتبّع الإحالات الناجحة على مستوى البلد.

وبالتالي، سيكون التشويش النسبي في إجمالي قيمة الشراء في بلد معيّن أعلى من التشويش النسبي في إجمالي قيمة الشراء في جميع البلدان.

وبالمثل، يبقى إجمالي قيمة الشراء للأحذية أقل من إجمالي قيمة الشراء لجميع السلع (بما في ذلك الأحذية).

وبالتالي، سيكون التشويش النسبي في إجمالي قيمة شراء الأحذية أعلى من التشويش النسبي في إجمالي قيمة الشراء لجميع السلع.

تأثير الضوضاء من خلال المفاتيح الدقيقة مقابل المفاتيح البسيطة.

إن تلخيص القيم الموجزة (القوائم المجمّعة) يؤدي أيضًا إلى احتساب تشويشها.

من خلال جمع قيم الملخص من التقارير الموجزة للوصول إلى بيانات ذات مستوى أعلى، يمكنك أيضًا جمع التداخل مع قيم الملخص هذه.

درجة عدم استخدام المفاتيح الدقيقة مع البيانات المجمّعة مقارنةً بالمفاتيح غير المكرَّرة التي لا تحتوي على بيانات مجمّعة

لنلقِ نظرة على طريقتين مختلفتين: - الأسلوب أ: تضمين معرّف الموقع الجغرافي في مفاتيحك. تعرض التقارير التلخيصية مفاتيح على مستوى المعرّف الجغرافي، وترتبط كل منها بقيمة عملية الشراء الملخّص على مستوى رقم تعريف موقع جغرافي معيّن. - الطريقة ب: لم يتم تضمين معرّف الموقع الجغرافي في مفاتيحك. تعرض التقارير التلخيصية قيمة الشراء الملخّص مباشرةً لكل أرقام تعريف المواقع الجغرافية أو المواقع الجغرافية.

للوصول إلى قيمة الشراء على مستوى البلد: - باستخدام النهج (أ)، يمكنك جمع قيم الملخّص على مستوى المعرّف الجغرافي، وبالتالي جمع تشويشها أيضًا. ومن المحتمل أن يؤدي ذلك إلى زيادة التشويش في قيمة الشراء النهائية على مستوى المعرّف الجغرافي. - باستخدام النهج "ب"، تنظر مباشرة إلى البيانات المعروضة في التقارير الموجزة. تمت إضافة التشويش مرة واحدة فقط إلى تلك البيانات.

وبالتالي، من المرجح أن تكون قيمة الشراء الموجزة لرقم تعريف جغرافي معيّن أكثر تشويشًا مع الطريقة "أ".

وبالمثل، من المحتمل أن يؤدي تضمين سمة على مستوى الرمز البريدي في مفاتيحك إلى نتائج أكثر تشويشًا من استخدام مفاتيح أقل سرعة مع سمة على مستوى المنطقة.

يؤدي تجميع البيانات على مدار فترات زمنية أطول إلى زيادة نسبة الإشارة إلى الضوضاء.

يعني طلب التقارير الموجزة بوتيرة أقل أن كل قيمة للملخص من المحتمل أن تكون أعلى مما لو طلبت التقارير أكثر من مرة، ومن المرجح أن تحدث المزيد من الإحالات الناجحة في فترات زمنية أطول.

كما ذكرنا سابقًا، كلما ارتفعت قيمة الملخّص، قلّ التشويش النسبي. لذلك، يؤدي طلب تقارير تلخيصية أقل في كثير من الأحيان إلى زيادة (أفضل) إشارة إلى نسبة التشويش.

يؤدي طلب تقارير تلخيصية أقل تكرارًا إلى زيادة نسبة الإشارة إلى التشويش.

فيما يلي مثال للتوضيح:

  • إذا كنت تطلب تقارير ملخّصات كل ساعة على مدار 24 ساعة، ثم جمعت قيمة الملخّص من كل تقرير كل ساعة للوصول إلى البيانات على مستوى اليوم، تتم إضافة تشويش 24 مرة.
  • وفي تقرير ملخّص يومي واحد، تتم إضافة التشويش مرة واحدة فقط.

إبسيلون أعلى، وضوضاء أقل

كلما ارتفعت قيمة إبسيلون، قلّت التشويش وانخفضت حماية الخصوصية.

الاستفادة من التصفية وإزالة التكرار

جزء مهم من تخصيص الميزانية بين مفاتيح مختلفة هو فهم عدد المرات التي يمكن أن يقع فيها حدث معين. على سبيل المثال، قد يهتم المعلِن بعملية شراء واحدة فقط لكل نقرة، ولكنّه قد يهتم بما يصل إلى 3 إحالات ناجحة لـ "مشاهدة صفحة المنتج". لإتاحة حالات الاستخدام هذه، يمكنك أيضًا الاستفادة من ميزات واجهة برمجة التطبيقات التالية التي تمكّنك من التحكّم في عدد التقارير التي يتم إنشاؤها وتحديد الإحالات الناجحة التي يتم احتسابها:

اختبار الإبسيلون

يمكن لتكنولوجيا الإعلان ضبط قيمة إبسيلون على قيمة أكبر من 0 وتصل إلى 64 كحدّ أقصى. يتيح هذا النطاق إمكانية الاختبار المرن. توفر القيم المنخفضة في إبسيلون حماية أكبر للخصوصية. ومن المستحسن أن تبدأ بـ epsilon=10.

اقتراحات للتجربة

نوصي بما يلي: - البدء بـ epsilon = 10. - إذا تسبب هذا في حدوث مشكلات ملحوظة في النظافة، فقم بزيادة إبسيلون بشكل تدريجي. - شارك ملاحظاتك حول نقاط انعطاف محددة قد تجدها فيما يتعلق بقابلية استخدام البيانات.

التفاعل مع الملاحظات ومشاركتها

يمكنك المشاركة والتجريب باستخدام واجهة برمجة التطبيقات هذه.

الخطوات التالية