کار با نویز

نحوه کار با نویز، محاسبه و کاهش تأثیر نویز را در گزارش های انبوه خود بیاموزید.

قبل از اینکه شروع کنی

قبل از ادامه، برای درک عمیق از چیستی نویز و تأثیر آن، به درک نویز در گزارش‌های خلاصه مراجعه کنید.

کنترل های شما روی نویز

در حالی که نمی توانید مستقیماً نویز اضافه شده به گزارش های جمع آوری شده خود را کنترل کنید، مراحلی وجود دارد که می توانید برای به حداقل رساندن تأثیرات انجام دهید. بخش های بعدی این استراتژی ها را توضیح می دهند.

مقیاس بودجه مشارکت

همانطور که در درک نویز توضیح داده شد، نویز اعمال شده به مقدار خلاصه برای هر کلید بر اساس مقیاس 0-65536 (0- CONTRIBUTION_BUDGET ) است.

توزیع نویز بر اساس بودجه است.

به این دلیل، برای به حداکثر رساندن سیگنال نسبت به نویز، باید هر مقدار را قبل از تنظیم آن به عنوان یک مقدار جمع‌آوری کنید، مقیاس آن را افزایش دهید - یعنی هر مقدار را در یک عامل مشخص، ضریب مقیاس‌گذاری ضرب کنید، در حالی که اطمینان حاصل کنید که در بودجه مشارکت باقی می‌ماند.

نویز نسبی با و بدون پوسته پوسته شدن.

محاسبه ضریب مقیاس

ضریب مقیاس‌بندی نشان می‌دهد که چقدر می‌خواهید یک مقدار جمع‌آوری شده را مقیاس کنید. مقدار آن باید بودجه مشارکت تقسیم بر حداکثر مقدار قابل جمع برای یک کلید خاص باشد.

تعیین ضریب مقیاس بر اساس بودجه مشارکت.

برای مثال، فرض کنیم تبلیغ‌کنندگان می‌خواهند ارزش کل خرید را بدانند. می‌دانید که حداکثر ارزش خرید مورد انتظار برای هر خرید انفرادی، 2000 دلار است، به جز چند مورد پرت که تصمیم می‌گیرید نادیده بگیرید:

  • ضریب مقیاس را محاسبه کنید :
    • برای به حداکثر رساندن نسبت سیگنال به نویز، باید این مقدار را تا 65536 (بودجه مشارکت) مقیاس کنید.
    • این منجر به 65536 / 2000 یک ضریب پوسته پوسته شدن تقریباً 32 x می شود. در عمل، ممکن است این فاکتور را به سمت بالا یا پایین گرد کنید.
  • ارزش های خود را قبل از تجمیع مقیاس دهید . برای هر 1 دلار خرید، متریک ردیابی شده را 32 افزایش دهید. به عنوان مثال، برای خرید 120 دلاری ، ارزش تجمیعی 120*32 = 3840 را تعیین کنید.
  • پس از تجمیع مقادیر خود را کاهش دهید . هنگامی که گزارش خلاصه ای را دریافت کردید که حاوی ارزش خریدی است که بین چندین کاربر خلاصه شده است، ارزش خلاصه را با استفاده از ضریب مقیاسی که قبل از تجمیع استفاده می کردید، کاهش دهید. در مثال ما، از ضریب مقیاس 32 استفاده کرده ایم، بنابراین باید مقدار خلاصه دریافتی در گزارش خلاصه را بر 32 تقسیم کنیم. بنابراین، اگر ارزش خرید خلاصه برای یک کلید مشخص در گزارش خلاصه 76800 باشد. ، ارزش خرید خلاصه (با نویز) 76800/32 = 2400 دلار است.

بودجه خود را تقسیم کنید

اگر چندین هدف اندازه گیری دارید - به عنوان مثال، تعداد خرید و ارزش خرید - ممکن است بخواهید بودجه خود را بین این اهداف تقسیم کنید.

در این حالت، فاکتورهای مقیاس بندی شما برای مقادیر قابل تجمیع مختلف، بسته به حداکثر مورد انتظار یک مقدار قابل جمع معین، متفاوت خواهد بود.

جزئیات را در درک کلیدهای تجمع بخوانید.

برای مثال، فرض کنید هم تعداد خرید و هم ارزش خرید را دنبال می‌کنید و تصمیم می‌گیرید بودجه خود را به طور مساوی تخصیص دهید.

65,536 / 2 = 32,768 را می توان به هر نوع اندازه گیری و هر منبع اختصاص داد.

  • تعداد خرید:
    • شما فقط یک خرید را پیگیری می کنید، بنابراین حداکثر تعداد خرید برای یک تبدیل معین 1 است.
    • بنابراین، شما تصمیم می گیرید که ضریب مقیاس خود را برای تعداد خرید 32,768 / 1 = 32,768 تنظیم کنید.
  • ارزش خرید:
    • فرض کنید حداکثر ارزش خرید مورد انتظار هر خرید فردی 2000 دلار است.
    • بنابراین، شما تصمیم می گیرید که ضریب مقیاس خود را برای ارزش خرید 32768 / 2000 = 16.384 یا تقریباً 16 تنظیم کنید.

کلیدهای تجمع درشت تر نسبت سیگنال به نویز را بهبود می بخشند

از آنجایی که کلیدهای درشت رویدادهای تبدیل بیشتری را نسبت به کلیدهای دانه ای دریافت می کنند، کلیدهای درشت معمولاً به مقادیر خلاصه بالاتری منجر می شوند.

مقادیر خلاصه بالاتر کمتر از مقادیر کمتر تحت تأثیر نویز قرار می گیرند. نویز در این مقادیر به احتمال زیاد کمتر از این مقدار است.

مقادیر جمع‌آوری‌شده با کلیدهای درشت‌تر احتمالاً نسبتاً نویز کمتری نسبت به مقادیر جمع‌آوری‌شده با کلیدهای دانه‌دارتر دارند.

مثال

همه موارد دیگر برابر هستند، کلیدی که ارزش خرید را در سطح جهانی ردیابی می کند (در همه کشورها خلاصه می شود) نسبت به کلیدی که تبدیل ها را در سطح یک کشور ردیابی می کند، منجر به ارزش خرید خلاصه (و تعداد تبدیل خلاصه بالاتر) می شود.

بنابراین، نویز نسبی در کل ارزش خرید برای یک کشور خاص بیشتر از نویز نسبی بر روی کل ارزش خرید برای همه کشورها خواهد بود.

به طور مشابه، اگر همه چیز برابر باشد، کل ارزش خرید کفش کمتر از کل ارزش خرید برای همه اقلام (از جمله کفش) است.

بنابراین، سر و صدای نسبی روی کل ارزش خرید کفش بیشتر از نویز نسبی روی کل ارزش خرید برای همه اقلام خواهد بود.

تاثیر نویز با کلیدهای دانه دار در مقابل درشت.

خلاصه کردن مقادیر خلاصه (تجمیع جمع‌آوری‌ها) نویز آنها را نیز خلاصه می‌کند

با جمع کردن مقادیر خلاصه خود از گزارش های خلاصه برای دسترسی به داده های سطح بالاتر، نویز حاصل از این مقادیر خلاصه را نیز جمع می کنید.

درجه نویز با کلیدهای دانه ای با چرخش در مقابل کلیدهای درشت بدون جمع شدن

بیایید به دو رویکرد مختلف نگاه کنیم: - رویکرد A : شما یک شناسه جغرافیایی را در کلیدهای خود قرار می دهید. گزارش‌های خلاصه، کلیدهای سطح شناسه جغرافیایی را نشان می‌دهند که هر کدام با ارزش خرید خلاصه در سطح شناسه جغرافیایی خاص مرتبط هستند. - رویکرد B : شما شناسه جغرافیایی را در کلیدهای خود لحاظ نمی کنید. گزارش های خلاصه به طور مستقیم ارزش خرید خلاصه را برای همه شناسه ها / مکان های جغرافیایی نشان می دهد.

برای دسترسی به ارزش خرید در سطح کشور: - با رویکرد A، مقادیر خلاصه سطح شناسه جغرافیایی را جمع می‌کنید و در نتیجه نویز آنها را نیز جمع می‌کنید. این احتمالاً باعث ایجاد نویز بیشتری به ارزش خرید نهایی در سطح شناسه جغرافیایی می شود. - با رویکرد B، شما مستقیماً به داده های در معرض دید در گزارش های خلاصه نگاه می کنید. نویز فقط یک بار به آن داده اضافه شده است.

بنابراین، ارزش خرید خلاصه برای یک شناسه جغرافیایی معین احتمالاً با رویکرد A نویز بیشتری خواهد داشت.

به طور مشابه، گنجاندن یک بعد در سطح کد پستی در کلیدهای شما احتمالاً منجر به نتایج نویز بیشتری نسبت به استفاده از کلیدهای درشت تر با ابعاد سطح منطقه می شود.

تجمع در دوره های زمانی طولانی تر نسبت سیگنال به نویز را افزایش می دهد

درخواست گزارش‌های خلاصه کمتر به این معنی است که هر مقدار خلاصه احتمالاً بیشتر از زمانی است که شما بیشتر گزارش‌ها را درخواست می‌کردید. احتمالاً در بازه های زمانی طولانی تری تبدیل های بیشتری اتفاق می افتد.

همانطور که قبلا ذکر شد، هرچه مقدار خلاصه بالاتر باشد، نویز نسبی کمتر خواهد بود. بنابراین، درخواست گزارش های خلاصه به دفعات کمتر منجر به نسبت سیگنال به نویز بالاتر (بهتر) می شود.

درخواست گزارش های خلاصه به دفعات کمتر منجر به نسبت سیگنال به نویز بالاتر می شود

در اینجا یک مثال برای توضیح وجود دارد:

  • اگر گزارش‌های خلاصه ساعتی را برای 24 ساعت درخواست می‌کنید و سپس مقدار خلاصه هر گزارش ساعتی را برای دسترسی به داده‌های سطح روز جمع‌بندی می‌کنید، نویز 24 بار اضافه می‌شود.
  • در یک گزارش خلاصه روزانه، نویز فقط یک بار اضافه می شود.

اپسیلون بالاتر، نویز کمتر

هر چه مقدار اپسیلون بیشتر باشد، نویز کمتر و حفاظت از حریم خصوصی کمتر است.

استفاده از فیلترینگ و کپی برداری

بخش مهمی از تخصیص بودجه بین کلیدهای مختلف این است که بفهمیم یک رویداد معین چند بار می تواند رخ دهد. برای مثال، یک تبلیغ‌کننده ممکن است فقط به یک خرید برای هر کلیک اهمیت دهد، اما ممکن است به حداکثر ۳ تبدیل «نمایش صفحه محصول» علاقه‌مند باشد. برای پشتیبانی از این موارد استفاده، ممکن است بخواهید از ویژگی‌های API زیر نیز استفاده کنید که به شما امکان می‌دهد تعداد گزارش‌های تولید شده و تبدیل‌های شمارش شده را کنترل کنید:

آزمایش با اپسیلون

فناوری‌های تبلیغاتی می‌توانند اپسیلون را روی مقداری بیشتر از 0 و تا 64 تنظیم کنند. این محدوده امکان تست انعطاف‌پذیر را فراهم می‌کند. مقادیر پایین تر اپسیلون حفاظت از حریم خصوصی بیشتری را فراهم می کند. توصیه می کنیم با epsilon=10 شروع کنید.

توصیه هایی برای آزمایش

ما موارد زیر را توصیه می کنیم: - با اپسیلون = 10 شروع کنید. - در صورتی که این امر باعث مشکلات قابل توجه کاربردی می شود، اپسیلون را به تدریج افزایش دهید. - بازخورد خود را در مورد نقاط عطف خاصی که ممکن است در رابطه با قابلیت استفاده از داده ها پیدا کنید، به اشتراک بگذارید.

مشارکت کنید و بازخورد را به اشتراک بگذارید

شما می توانید با این API شرکت کرده و آزمایش کنید .

مراحل بعدی