खास जानकारी वाली रिपोर्ट में ग़ैर-ज़रूरी आवाज़ों को समझना

जानें कि शोर का क्या मतलब है, इसे कहां जोड़ा जाता है, और इसका आपके मेज़रमेंट पर क्या असर पड़ता है.

खास जानकारी वाली रिपोर्ट एग्रीगेट की जा सकने वाली रिपोर्ट को एग्रीगेट करने की वजह से बनती हैं. जब इकट्ठा की जा सकने वाली रिपोर्ट को कलेक्टर और प्रोसेस करने के लिए एग्रीगेशन सेवा की मदद से प्रोसेस किया जाता है, तो नतीजों की खास जानकारी वाली रिपोर्ट में ग़ैर-ज़रूरी डेटा को जोड़ दिया जाता है. उपयोगकर्ता की निजता को सुरक्षित रखने के लिए, ग़ैर-ज़रूरी आवाज़ों को जोड़ा गया है. इस तरीके का मकसद ऐसा फ़्रेमवर्क बनाना है जो अलग-अलग निजी मेज़रमेंट के साथ काम कर सके.

खास जानकारी वाली आखिरी रिपोर्ट में शोर जोड़ दिया जाता है.

खास जानकारी वाली रिपोर्ट में नॉइज़ के बारे में जानकारी

आम तौर पर, ग़ैर-ज़रूरी आवाज़ों को जोड़ने से, विज्ञापन की परफ़ॉर्मेंस का आकलन नहीं किया जाता. हालांकि, कई मामलों में ग़ैर-ज़रूरी आवाज़ों की वजह से, नतीजों का आकलन करने के तरीके में कोई खास बदलाव नहीं होता.

इसके बारे में नीचे बताए गए तरीके से विचार करने में मदद मिल सकती है: अगर डेटा ग़ैर-ज़रूरी है, तो क्या आप डेटा के किसी खास हिस्से के आधार पर फ़ैसला ले सकेंगे?

उदाहरण के लिए, क्या कैंपेन A को 15 और कैंपेन B को 16 कन्वर्ज़न मिले और इस आधार पर, विज्ञापन देने वाला कोई व्यक्ति या कंपनी अपने कैंपेन की रणनीति या बजट में बदलाव कर सकती है?

अगर आपका जवाब नहीं है, तो ग़ैर-ज़रूरी आवाज़ों का इस्तेमाल नहीं किया जा सकता.

आप क्या करेंगे, यह इस तरह से कॉन्फ़िगर करें कि:

  1. ऊपर दिए गए सवाल का जवाब है.
  2. शोर को इस तरह मैनेज किया जाता है कि आप कुछ डेटा के आधार पर फ़ैसला ले सकें, इस पर इसका कोई असर नहीं पड़ता. इसके लिए, यह तरीका अपनाया जा सकता है: आपको उम्मीद के मुताबिक कम से कम कन्वर्ज़न संख्या के लिए, इकट्ठा की गई मेट्रिक में शोर को एक तय % से कम रखना है.

इस सेक्शन और नीचे दिए गए सेक्शन में, हम दो हासिल करने की रणनीतियों के बारे में बताएंगे.

मुख्य सिद्धांत

एग्रीगेशन सेवा, जब भी खास जानकारी की रिपोर्ट का अनुरोध किया जाता है, तब हर जवाब की वैल्यू में एक बार ग़ैर-ज़रूरी आवाज़ों का इस्तेमाल होता है. इसका मतलब है कि हर कुंजी के लिए एक बार वैल्यू जोड़ी गई है.

नॉइज़ की ये वैल्यू, प्रॉबबिलिटी के किसी खास डिस्ट्रिब्यूशन से किसी भी क्रम में ली जाती हैं. इनके बारे में नीचे बताया गया है.

शोर पर असर डालने वाले सभी एलिमेंट, दो मुख्य सिद्धांतों पर निर्भर हैं.

  1. गै़र-ज़रूरी डेटा का डिस्ट्रिब्यूशन (नीचे दी गई जानकारी) एक जैसा है. भले ही, खास जानकारी की वैल्यू कम हो या ज़्यादा. इसलिए, समरी वैल्यू जितनी ज़्यादा होगी, नॉइज़ का असर इस वैल्यू पर उतना ही कम होगा.

    उदाहरण के लिए, मान लीजिए कि 20,000 डॉलर की कुल खरीदारी की कुल कीमत और 200 डॉलर की कुल खरीदारी की कुल कीमत, दोनों उसी डिस्ट्रिब्यूशन से चुनी गई शोर के दायरे में आती हैं.

    मान लें कि इस डिस्ट्रिब्यूशन से मिलने वाला शोर, करीब -100 और +100 के बीच है.

    • 20,000 डॉलर की कुल खरीदारी पर, ग़ैर-ज़रूरी डेटा 0 से 100/20,000=0.5% के बीच होता है.
    • अगर कुल कीमत 200 डॉलर है, तो शोर 0 से 100/200=50% के बीच होता है.

    इसलिए, 200 डॉलर के मुकाबले 20,000 डॉलर की कुल खरीदारी पर शोर का कम असर पड़ सकता है. दूसरे शब्दों में कहें, तो 20,000 डॉलर का शोर कम होने की संभावना है. इसका मतलब है कि सिग्नल और शोर का अनुपात ज़्यादा हो सकता है.

    ज़्यादा एग्रीगेट की गई वैल्यू से, ग़ैर-ज़रूरी आवाज़ें कम होती हैं.

    इसके कुछ अहम व्यावहारिक प्रभाव हैं, जिनके बारे में अगले सेक्शन में बताया गया है. यह तरीका, एपीआई के डिज़ाइन का हिस्सा है और इसका इस्तेमाल लंबे समय तक ही किया जा सकता है. विज्ञापन की टेक्नोलॉजी को डिज़ाइन करने और एग्रीगेशन की अलग-अलग रणनीतियों का आकलन करने में, वे अहम भूमिका निभाते रहेंगे.

  2. जवाब की वैल्यू चाहे जो भी हो, शोर को एक जैसे डिस्ट्रिब्यूशन से लिया जाता है. हालांकि, वह डिस्ट्रिब्यूशन कई पैरामीटर पर निर्भर होता है. उपयोगिता/निजता से जुड़े कई बदलावों का आकलन करने के लिए, ऑरिजिन ट्रायल के दौरान विज्ञापन टेक्नोलॉजी से, इनमें से एक पैरामीटर epsilon में बदलाव किया जा सकता है. हालांकि, ऐपसिलॉन को कुछ समय के लिए ट्वीक करने की क्षमता को कुछ समय के लिए ही मानें. हम आपके इस्तेमाल के उदाहरणों और Epsilon के सही इस्तेमाल के बारे में, आपके सुझाव, शिकायत या राय का स्वागत करते हैं.

विज्ञापन टेक्नोलॉजी से जुड़ी सेवा देने वाली कोई कंपनी, शोर को जोड़ने के तरीकों पर सीधे तौर पर कंट्रोल नहीं रखती है. हालांकि, यह अपने मेज़रमेंट डेटा पर शोर के असर पर असर डाल सकती है. अगले सेक्शन में, हम जानेंगे कि शोर को कैसे प्रभावित किया जा सकता है.

शुरू करने से पहले, आइए ग़ैर-ज़रूरी आवाज़ों को लागू करने के तरीके पर एक नज़र डालें.

ज़ूम इन करना: शोर कैसे लागू किया जाता है

एक गै़र-ज़रूरी डेटा उपलब्ध कराना

लाप्लास डिस्ट्रिब्यूशन से शोर की जानकारी, इन पैरामीटर में दी जाती है:

  • 0 का मीन (μ). इसका मतलब है कि गै़र-ज़रूरी डेटा की सबसे ज़्यादा वैल्यू 0 है (ग़ैर-ज़रूरी आवाज़ें नहीं जोड़ी गई हैं). साथ ही, शोर की वैल्यू, ओरिजनल वैल्यू से कम हो सकती है, जितनी बड़ी हो सकती है. कभी-कभी, इसे बिना पक्षपात वाला भी कहा जाता है.
  • b = CONTRIBUTION_BUDGET / epsilon का स्केल पैरामीटर.
    • CONTRIBUTION_BUDGET को ब्राउज़र में तय किया जाता है.
    • epsilon को एग्रीगेशन सर्वर में ठीक किया गया है.

नीचे दिया गया डायग्राम, μ=0, b = 20 के साथ लाप्लास डिस्ट्रिब्यूशन के लिए प्रॉबबिलिटी डेंसिटी फ़ंक्शन दिखाता है:

μ=0, b = 20 के साथ लाप्लास डिस्ट्रिब्यूशन के लिए प्रॉबबिलिटी डेंसिटी फ़ंक्शन

किसी भी क्रम में गै़र-ज़रूरी गै़र-ज़रूरी डेटा, गै़र-ज़रूरी डेटा का एक डिस्ट्रिब्यूशन

मान लें कि कोई विज्ञापन टेक्नोलॉजी, दो एग्रीगेशन कुंजियों, key1 और key2 के लिए खास जानकारी वाली रिपोर्ट का अनुरोध करती है.

एग्रीगेशन सेवा, ग़ैर-ज़रूरी जानकारी का एक जैसा डिस्ट्रिब्यूशन के हिसाब से, गै़र-ज़रूरी डेटा के लिए दो वैल्यू x1 और x2 चुनती है. कुंजी1 की खास जानकारी वाली वैल्यू में x1 को जोड़ा जाता है और key2 की समरी वैल्यू में x2 को जोड़ा जाता है.

डायग्राम में, हम गै़र-ज़रूरी डेटा की एक जैसी वैल्यू दिखाएंगे. यह एक आसान तरीका है. असल में, नॉइज़ वैल्यू अलग-अलग होंगी, क्योंकि वे डिस्ट्रिब्यूशन से किसी भी क्रम में ली जाती हैं.

इससे पता चलता है कि गै़र-ज़रूरी डेटा एक ही डिस्ट्रिब्यूशन से आता है और वे समरी वैल्यू पर लागू नहीं होती हैं.

शोर की अन्य प्रॉपर्टी

शोर की वैल्यू, जवाब की हर वैल्यू पर लागू होती है. इसमें खाली वैल्यू भी शामिल है (0).

अगर जवाब में कोई वैल्यू न हो, तब भी ग़ैर-ज़रूरी आवाज़ें कम की जा सकती हैं.

उदाहरण के लिए, भले ही किसी कुंजी की सही जवाब वैल्यू 0 हो, लेकिन इस कुंजी के लिए खास जानकारी वाली रिपोर्ट में आपको जो खास जानकारी दिखेगी वह 0 नहीं होगी.

शोर एक पॉज़िटिव या नेगेटिव नंबर हो सकता है.

पॉज़िटिव और नेगेटिव नॉइज़ के उदाहरण.

उदाहरण के लिए, नॉइज़ के लिए की गई 3,27,000 की खरीदारी के लिए, नॉइज़ की संख्या 6,000 या -6,000 हो सकती है. ये उदाहरण के तौर पर दी गई वैल्यू के हिसाब से हो सकते हैं.

शोर का आकलन किया जा रहा है

शोर के स्टैंडर्ड डीविएशन का हिसाब लगाया जा रहा है

नॉइज़ का स्टैंडर्ड डीविएशन यह है:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
उदाहरण

Epsilon = 10 के साथ, शोर का मानक विचलन:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

मेज़रमेंट में अंतर ज़्यादा होने पर आकलन करना

आपको एग्रीगेशन सेवा की मदद से, हर वैल्यू आउटपुट में जोड़े गए नॉइज़ के स्टैंडर्ड डीविएशन के बारे में पता चल जाएगा. इसलिए, तुलना के लिए सही थ्रेशोल्ड तय किया जा सकता है. इससे यह पता लगाया जा सकेगा कि डेटा में शोर की वजह से अंतर हो सकते हैं या नहीं.

उदाहरण के लिए, अगर वैल्यू में जोड़ी गई ग़ैर-ज़रूरी वैल्यू करीब-करीब +/- 10 है (स्केलिंग के लिए) है और दो कैंपेन के बीच की वैल्यू में 100 से ज़्यादा का अंतर है, तो यह अनुमान लगाना सुरक्षित है कि हर कैंपेन के बीच मेज़र की गई वैल्यू में अंतर, सिर्फ़ शोर की वजह से नहीं है.

लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें

आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.

अगले चरण