अपनी इकट्ठा की जा सकने वाली रिपोर्ट में गै़र-ज़रूरी डेटा के साथ काम करने, उसका हिसाब लगाने, और उसके असर को कम करने का तरीका जानें.
शुरू करने से पहले
आगे बढ़ने से पहले, शोर क्या है और इसके असर को गहराई से समझने के लिए, खास जानकारी वाली रिपोर्ट में शोर को समझना देखें.
शोर पर आपके कंट्रोल
हालांकि, एग्रीगेट की जा सकने वाली रिपोर्ट में आने वाले शोर को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इस तरह के असर को कम करने के लिए, कुछ तरीके आज़माए जा सकते हैं. इन सेक्शन में, इन रणनीतियों के बारे में बताया गया है.
योगदान के बजट तक बढ़ाएं
जैसा कि 'शोर को समझना' सेक्शन में बताया गया है, हर कुंजी के लिए, समरी वैल्यू पर लागू होने वाला शोर 0-65,536 स्केल (0-CONTRIBUTION_BUDGET
) के आधार पर तय होता है.
![नॉइज़ डिस्ट्रिब्यूशन, बजट पर आधारित होता है.](https://developers.google.cn/static/privacy-sandbox/assets/images/noise-distribution-is-bas-df4f088bdd541.png?authuser=1&hl=hi)
इसलिए, शोर से जुड़े सिग्नल को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट वैल्यू के तौर पर सेट करने से पहले स्केल अप करना होगा. इसका मतलब है कि हर वैल्यू को किसी खास फ़ैक्टर, स्केलिंग फ़ैक्टर से गुणा करना चाहिए. साथ ही, यह पक्का करना होगा कि वह योगदान के लिए तय किए गए बजट में बनी रहे.
![स्केलिंग के साथ और उसके बिना रिलेटिव नॉइज़.](https://developers.google.cn/static/privacy-sandbox/assets/images/relative-noise-and-witho-2768385965923.png?authuser=1&hl=hi)
स्केलिंग फ़ैक्टर को कैलकुलेट किया जा रहा है
स्केलिंग फ़ैक्टर से यह पता चलता है कि आपको इकट्ठा की जा सकने वाली किसी वैल्यू को कितना स्केल करना है. इसका मान योगदान बजट को किसी खास कुंजी के लिए सबसे ज़्यादा एग्रीगेट किए जा सकने वाले मान से भाग देने पर मिलने वाला होना चाहिए.
![योगदान के बजट के आधार पर स्केलिंग फ़ैक्टर तय करना.](https://developers.google.cn/static/privacy-sandbox/assets/images/determining-scaling-fact-f23b0a59c1517.png?authuser=1&hl=hi)
उदाहरण के लिए, मान लें कि विज्ञापन देने वाले लोग खरीदारी की कुल कीमत जानना चाहते हैं. आपको पता है कि किसी एक खरीदारी का ज़्यादा से ज़्यादा 2,000 डॉलर का अनुमान लगाया जा सकता है. हालांकि, कुछ बाहरी वजहों को अनदेखा किया जा सकता है:
- स्केलिंग फ़ैक्टर का आकलन करें:
- सिग्नल-शोर अनुपात को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको इस वैल्यू को 65,536 (योगदान के लिए बजट) पर सेट करना होगा.
- इसका नतीजा यह होता है कि स्केलिंग फ़ैक्टर 65,536 / 2,000 हो सकता है. यह करीब 32x होता है. व्यावहारिक तौर पर, इस फ़ैक्टर को कम या ज़्यादा किया जा सकता है.
- एग्रीगेशन से पहले अपनी वैल्यू को बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 तक बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, 120*32 = 3,840 की एग्रीगेट वैल्यू सेट करें.
- एग्रीगेशन के बाद, वैल्यू को छोटा करें. जब आपको खास जानकारी वाली ऐसी रिपोर्ट मिलती है जिसमें कई उपयोगकर्ताओं के बीच परचेज़ कन्वर्ज़न की कुल वैल्यू शामिल होती है, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, खास जानकारी वाली वैल्यू को स्केल करें. इस उदाहरण में, हमने प्री-एग्रीगेशन के लिए 32 स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें खास जानकारी वाली रिपोर्ट में मिली खास जानकारी की वैल्यू को 32 से भाग देना होगा. इसलिए, अगर समरी रिपोर्ट में किसी कुंजी की समरी परचेज़ वैल्यू 76,800 है, तो समरी परचेज़ वैल्यू (जो शोर के साथ) 76,800/32 = 2,400 डॉलर होगी.
अपना बजट बांटें
अगर आपके पास खरीदारी की संख्या और परचेज़ वैल्यू जैसे कई मेज़रमेंट लक्ष्य हैं, तो आपको अपना बजट इन सभी लक्ष्यों के हिसाब से बांटना होगा.
इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए स्केलिंग फ़ैक्टर अलग-अलग होंगे.
ज़्यादा जानकारी के लिए, एग्रीगेशन कुंजियों को समझना लेख पढ़ें.
उदाहरण के लिए, मान लें कि आप खरीदारी की संख्या और परचेज़ वैल्यू, दोनों को ट्रैक कर रहे हैं और आपने अपना बजट बराबर-बराबर बांटा है.
65,536 / 2 = 32,768 को हर मेज़रमेंट टाइप और हर सोर्स के हिसाब से बांटा जा सकता है.
- खरीदारी की संख्या:
- आप सिर्फ़ एक खरीदारी ट्रैक कर रहे हैं, इसलिए किसी कन्वर्ज़न के लिए खरीदारी की ज़्यादा से ज़्यादा संख्या एक है.
- इसलिए, खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट करें.
- परचेज़ कन्वर्ज़न का कुल मान:
- मान लें कि किसी एक खरीदारी की ज़्यादा से ज़्यादा अनुमानित खरीदारी वैल्यू 2,000 डॉलर है.
- इसलिए, परचेज़ वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला लिया जाता है.
सामान्य एग्रीगेशन कुंजियों की मदद से, सिग्नल-शोर का अनुपात बेहतर होता है
ज़्यादा जानकारी वाली कुंजियों के मुकाबले, सामान्य कुंजियों के मुकाबले ज़्यादा कन्वर्ज़न इवेंट पकते हैं. इसलिए, सामान्य कुंजियों से आम तौर पर खास जानकारी वाली वैल्यू ज़्यादा होती है.
कम वैल्यू के मुकाबले, ज़्यादा जानकारी वाली वैल्यू पर नॉइज़ का कम असर होता है. इस वैल्यू के मुकाबले, इन वैल्यू में गै़र-ज़रूरी डेटा कम हो सकता है.
ज़्यादा जानकारी वाली कुंजियों के साथ इकट्ठा की गई वैल्यू के मुकाबले, तेज़ कुंजी की मदद से इकट्ठा की जाने वाली वैल्यू में कम शोर होता है.
उदाहरण
बाकी सब चीज़ों को एक जैसा रखा जाता है. ऐसी कुंजी जो दुनिया भर में परचेज़ कन्वर्ज़न को ट्रैक करती है (सभी देशों में जोड़ी जाती है) से, देश के लेवल पर कन्वर्ज़न ट्रैक करने वाली कुंजी के मुकाबले, खास जानकारी वाली परचेज़ वैल्यू के साथ-साथ कन्वर्ज़न की संख्या भी ज़्यादा होगी.
इसलिए, किसी खास देश में प्रॉडक्ट की कुल खरीदारी की वैल्यू, सभी देशों में प्रॉडक्ट खरीदने की कुल वैल्यू के मुकाबले ज़्यादा होगी.
इसी तरह, बाकी सभी चीज़ों को एक जैसा रखा जाता है. इस वजह से, जूतों की कुल वैल्यू, सभी प्रॉडक्ट (इसमें जूते भी शामिल हैं) की कुल परचेज़ वैल्यू से कम होती है.
इसलिए, जूतों की कुल खरीदारी की वैल्यू के मुकाबले सभी आइटम की कुल परचेज़ वैल्यू की तुलना में ज़्यादा होगा.
![ज़्यादा जानकारी वाले बनाम सामान्य कुंजियों की मदद से नॉइज़ इंपैक्ट.](https://developers.google.cn/static/privacy-sandbox/assets/images/noise-impact-granular-ve-3d6ad3e387e84.png?authuser=1&hl=hi)
समरी वैल्यू (रोलअप) को जोड़ने पर, डेटा में मौजूद गै़र-ज़रूरी डेटा का कुल योग भी पता चलता है
समरी रिपोर्ट में मौजूद खास जानकारी की वैल्यू को जोड़ कर, हाई-लेवल डेटा को ऐक्सेस किया जा सकता है. इससे, खास जानकारी वाले डेटा का कुल डेटा भी इकट्ठा किया जा सकता है.
![रोलअप के साथ बारीक कुंजियों और बिना रोलअप वाली सामान्य कुंजियों के साथ नॉइज़ का लेवल](https://developers.google.cn/static/privacy-sandbox/assets/images/the-degree-noise-granul-ae2381a2c93b5.png?authuser=1&hl=hi)
आइए दो अलग-अलग तरीकों पर नज़र डालते हैं: - अप्रोच A: अपनी कुंजियों में भूगोल आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, जियो-आईडी-लेवल की कुंजियां दिखाई जाती हैं. हर कुंजी, किसी खास भौगोलिक आईडी के लेवल पर खास जानकारी की खरीदारी की वैल्यू से जुड़ी होती है. - अप्रोच B: आपने अपनी कुंजियों में भौगोलिक आईडी शामिल नहीं किया है. खास जानकारी वाली रिपोर्ट में, सभी भौगोलिक आईडी / जगहों के लिए खरीदारी की खास जानकारी की जानकारी दिखती है.
देश के लेवल पर खरीदारी की वैल्यू को ऐक्सेस करने के लिए: - अप्रोच A का इस्तेमाल करके, जियो-आईडी-लेवल की समरी वैल्यू जोड़ी जाती हैं. इस तरह, वैल्यू को जोड़कर देखा जा सकता है. इससे, भौगोलिक आईडी के लेवल पर की गई खरीदारी की वैल्यू में ज़्यादा ग़ैर-ज़रूरी गड़बड़ियां हो सकती हैं. - अप्रोच B में, खास जानकारी वाली रिपोर्ट में दिखाए गए डेटा को सीधे तौर पर देखा जा सकता है. इस डेटा में ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार जोड़ा गया है.
इसलिए, A का इस्तेमाल करने पर, किसी खास भौगोलिक आईडी की खास जानकारी वाली परचेज़ वैल्यू में शोर हो सकता है.
इसी तरह, अपनी कुंजियों में पिन कोड-लेवल डाइमेंशन शामिल करने से, क्षेत्र-लेवल के डाइमेंशन के साथ अस्पष्ट कुंजियों का इस्तेमाल करने की तुलना में ज़्यादा ग़ैर-ज़रूरी नतीजे मिल सकते हैं.
लंबे समय तक एग्रीगेट करने से, सिग्नल-शोर का अनुपात बढ़ता है
खास जानकारी वाली रिपोर्ट के लिए कम अनुरोध करने का मतलब है कि अगर आपने रिपोर्ट के लिए ज़्यादा अनुरोध किया है, तो इस रिपोर्ट की हर वैल्यू ज़्यादा हो सकती है. लंबे समय में ज़्यादा कन्वर्ज़न होने की संभावना बढ़ जाती है.
जैसा कि पहले बताया गया है, समरी वैल्यू जितनी ज़्यादा होगी, रिलेटिव नॉइज़ की संभावना उतनी ही कम होगी. इसलिए, जब खास जानकारी वाली रिपोर्ट का अनुरोध कम बार किया जाता है, तो शोर का अनुपात ज़्यादा (बेहतर) सिग्नल मिलता है.
![खास जानकारी की रिपोर्ट का कम बार अनुरोध करने से, सिग्नल और शोर का अनुपात ज़्यादा होता है](https://developers.google.cn/static/privacy-sandbox/assets/images/requesting-summary-report-f4ee7fa726ac8.png?authuser=1&hl=hi)
यह दिखाने के लिए यहां एक उदाहरण दिया गया है:
- अगर आपको 24 घंटे से ज़्यादा के लिए हर घंटे की खास जानकारी वाली रिपोर्ट का अनुरोध करना है और इसके बाद दिन-लेवल का डेटा ऐक्सेस करने के लिए, हर घंटे की रिपोर्ट से खास जानकारी की वैल्यू को जोड़ना है, तो गै़र-ज़रूरी डेटा को 24 बार जोड़ा जाता है.
- हर दिन की खास जानकारी वाली एक रिपोर्ट में, ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार शामिल किया जाता है.
ज़्यादा ऐपसिलॉन, कम शोर
Epsilon की वैल्यू जितनी ज़्यादा होगी, शोर उतना ही कम होगा. साथ ही, निजता सुरक्षा भी कम होगी.
फ़िल्टर करने और डुप्लीकेट कॉपी हटाने की सुविधा का इस्तेमाल करना
अलग-अलग कुंजियों के बीच बजट तय करने का एक अहम हिस्सा यह समझना है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, हो सकता है कि कोई विज्ञापन देने वाला हर क्लिक के लिए सिर्फ़ एक खरीदारी पर ध्यान दे, लेकिन उसकी दिलचस्पी ज़्यादा से ज़्यादा तीन "प्रॉडक्ट पेज व्यू" कन्वर्ज़न में हो. इस्तेमाल के इन उदाहरणों में बेहतर तरीके से काम करने के लिए, एपीआई की इन सुविधाओं का भी फ़ायदा लिया जा सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट हों और कौनसे कन्वर्ज़न की गिनती की जाए:
- फ़िल्टर करना. फ़िल्टर करने के बारे में ज़्यादा पढ़ें.
- डुप्लीकेट कॉपी हटाने की तकनीक. डुप्लीकेट कॉपी हटाने के बारे में ज़्यादा जानें.
Epsilon के साथ प्रयोग करना
विज्ञापन टेक्नोलॉजी की मदद से, किसी भी ऐप्लिकेशन को 0 से ज़्यादा की वैल्यू पर सेट किया जा सकता है. साथ ही, 64 या इससे ज़्यादा की वैल्यू भी सेट की जा सकती है. इस रेंज में, ज़रूरत के हिसाब से जांच करने की सुविधा मिलती है. Epsilon के कम मान से ज़्यादा निजता सुरक्षा मिलती है. हमारा सुझाव है कि आप epsilon=10 से शुरू करें.
प्रयोग के लिए सुझाव
हमारा सुझाव है कि आप: - Epsilon से शुरू करें = 10. - अगर इससे बिजली, पानी जैसी सुविधाओं से जुड़ी अहम समस्याएं पैदा होती हैं, तो Epsilon को धीरे-धीरे बढ़ाएं. - डेटा के इस्तेमाल के बारे में सुझाव, राय या शिकायत भेजने के लिए, ज़रूरत के हिसाब से कुछ बदलाव करें.
लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें
आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.
- एग्रीगेट करने लायक रिपोर्ट और एग्रीगेशन सेवा के बारे में पढ़ें, सवाल पूछें, और सुझाव दें.
- एट्रिब्यूशन रिपोर्टिंग गाइड पढ़ें.
- प्राइवसी सैंडबॉक्स डेवलपर सहायता रेपो पर सवाल पूछें और होने वाली चर्चाओं में शामिल हों.
अगले चरण
- रिपोर्टिंग पर असर डालने वाली वजहों, जैसे कि कैंपेन वैरिएबल, बैचिंग फ़्रीक्वेंसी, और डाइमेंशन की ज़्यादा जानकारी के लिए, खास जानकारी वाली रिपोर्ट को डिज़ाइन करने से जुड़े फ़ैसलों के साथ प्रयोग करना लेख पढ़ें .
- शोर लैब आज़माएं.