ग़ैर-ज़रूरी आवाज़ें कम करने की सुविधा का इस्तेमाल करना

अपनी इकट्ठा की जा सकने वाली रिपोर्ट में गै़र-ज़रूरी डेटा के साथ काम करने, उसका हिसाब लगाने, और उसके असर को कम करने का तरीका जानें.

शुरू करने से पहले

आगे बढ़ने से पहले, शोर क्या है और इसके असर को गहराई से समझने के लिए, खास जानकारी वाली रिपोर्ट में शोर को समझना देखें.

शोर पर आपके कंट्रोल

हालांकि, एग्रीगेट की जा सकने वाली रिपोर्ट में आने वाले शोर को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इस तरह के असर को कम करने के लिए, कुछ तरीके आज़माए जा सकते हैं. इन सेक्शन में, इन रणनीतियों के बारे में बताया गया है.

योगदान के बजट तक बढ़ाएं

जैसा कि 'शोर को समझना' सेक्शन में बताया गया है, हर कुंजी के लिए, समरी वैल्यू पर लागू होने वाला शोर 0-65,536 स्केल (0-CONTRIBUTION_BUDGET) के आधार पर तय होता है.

नॉइज़ डिस्ट्रिब्यूशन, बजट पर आधारित होता है.

इसलिए, शोर से जुड़े सिग्नल को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट वैल्यू के तौर पर सेट करने से पहले स्केल अप करना होगा. इसका मतलब है कि हर वैल्यू को किसी खास फ़ैक्टर, स्केलिंग फ़ैक्टर से गुणा करना चाहिए. साथ ही, यह पक्का करना होगा कि वह योगदान के लिए तय किए गए बजट में बनी रहे.

स्केलिंग के साथ और उसके बिना रिलेटिव नॉइज़.

स्केलिंग फ़ैक्टर को कैलकुलेट किया जा रहा है

स्केलिंग फ़ैक्टर से यह पता चलता है कि आपको इकट्ठा की जा सकने वाली किसी वैल्यू को कितना स्केल करना है. इसका मान योगदान बजट को किसी खास कुंजी के लिए सबसे ज़्यादा एग्रीगेट किए जा सकने वाले मान से भाग देने पर मिलने वाला होना चाहिए.

योगदान के बजट के आधार पर स्केलिंग फ़ैक्टर तय करना.

उदाहरण के लिए, मान लें कि विज्ञापन देने वाले लोग खरीदारी की कुल कीमत जानना चाहते हैं. आपको पता है कि किसी एक खरीदारी का ज़्यादा से ज़्यादा 2,000 डॉलर का अनुमान लगाया जा सकता है. हालांकि, कुछ बाहरी वजहों को अनदेखा किया जा सकता है:

  • स्केलिंग फ़ैक्टर का आकलन करें:
    • सिग्नल-शोर अनुपात को ज़्यादा से ज़्यादा बढ़ाने के लिए, आपको इस वैल्यू को 65,536 (योगदान के लिए बजट) पर सेट करना होगा.
    • इसका नतीजा यह होता है कि स्केलिंग फ़ैक्टर 65,536 / 2,000 हो सकता है. यह करीब 32x होता है. व्यावहारिक तौर पर, इस फ़ैक्टर को कम या ज़्यादा किया जा सकता है.
  • एग्रीगेशन से पहले अपनी वैल्यू को बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 तक बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, 120*32 = 3,840 की एग्रीगेट वैल्यू सेट करें.
  • एग्रीगेशन के बाद, वैल्यू को छोटा करें. जब आपको खास जानकारी वाली ऐसी रिपोर्ट मिलती है जिसमें कई उपयोगकर्ताओं के बीच परचेज़ कन्वर्ज़न की कुल वैल्यू शामिल होती है, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, खास जानकारी वाली वैल्यू को स्केल करें. इस उदाहरण में, हमने प्री-एग्रीगेशन के लिए 32 स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें खास जानकारी वाली रिपोर्ट में मिली खास जानकारी की वैल्यू को 32 से भाग देना होगा. इसलिए, अगर समरी रिपोर्ट में किसी कुंजी की समरी परचेज़ वैल्यू 76,800 है, तो समरी परचेज़ वैल्यू (जो शोर के साथ) 76,800/32 = 2,400 डॉलर होगी.

अपना बजट बांटें

अगर आपके पास खरीदारी की संख्या और परचेज़ वैल्यू जैसे कई मेज़रमेंट लक्ष्य हैं, तो आपको अपना बजट इन सभी लक्ष्यों के हिसाब से बांटना होगा.

इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए स्केलिंग फ़ैक्टर अलग-अलग होंगे.

ज़्यादा जानकारी के लिए, एग्रीगेशन कुंजियों को समझना लेख पढ़ें.

उदाहरण के लिए, मान लें कि आप खरीदारी की संख्या और परचेज़ वैल्यू, दोनों को ट्रैक कर रहे हैं और आपने अपना बजट बराबर-बराबर बांटा है.

65,536 / 2 = 32,768 को हर मेज़रमेंट टाइप और हर सोर्स के हिसाब से बांटा जा सकता है.

  • खरीदारी की संख्या:
    • आप सिर्फ़ एक खरीदारी ट्रैक कर रहे हैं, इसलिए किसी कन्वर्ज़न के लिए खरीदारी की ज़्यादा से ज़्यादा संख्या एक है.
    • इसलिए, खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट करें.
  • परचेज़ कन्वर्ज़न का कुल मान:
    • मान लें कि किसी एक खरीदारी की ज़्यादा से ज़्यादा अनुमानित खरीदारी वैल्यू 2,000 डॉलर है.
    • इसलिए, परचेज़ वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला लिया जाता है.

सामान्य एग्रीगेशन कुंजियों की मदद से, सिग्नल-शोर का अनुपात बेहतर होता है

ज़्यादा जानकारी वाली कुंजियों के मुकाबले, सामान्य कुंजियों के मुकाबले ज़्यादा कन्वर्ज़न इवेंट पकते हैं. इसलिए, सामान्य कुंजियों से आम तौर पर खास जानकारी वाली वैल्यू ज़्यादा होती है.

कम वैल्यू के मुकाबले, ज़्यादा जानकारी वाली वैल्यू पर नॉइज़ का कम असर होता है. इस वैल्यू के मुकाबले, इन वैल्यू में गै़र-ज़रूरी डेटा कम हो सकता है.

ज़्यादा जानकारी वाली कुंजियों के साथ इकट्ठा की गई वैल्यू के मुकाबले, तेज़ कुंजी की मदद से इकट्ठा की जाने वाली वैल्यू में कम शोर होता है.

उदाहरण

बाकी सब चीज़ों को एक जैसा रखा जाता है. ऐसी कुंजी जो दुनिया भर में परचेज़ कन्वर्ज़न को ट्रैक करती है (सभी देशों में जोड़ी जाती है) से, देश के लेवल पर कन्वर्ज़न ट्रैक करने वाली कुंजी के मुकाबले, खास जानकारी वाली परचेज़ वैल्यू के साथ-साथ कन्वर्ज़न की संख्या भी ज़्यादा होगी.

इसलिए, किसी खास देश में प्रॉडक्ट की कुल खरीदारी की वैल्यू, सभी देशों में प्रॉडक्ट खरीदने की कुल वैल्यू के मुकाबले ज़्यादा होगी.

इसी तरह, बाकी सभी चीज़ों को एक जैसा रखा जाता है. इस वजह से, जूतों की कुल वैल्यू, सभी प्रॉडक्ट (इसमें जूते भी शामिल हैं) की कुल परचेज़ वैल्यू से कम होती है.

इसलिए, जूतों की कुल खरीदारी की वैल्यू के मुकाबले सभी आइटम की कुल परचेज़ वैल्यू की तुलना में ज़्यादा होगा.

ज़्यादा जानकारी वाले बनाम सामान्य कुंजियों की मदद से नॉइज़ इंपैक्ट.

समरी वैल्यू (रोलअप) को जोड़ने पर, डेटा में मौजूद गै़र-ज़रूरी डेटा का कुल योग भी पता चलता है

समरी रिपोर्ट में मौजूद खास जानकारी की वैल्यू को जोड़ कर, हाई-लेवल डेटा को ऐक्सेस किया जा सकता है. इससे, खास जानकारी वाले डेटा का कुल डेटा भी इकट्ठा किया जा सकता है.

रोलअप के साथ बारीक कुंजियों और बिना रोलअप वाली सामान्य कुंजियों के साथ नॉइज़ का लेवल

आइए दो अलग-अलग तरीकों पर नज़र डालते हैं: - अप्रोच A: अपनी कुंजियों में भूगोल आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, जियो-आईडी-लेवल की कुंजियां दिखाई जाती हैं. हर कुंजी, किसी खास भौगोलिक आईडी के लेवल पर खास जानकारी की खरीदारी की वैल्यू से जुड़ी होती है. - अप्रोच B: आपने अपनी कुंजियों में भौगोलिक आईडी शामिल नहीं किया है. खास जानकारी वाली रिपोर्ट में, सभी भौगोलिक आईडी / जगहों के लिए खरीदारी की खास जानकारी की जानकारी दिखती है.

देश के लेवल पर खरीदारी की वैल्यू को ऐक्सेस करने के लिए: - अप्रोच A का इस्तेमाल करके, जियो-आईडी-लेवल की समरी वैल्यू जोड़ी जाती हैं. इस तरह, वैल्यू को जोड़कर देखा जा सकता है. इससे, भौगोलिक आईडी के लेवल पर की गई खरीदारी की वैल्यू में ज़्यादा ग़ैर-ज़रूरी गड़बड़ियां हो सकती हैं. - अप्रोच B में, खास जानकारी वाली रिपोर्ट में दिखाए गए डेटा को सीधे तौर पर देखा जा सकता है. इस डेटा में ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार जोड़ा गया है.

इसलिए, A का इस्तेमाल करने पर, किसी खास भौगोलिक आईडी की खास जानकारी वाली परचेज़ वैल्यू में शोर हो सकता है.

इसी तरह, अपनी कुंजियों में पिन कोड-लेवल डाइमेंशन शामिल करने से, क्षेत्र-लेवल के डाइमेंशन के साथ अस्पष्ट कुंजियों का इस्तेमाल करने की तुलना में ज़्यादा ग़ैर-ज़रूरी नतीजे मिल सकते हैं.

लंबे समय तक एग्रीगेट करने से, सिग्नल-शोर का अनुपात बढ़ता है

खास जानकारी वाली रिपोर्ट के लिए कम अनुरोध करने का मतलब है कि अगर आपने रिपोर्ट के लिए ज़्यादा अनुरोध किया है, तो इस रिपोर्ट की हर वैल्यू ज़्यादा हो सकती है. लंबे समय में ज़्यादा कन्वर्ज़न होने की संभावना बढ़ जाती है.

जैसा कि पहले बताया गया है, समरी वैल्यू जितनी ज़्यादा होगी, रिलेटिव नॉइज़ की संभावना उतनी ही कम होगी. इसलिए, जब खास जानकारी वाली रिपोर्ट का अनुरोध कम बार किया जाता है, तो शोर का अनुपात ज़्यादा (बेहतर) सिग्नल मिलता है.

खास जानकारी की रिपोर्ट का कम बार अनुरोध करने से, सिग्नल और शोर का अनुपात ज़्यादा होता है

यह दिखाने के लिए यहां एक उदाहरण दिया गया है:

  • अगर आपको 24 घंटे से ज़्यादा के लिए हर घंटे की खास जानकारी वाली रिपोर्ट का अनुरोध करना है और इसके बाद दिन-लेवल का डेटा ऐक्सेस करने के लिए, हर घंटे की रिपोर्ट से खास जानकारी की वैल्यू को जोड़ना है, तो गै़र-ज़रूरी डेटा को 24 बार जोड़ा जाता है.
  • हर दिन की खास जानकारी वाली एक रिपोर्ट में, ग़ैर-ज़रूरी आवाज़ों को सिर्फ़ एक बार शामिल किया जाता है.

ज़्यादा ऐपसिलॉन, कम शोर

Epsilon की वैल्यू जितनी ज़्यादा होगी, शोर उतना ही कम होगा. साथ ही, निजता सुरक्षा भी कम होगी.

फ़िल्टर करने और डुप्लीकेट कॉपी हटाने की सुविधा का इस्तेमाल करना

अलग-अलग कुंजियों के बीच बजट तय करने का एक अहम हिस्सा यह समझना है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, हो सकता है कि कोई विज्ञापन देने वाला हर क्लिक के लिए सिर्फ़ एक खरीदारी पर ध्यान दे, लेकिन उसकी दिलचस्पी ज़्यादा से ज़्यादा तीन "प्रॉडक्ट पेज व्यू" कन्वर्ज़न में हो. इस्तेमाल के इन उदाहरणों में बेहतर तरीके से काम करने के लिए, एपीआई की इन सुविधाओं का भी फ़ायदा लिया जा सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट हों और कौनसे कन्वर्ज़न की गिनती की जाए:

Epsilon के साथ प्रयोग करना

विज्ञापन टेक्नोलॉजी की मदद से, किसी भी ऐप्लिकेशन को 0 से ज़्यादा की वैल्यू पर सेट किया जा सकता है. साथ ही, 64 या इससे ज़्यादा की वैल्यू भी सेट की जा सकती है. इस रेंज में, ज़रूरत के हिसाब से जांच करने की सुविधा मिलती है. Epsilon के कम मान से ज़्यादा निजता सुरक्षा मिलती है. हमारा सुझाव है कि आप epsilon=10 से शुरू करें.

प्रयोग के लिए सुझाव

हमारा सुझाव है कि आप: - Epsilon से शुरू करें = 10. - अगर इससे बिजली, पानी जैसी सुविधाओं से जुड़ी अहम समस्याएं पैदा होती हैं, तो Epsilon को धीरे-धीरे बढ़ाएं. - डेटा के इस्तेमाल के बारे में सुझाव, राय या शिकायत भेजने के लिए, ज़रूरत के हिसाब से कुछ बदलाव करें.

लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें

आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.

अगले चरण