एग्रीगेशन सेवा लोड की जांच करने का फ़्रेमवर्क

इस दस्तावेज़ पर आपके सुझाव, राय या शिकायत का स्वागत है. हम इसे सार्वजनिक दिशा-निर्देशों के डेटा स्टोर करने की सुविधा में शामिल करने की तैयारी कर रहे हैं.

हम विज्ञापन टेक्नोलॉजी को प्रोडक्शन के 100% ट्रैफ़िक पर लोड टेस्ट करने के लिए बढ़ावा देते हैं:

  1. विज्ञापन टेक्नोलॉजी को कन्वर्ज़न एट्रिब्यूशन मेज़रमेंट को ऐक्सेस करने के लिए, Attribution Reporting API का इस्तेमाल करना चाहिए. यह जानकारी रिपोर्टिंग के इस्तेमाल के उदाहरणों के तौर पर दी जाती है.
  2. विज्ञापन तकनीक को गै़र-ज़रूरी डेटा को कम करते हुए डिज़ाइन से जुड़े फ़ैसले लेने चाहिए (रेफ़रंस: डिज़ाइन से जुड़े फ़ैसले मॉडल)
  3. टेस्टिंग के दौरान, विज्ञापन टेक्नोलॉजी को हर दिन चलाई जाने वाली जॉब (जैसे, हर विज्ञापन देने वाली नौकरी) की संख्या, कन्वर्ज़न इवेंट वॉल्यूम के अनुमानित डिस्ट्रिब्यूशन, और हर प्रोसेसिंग जॉब के लिए इनपुट के तौर पर कुल कुंजियों की संख्या (एग्रीगेशन सर्विस एपीआई दस्तावेज़ में to बैकआउट_domain_blob_prefix जॉब पैरामीटर, और हर इनपुट रिपोर्ट के अनुमानित औसत कन्वर्ज़न इवेंट) का हिसाब रखना चाहिए.
  4. टेस्टिंग के लिए, विज्ञापन टेक्नोलॉजी को उनके अनुमानित जॉब साइज़ (जैसे कि रिपोर्ट की संख्या, डोमेन साइज़) और डिप्लॉय किए गए एग्रीगेशन सेवा के साइज़ के हिसाब से, साइज़ से जुड़ी गाइड से सुझाए गए इंस्टेंस टाइप को खोजना चाहिए. रेफ़रंस: AWS पर एग्रीगेट की गई सेवा के लिए साइज़ से जुड़े दिशा-निर्देश
  5. विज्ञापन टेक्नोलॉजी को लोड टेस्ट के लिए एग्रीगेशन जॉब चलाने चाहिए.

लक्ष्य

यह दिशा-निर्देश खास तौर पर कन्वर्ज़न एट्रिब्यूशन मेज़रमेंट को एग्रीगेट करने के लिए है. इसमें मुख्य सेटअप और कॉन्फ़िगरेशन से जुड़े निर्देश शामिल होंगे, जिनका इस्तेमाल विज्ञापन टेक्नोलॉजी में इन कामों के लिए किया जा सकता है:

  • कुल कन्वर्ज़न एट्रिब्यूशन मेज़रमेंट के लिए, लोड होने की अनुमानित संख्या का अनुमान लगाएं.
  • परफ़ॉर्मेंस और बेहतर परफ़ॉर्मेंस के लिए, इन डिवाइसों के मुख्य सेट अप और कॉन्फ़िगरेशन को ऑप्टिमाइज़ करें. ये कॉन्फ़िगरेशन, उन डाइमेंशन और लक्ष्यों के हिसाब से किए जाते हैं जिन्हें वे मेज़र करना चाहते हैं. साथ ही, विज्ञापन देने वालों के साइज़ और सेगमेंटेशन को भी ऑप्टिमाइज़ करें.

पहले से आवश्यक

यह गाइड, विज्ञापन टेक्नोलॉजी से जुड़ी ऑडियंस के लिए है. यहां दिया गया तरीका अपनाने से पहले, ग़ैर-ज़रूरी डेटा के साथ काम करने, खास जानकारी वाली रिपोर्ट को डिज़ाइन करने से जुड़े फ़ैसले, और बेहतर कॉन्फ़िगरेशन के लिए शोर लैब के साथ प्रयोग करने से जुड़े हमारे दस्तावेज़ देखें.

चरण

1. शुरुआती एग्रीगेशन कुंजी सेटअप करने की रणनीति

अपने कारोबार के टाइप और मकसद के आधार पर तय करें कि आपको कितने अलग-अलग मुख्य स्ट्रक्चर (जैसे, डाइमेंशन के सेट) की ज़रूरत है. ध्यान दें कि अपने मुख्य स्ट्रक्चर को ऑप्टिमाइज़ करने से, रिपोर्ट की परफ़ॉर्मेंस को कम किया जा सकता है.

आपके विज्ञापन देने वालों की संख्या
उदाहरण के लिए, मान लें कि आपके 1,000 विज्ञापन देने वाले हैं.

विज्ञापन देने वाले लोगों या कंपनियों के बीच समानताएं
समानता का आकलन, कन्वर्ज़न की संख्या, मिलती-जुलती कन्वर्ज़न वैल्यू, और विज्ञापन देने वाले लोगों या कंपनियों की विशेषताओं के आधार पर किया जाना चाहिए. नतीजों को जितना ज़्यादा बारीकी से ग्रुप किया जा सकेगा उनमें आउटपुट वैल्यू में कम अंतर होगा. इससे, ग़ैर-ज़रूरी आवाज़ों का असर कम होगा. ज़्यादा जानकारी के लिए, बेहतर कुंजी मैनेज करने की सुविधा देखें. उदाहरण के लिए, कोई विज्ञापन टेक्नोलॉजी, विज्ञापन देने वालों को इंडस्ट्री, खर्च, और कन्वर्ज़न वॉल्यूम के हिसाब से, इस तरह से सेगमेंट कर सकती है:

  • उद्योग, जैसे कि बीमा, गहने, ग्रोथ रीटेल
  • खर्च (उदाहरण के लिए: <$50,000/तिमाही, $50-$150,000/तिमाही, $1,50,000-$2,50,000/तिमाही)
  • कन्वर्ज़न वॉल्यूम (कम, मध्यम, ज़्यादा)

बनाए जाने वाले एग्रीगेट मुख्य स्ट्रक्चर की संख्या
उदाहरण के लिए, 27 (3x3x3) : तीन इंडस्ट्री, खर्च के तीन टाइप, और कन्वर्ज़न वैल्यू के लिए तीन ग्रुप.

2. एग्रीगेशन कुंजी आयामों की पहचान करना

इसके बाद, उन ज़रूरी डाइमेंशन की पहचान करें जिन्हें आपको इंप्रेशन और कन्वर्ज़न, दोनों के लिए ट्रैक करना है. इससे, सोर्स और ट्रिगर साइड कुंजियों की संख्या का अनुमान लगाया जा सकता है.

एग्रीगेशन की हर कुंजी के स्ट्रक्चर के लिए, इंप्रेशन के लिए जिन अहम डाइमेंशन को ट्रैक करना ज़रूरी है उनसे आपको सोर्स साइड कुंजियों की संख्या तय करने में मदद मिलेगी. डाइमेंशन, विज्ञापन देने वाले के उस टाइप के हिसाब से तय होंगे जो ऊपर दिए गए #1 टाइप (जैसे, इंडस्ट्री, खर्च, कन्वर्ज़न) में से एक है. यहां दिए गए उदाहरणों से, डाइमेंशन के बारे में जानकारी मिलती है:

  • मुख्य संरचना 1: (उद्योग = बीमा, खर्च = <50,000, कन्वर्ज़न वॉल्यूम = कम)

    • A: 4 डाइमेंशन: कैंपेन (उदाहरण: 50 संभावनाएं), विज्ञापन समूह (उदाहरण: 20 संभावनाएं), डिवाइस का टाइप (उदाहरण के लिए: 5 संभावनाएं), भौगोलिक (उदाहरण: 50 मौके)
      1. संभावित डाइमेंशन के कॉम्बिनेशन = 50 x 20 x 5 x 50 = 2,50,000. यह की स्ट्रक्चर 1 के लिए सोर्स साइड कुंजियों के लिए संभावित डाइमेंशन के कॉम्बिनेशन की संख्या दिखाता है.
      2. 18 बिट (18 बिट = 2,62,144 संभावित कॉम्बिनेशन) रिज़र्व करने की ज़रूरत है
  • मुख्य स्ट्रक्चर 2: (इंडस्ट्री = बीमा, खर्च = <50,000, कन्वर्ज़न वॉल्यूम = मीडियम)

    • A: 4 डाइमेंशन: कैंपेन (उदाहरण: 30 संभावनाएं), विज्ञापन समूह (उदाहरण: 80 संभावनाएं), विज्ञापन का टाइप (उदाहरण: 3 संभावनाएं), भौगोलिक (उदाहरण: 50 मौके).
      1. संभावित डाइमेंशन के कॉम्बिनेशन = 30 x 80 x 3 x 50 = 3,60,000. यह की स्ट्रक्चर 2 के लिए संभव डाइमेंशन कॉम्बिनेशन या सोर्स साइड कुंजियों की संख्या दिखाता है.
      2. 19 बिट (19 बिट) = 5,24,288 संभावित कॉम्बिनेशन को रिज़र्व करने की ज़रूरत है
  • मुख्य स्ट्रक्चर 3: दोहराएं (आपके सभी मुख्य स्ट्रक्चर के लिए भी इसी तरह की योजना है)

एग्रीगेशन की हर कुंजी के स्ट्रक्चर के लिए, कन्वर्ज़न के लिए ट्रैक किए जाने वाले ज़रूरी डाइमेंशन ट्रिगर की साइड कुंजियां तय करने में आपकी मदद करेंगे. उदाहरण के लिए:

  • मुख्य संरचना 1: (उद्योग = बीमा, खर्च = <50,000, कन्वर्ज़न वॉल्यूम = कम)

    • A: 2 डाइमेंशन: प्रॉडक्ट कैटगरी (उदाहरण: 100 संभावनाएं), कन्वर्ज़न टाइप (उदाहरण: पांच संभावनाएं)
      1. संभावित डाइमेंशन के कॉम्बिनेशन = 100 x 5 = 500
      2. 9 बिट (9 बिट = 512 संभावित कॉम्बिनेशन) रिज़र्व करने की ज़रूरत है
  • मुख्य स्ट्रक्चर 2: (इंडस्ट्री = बीमा, खर्च = <50,000, कन्वर्ज़न वॉल्यूम = मीडियम)

    • A: तीन डाइमेंशन: प्रॉडक्ट कैटगरी (उदाहरण: 50 संभावनाएं), प्रॉडक्ट टाइप (10 संभावनाएं), कन्वर्ज़न टाइप (3 संभावनाएं)
      1. संभावित डाइमेंशन के कॉम्बिनेशन = 50 x 10 x 3 = 1,500
      2. 11 बिट (11 बिट = 2,048 संभावित कॉम्बिनेशन) रिज़र्व करने की ज़रूरत है
  • मुख्य स्ट्रक्चर 3: दोहराएं (आपके सभी मुख्य स्ट्रक्चर के लिए भी इसी तरह की योजना)

एग्रीगेट कुंजियों के लिए अनुमान

  • मुख्य संरचना 1: 2,50,000 इंप्रेशन कुंजियां x 500 कन्वर्ज़न कुंजियां = 1,25,00,000 कुंजियां
  • मुख्य संरचना 2: 3,60,000 इंप्रेशन कुंजियां x 1.5 हज़ार कन्वर्ज़न कुंजियां = 5,40,000,000 कुंजियां
  • मुख्य स्ट्रक्चर 3: (आपके सभी मुख्य स्ट्रक्चर के लिए इसी तरह की योजना)
  • हर कुंजी स्ट्रक्चर के लिए यह दोहराएं
  • ज़्यादा से ज़्यादा कुल कुंजियां = 5,40,00,000 कुंजियां (सभी मुख्य स्ट्रक्चर में). 30 बिट (30 बिट = 1.07B संभावित कॉम्बिनेशन) रिज़र्व करने की ज़रूरत है

अनुमानित कन्वर्ज़न वॉल्यूम

एग्रीगेशन की हर कुंजी के स्ट्रक्चर के लिए, अनुमानित वॉल्यूम के बारे में इन उदाहरणों का इस्तेमाल करके बताया जा सकता है:

  • मुख्य स्ट्रक्चर 1: (इंडस्ट्री = बीमा, खर्च = 50,000 से कम, कन्वर्ज़न वॉल्यूम = कम)
    • जवाब: अनुमान लगाएं कि मुख्य स्ट्रक्चर 1 में अगली तिमाही में विज्ञापन देने वाले पर औसतन 8 डॉलर सीपीएम की कीमत पर 5,00,000 डॉलर खर्च किए जाएंगे. अनुमान है कि इससे 6,25,00,000 इंप्रेशन मिलेंगे, जिन्हें रजिस्टर कराना ज़रूरी है.
    • यह अनुमान लगाएं कि अगली तिमाही में, 'मुख्य स्ट्रक्चर 1' में शामिल किए जाने वाले कन्वर्ज़न रेट की औसत इंप्रेशन 0.08% है. इस वजह से, 50,000 एट्रिब्यूट किए गए कन्वर्ज़न को कैप्चर करने की ज़रूरत होगी. हर कन्वर्ज़न के लिए, परचेज़ कन्वर्ज़न की वैल्यू और खरीदारी की संख्या को मेज़र करें.
  • मुख्य स्ट्रक्चर 2: (इंडस्ट्री = बीमा, खर्च = <50,000, कन्वर्ज़न वॉल्यूम = मीडियम)
    • जवाब: अनुमान लगाएं कि कुंजी 2 में अगली तिमाही के लिए करीब 8,00,000 डॉलर खर्च होंगे, जो औसतन 10 डॉलर सीपीएम होगी. अनुमान लगाएं कि इससे 8,00,00,000 इंप्रेशन मिलेंगे, जिन्हें रजिस्टर करना ज़रूरी है.
    • अनुमान लगाएं कि अगली तिमाही में कुंजी 2 की कन्वर्ज़न दर का औसत इंप्रेशन 0.03125% होगा, जिससे 25,000 एट्रिब्यूट किए गए कन्वर्ज़न कैप्चर किए जाएंगे. हर कन्वर्ज़न के लिए, परचेज़ कन्वर्ज़न की वैल्यू और खरीदारी की संख्या को मेज़र करें.
  • हर कुंजी स्ट्रक्चर के लिए यह दोहराएं

रिपोर्टिंग डिलीवरी और बैचिंग फ़्रीक्वेंसी (विज्ञापन देने वाले हर व्यक्ति के लिए बैच)**

हर एग्रीगेशन कुंजी स्ट्रक्चर के लिए, आपको बार-बार डिलीवर होने वाली कन्वर्ज़न रिपोर्ट की ज़रूरत होगी. हमारा सुझाव है कि विज्ञापन टेक्नोलॉजी को विज्ञापन देने वालों के हिसाब से बैच करें. इससे, हर रिपोर्ट में डेटा को आसानी से अलग-अलग करने और ज़्यादा बेहतर तरीके से एग्रीगेशन किया जा सकता है. साथ ही, बैच बनाने के लिए, रिपोर्ट के shared_info.scheduled_report_time फ़ील्ड का इस्तेमाल किया जा सकता है.

  • जवाब: हर घंटे
  • B: रोज़
  • C: हर हफ़्ते

ज़रूरी जानकारी

  • विज्ञापन देने वाले के हिसाब से बैच बनाने के लिए, विज्ञापन देने वाले लोगों या कंपनियों से सेवा स्तर समझौते (एसएलए) की पुष्टि करें.
  • एक साथ कई बैच में भेजे जाने वाले ईमेल में, हर बैच में ज़्यादा नॉइज़ शामिल होगा. (रेफ़रंस: फ़ैसला: बैच फ़्रीक्वेंसी).

  • गलत बैच की वजह से होने वाली गड़बड़ियों से बचने के लिए, पक्का करें कि बैच scheduled_report_time फ़ील्ड का इस्तेमाल कर रहे हों, न कि report arrival time का. उदाहरण के लिए: अगर आप हर घंटे बैच बनाते हैं, तो सुबह 11 बजे के आपके बैच में सिर्फ़ scheduled_report_time सुबह 10 बजे से 11 बजे के बीच वाली रिपोर्ट शामिल होनी चाहिए, न कि 10 बजे से सुबह 11 बजे के बीच अलग scheduled_report_time वाली रिपोर्ट (उदाहरण: 9am).

रिपोर्ट वॉल्यूम के लिए अनुमान

  • मुख्य स्ट्रक्चर 1: 50,000 एट्रिब्यूट किए गए कन्वर्ज़न / 2160 (हर घंटे की रिपोर्टिंग, तिमाही में घंटे) = हर विज्ञापन देने वाले के लिए हर घंटे 24 खास जानकारी वाली रिपोर्ट (24 x 1,000 विज्ञापन देने वाले = 24 हज़ार की खास जानकारी वाली रिपोर्ट)
  • मुख्य स्ट्रक्चर 2: 25,000 एट्रिब्यूट किए गए कन्वर्ज़न / 2160 (हर घंटे की रिपोर्टिंग, तिमाही में घंटे) = हर विज्ञापन देने वाले हर घंटे 12 खास जानकारी वाली रिपोर्ट (12 x 1,000 विज्ञापन देने वाले = 12 हज़ार की खास जानकारी वाली रिपोर्ट)
  • तीसरा मुख्य स्ट्रक्चर: दोहराना
  • प्रति घंटे समरी रिपोर्ट की कुल संख्या = मुख्य स्ट्रक्चर के लिए 24 समरी रिपोर्ट + मुख्य स्ट्रक्चर 2 के लिए 12 समरी रिपोर्ट + ... = ... हर घंटे के लिए हर विज्ञापन देने वाले

फ़ीडबैक सारांश

विज्ञापन टेक्नोलॉजी से जुड़े इन अनुमानों को समझने से, हमें सुविधाओं की योजना बनाने और उनमें सुधार करने में मदद मिलती है. इससे विज्ञापन टेक्नोलॉजी के लिए, बड़े पैमाने पर काम करने में मदद मिलती है. हमारा सुझाव है कि आप कृपया नीचे दी गई जानकारी हमारे साथ शेयर करें. ज़्यादा जानकारी के लिए, AWS पर एग्रीगेशन सर्विस के साइज़ से जुड़े दिशा-निर्देश देखें:

  • हर एग्रीगेशन सेवा जॉब के लिए ज़्यादा से ज़्यादा इनपुट डोमेन कुंजियां (इन्हें इकट्ठा करने के लिए कुंजियां)
  • ज़्यादा से ज़्यादा इनपुट रिपोर्ट के लिए हर जॉब के लिए वॉल्यूम की संख्या (एट्रिब्यूट किए गए कन्वर्ज़न)
  • हर रिपोर्ट के लिए अनुमानित योगदान (रिपोर्ट में कुंजियां/वैल्यू पेयर)
  • हर जॉब के लिए एट्रिब्यूट किए गए कन्वर्ज़न का अनुमानित डिस्ट्रिब्यूशन
  • किसी जॉब में डोमेन कुंजियों का अनुमानित डिस्ट्रिब्यूशन
  • हर घंटे/दिन/हफ़्ते में नौकरियों की अनुमानित संख्या