विषय की कैटगरी

यह पढ़ें कि विषयों का अनुमान कैसे लगाया जाता है, वे उपयोगकर्ताओं को कैसे असाइन किए जाते हैं और यह तय कर सकते हैं कि उपयोगकर्ता अपने विषयों की सूची कैसे कंट्रोल कर सकते हैं.

लागू करने की स्थिति

विषय क्या है?

Topics API में विषय एक ऐसा विषय है जिसमें लोगों की दिलचस्पी होती है. इससे पता चलता है कि जिन वेबसाइटों को वे विज़िट करते हैं उनसे पता चलता है.

विषय की मदद से, विज्ञापन टेक्नोलॉजी से जुड़े प्लैटफ़ॉर्म को काम के विज्ञापन चुनने में मदद मिलती है. तीसरे पक्ष की कुकी के उलट, इस जानकारी को उपयोगकर्ता या उसकी ब्राउज़िंग गतिविधि के बारे में ज़्यादा जानकारी दिए बिना शेयर किया जाता है.

Topics API की मदद से, विज्ञापन टेक्नोलॉजी से जुड़े प्लैटफ़ॉर्म जैसे तीसरे पक्ष, लोगों की पसंद के विषयों की निगरानी कर सकते हैं और फिर उन्हें ऐक्सेस कर सकते हैं. उदाहरण के लिए, एपीआई "Fiber & टेक्सटाइल आर्ट" knitting.example वेबसाइट पर जाने वाले उपयोगकर्ता के लिए.

Topics API में जो विषय इस्तेमाल किए जाते हैं वे सार्वजनिक हैं, मैन्युअल तरीके से चुने गए हैं, और ऐसे विषय हैं जिन्हें लोग पढ़ सकते हैं. साथ ही, इन्हें संवेदनशील कैटगरी से बचने के लिए डिज़ाइन किया गया है. यह मौजूदा सूची है, जिसमें आने वाले समय में ज़्यादा लोग शामिल होंगे. इस सूची को कैटगरी के हिसाब से बनाया गया है. विषय हाई लेवल या ज़्यादा सटीक हो सकते हैं. उदाहरण के लिए, Food & Drink एक व्यापक कैटगरी है, जिसकी सब-कैटगरी Cooking & Recipes है. सब-कैटगरी को अन्य सब-कैटगरी में भी बांटा जा सकता है.

विषयों की इस तरह की टेक्सॉनमी में, उपयोगिता और निजता के बीच तालमेल बिठाना चाहिए. अगर विषय बहुत खास हैं, तो उनका इस्तेमाल किसी एक उपयोगकर्ता की पहचान करने के लिए किया जा सकता है. अगर जानकारी बहुत सामान्य है, तो इसका इस्तेमाल विज्ञापन या अन्य कॉन्टेंट चुनने के लिए नहीं किया जा सकता.

विषयों की अलग-अलग कैटगरी को, इन दो बातों को ध्यान में रखकर तैयार किया गया है:

  • रुचि-आधारित विज्ञापन का समर्थन करें
  • लोगों और उनकी निजता को सुरक्षित रखें

इससे कई सवालों के सुझाव मिलते हैं. उदाहरण के लिए:

  • उपयोगकर्ता की निजता को सुरक्षित रखते हुए, उपयोगकर्ता की ब्राउज़िंग गतिविधि के आधार पर, एपीआई को उपयोगकर्ता की पसंद के विषयों का अनुमान लगाने का सबसे सही तरीका क्या है?
  • टेक्सॉनमी को और काम का बनाने के लिए, क्या उसे व्यवस्थित किया जा सकता है?
  • टेक्सॉनमी में कौनसे खास आइटम शामिल होने चाहिए?

एपीआई किसी साइट के लिए विषयों का पता कैसे लगाता है

विषय, क्लासिफ़ायर मॉडल से लिए जाते हैं. यह वेबसाइट के होस्टनेम को शून्य या उससे ज़्यादा विषयों पर मैप करता है. अतिरिक्त जानकारी (जैसे कि पूरे यूआरएल या पेज की सामग्री) का विश्लेषण करने से शायद ज़्यादा प्रासंगिक विज्ञापन दिखाए जा सकेंगे, लेकिन इससे निजता की सुरक्षा भी कम हो सकती है.

विषयों के साथ होस्टनेम को मैप करने के लिए क्लासिफ़ायर मॉडल सार्वजनिक तौर पर उपलब्ध है. जानकारी देने वाले नोट के तौर पर, ब्राउज़र डेवलपर टूल के ज़रिए किसी साइट के लिए विषय देखे जा सकते हैं. इस मॉडल में समय के साथ बदलाव हो सकता है और इसमें सुधार हो सकता है. इसे समय-समय पर अपडेट भी किया जाता रहेगा; की फ़्रीक्वेंसी पर अब भी विचार किया जा रहा है.

सिर्फ़ उन साइटों को ब्राउज़िंग इतिहास में शामिल किया जाता है जिनमें Topics API को कॉल करने वाला कोड शामिल है और जो विषय की फ़्रीक्वेंसी का हिसाब लगाने के लिए ज़रूरी शर्तें पूरी करते हैं. एपीआई कॉलर को सिर्फ़ उनके देखे गए विषय ही मिलते हैं. दूसरे शब्दों में, अगर कोई साइट या एपीआई को कॉल करने वाली कोई एम्बेड की गई सेवा है, तो उसके बिना, साइटों के लिए टॉपिक फ़्रीक्वेंसी का हिसाब लगाने की अनुमति नहीं है.

इसके अलावा, कॉल करने वाले व्यक्ति को सिर्फ़ वही विषय मिल सकते हैं जो उसके कोड में "देखे गए" हैं. इसलिए, अगर किसी अन्य कॉलर के कोड ने कोई विषय रजिस्टर किया है, जैसे कि /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, तो उपयोगकर्ता के ब्राउज़र के लिए आपके कोड ने उस विषय को रजिस्टर नहीं किया है, तो अपने एम्बेड किए गए कोड से एपीआई को कॉल करने पर, आपको उस उपयोगकर्ता के ब्राउज़र के लिए दिलचस्प विषय के बारे में जानकारी नहीं मिलेगी. ध्यान दें कि अब एपीआई में पूर्वजों को शामिल किया गया है, जैसा कि देखा गया है. ऊपर दिए गए उदाहरण, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks की वजह से Autos & Vehicles और Motor Vehicles भी दिखेंगे.

टॉप-लेवल की साइट के आधार पर, किसी उपयोगकर्ता के लिए लौटाए गए विषयों का फिर से हिसाब लगाया जाता है. उदाहरण के लिए, अगर adtech.example उपयोगकर्ता की पसंद के विषयों का अनुरोध news-a.example, फिर news-b.example, और फिर news-c.example को करता है, तो हर साइट पर उन विषयों का फिर से हिसाब लगाया जाएगा. इसका मतलब है कि कॉल करने वाले (कॉलर) को अलग-अलग टॉप लेवल साइटों पर, किसी उपयोगकर्ता के लिए अलग-अलग विषय मिल सकते हैं. ऐसा इसलिए, क्योंकि किसी उपयोगकर्ता के लिए दिए गए (ज़्यादा से ज़्यादा) तीन विषय, पिछले तीन epoch (किसी भी विषय के बारे में सूचनाएं पाने की संभावना 5%) के लिए, पहले पांच में से किसी भी क्रम में चुने जाते हैं. इससे कॉलर के लिए, किसी उपयोगकर्ता को उसके विषयों के आधार पर पहचानना मुश्किल हो जाता है, क्योंकि ये अलग-अलग टॉप लेवल साइटों (यहां तक कि एक ही उपयोगकर्ता, कॉलर, और epoch) के लिए अलग-अलग हो सकते हैं.

डेटा की कैटगरी तय करने वाला मॉडल

50,000 टॉप डोमेन के लिए, मैन्युअल तौर पर विषय चुने जाते हैं. साथ ही, इस क्यूरेशन का इस्तेमाल क्लासिफ़ायर को ट्रेनिंग देने के लिए किया जाता है. यह सूची override_list.pb.gz में देखी जा सकती है. यह सूची, क्लासिफ़ायर टैब के मौजूदा मॉडल में chrome://topics-internals/ पर उपलब्ध है. सूची में मौजूद डोमेन-टू-टॉपिक असोसिएशन, मॉडल के आउटपुट के बजाय एपीआई की मदद से इस्तेमाल किए जाते हैं.

chrome://topics-internals पेज, जिसमें क्लासिफ़ायर पैनल चुना गया है.
chrome://topics-internals पेज पर क्लासिफ़ायर पैनल में मॉडल वर्शन, उसका पाथ, और सूची में शामिल हर होस्ट से जुड़े विषय शामिल होते हैं.

मॉडल को सीधे चलाने के लिए, मॉडल को चलाने के लिए TensorFlow की गाइड देखें.

override_list.pb.gz फ़ाइल की जांच करने के लिए, पहले उसे अनपैक करें:

gunzip -c override_list.pb.gz > override_list.pb

टेक्स्ट के तौर पर इसकी जांच करने के लिए, protoc का इस्तेमाल करें:

protoc --decode_raw < override_list.pb > output.txt

GitHub पर आईडी वाले विषयों की पूरी कैटगरी उपलब्ध है.

डेटा की कैटगरी तय करने वाले मॉडल के बारे में सुझाव/राय देना या शिकायत करना

Topics API के बारे में सुझाव/राय देने या शिकायत करने के लिए, कई चैनल उपलब्ध हैं. कैटगरी तय करने वाले मॉडल के बारे में सुझाव/राय देने या शिकायत करने के लिए, हमारा सुझाव है कि आप GitHub से जुड़ी समस्या सबमिट करें या किसी मौजूदा समस्या का जवाब दें. उदाहरण के लिए:

उपयोगकर्ता के शीर्ष पांच विषय कैसे चुने जाते हैं

एपीआई हर epoch के लिए एक विषय दिखाता है. ज़्यादा से ज़्यादा तीन epoch का इस्तेमाल किया जा सकता है. अगर तीन एपिसोड लौटाए जाते हैं, तो इसमें मौजूदा युग और पिछले दो के विषय शामिल होंगे.

  1. हर epoch के आखिर में, ब्राउज़र इन शर्तों को पूरा करने वाले पेजों की सूची बनाता है:
    • Epoch के दौरान, उपयोगकर्ता ने इस पेज पर विज़िट किया था.
    • पेज में ऐसा कोड मौजूद है जो document.browsingTopics() को कॉल करता है.
    • एपीआई चालू किया गया हो. उदाहरण के लिए, इसे उपयोगकर्ता ने ब्लॉक न किया हो या किसी रिस्पॉन्स हेडर के ज़रिए ब्लॉक न किया हो.
  2. ब्राउज़र, उपयोगकर्ता के डिवाइस पर, Topics API से मिले क्लासिफ़ायर मॉडल का इस्तेमाल करता है, ताकि विषयों की सूची में हर पेज के होस्टनेम को मैप किया जा सके.
  3. ब्राउज़र, विषयों की सूची इकट्ठा करता है.
  4. ब्राउज़र, फ़्रीक्वेंसी के हिसाब से पांच मुख्य विषयों की सूची जनरेट करता है.

इसके बाद, document.browsingTopics() तरीका, हर epoch के लिए पहले पांच में से कोई विषय दिखाता है. इस बात की 5% संभावना होती है कि इनमें से किसी भी विषय को, विषयों की पूरी कैटगरी में से किसी भी क्रम में चुना जा सकता है. Chrome में, उपयोगकर्ता अलग-अलग विषयों को हटा सकते हैं या अपना ब्राउज़िंग इतिहास मिटा सकते हैं. ऐसा करके, एपीआई से मिले विषयों की संख्या कम की जा सकती है. उपयोगकर्ता इस एपीआई से ऑप्ट-आउट भी कर सकते हैं.

chrome://topics-internals पेज से, मौजूदा epoch के दौरान देखे गए विषयों के बारे में जानकारी देखी जा सकती है.

एपीआई यह कैसे तय करता है कि किस कॉल करने वाले (कॉलर) को कौनसे विषय दिखेंगे

एपीआई कॉल करने वाले लोगों को सिर्फ़ वे विषय मिलते हैं जिन्हें उन्होंने हाल ही में देखा है. साथ ही, उपयोगकर्ता के लिए विषयों को हर epoch के बाद रीफ़्रेश किया जाता है. इसका मतलब है कि एपीआई एक रोलिंग विंडो उपलब्ध कराता है, जिसमें कॉलर को कुछ विषयों के बारे में जानकारी मिल सकती है.

नीचे दी गई टेबल में किसी एक epoch के दौरान, किसी उपयोगकर्ता के काल्पनिक ब्राउज़िंग इतिहास का उदाहरण (हालांकि, यह छोटा है) दिखाया गया है. इसमें उन साइटों से जुड़े विषय दिखाए गए हैं जिन पर उपयोगकर्ता विज़िट किया गया है. इसमें हर साइट पर मौजूद एपीआई कॉलर की जानकारी दी गई है (साइट पर मौजूद JavaScript कोड में document.browsingTopics() को कॉल करने वाली इकाइयां).

साइट विषय साइट पर एपीआई कॉलर
yoga.example फ़िटनेस adtech1.example adtech2.example
knitting.example क्राफ़्ट adtech1.example
हाइकिंग-holiday.example फ़िटनेस, यात्रा, और परिवहन adtech2.example
diy-clothing.example क्राफ़्ट, फ़ैशन, और स्टाइल [कोई नहीं]

Epoch के हिसाब से, Topics API हफ़्ते के लिए ब्राउज़र के सबसे लोकप्रिय विषय जनरेट करता है. फ़िलहाल, यह एक हफ़्ता है.

  • adtech1.example अब "फ़िटनेस" पाने के लिए तैयार है और "क्राफ़्ट" क्योंकि उसमें Yoga.example और knting.example पर भी ध्यान दिया गया था.
  • adtech1.example को "यात्रा और परिवहन" का विषय हो सकता है, क्योंकि यह उपयोगकर्ता के द्वारा हाल ही में विज़िट की गई ऐसी किसी भी साइट पर मौजूद नहीं है जो उस विषय से संबंधित है.
  • adtech2.example ने "फ़िटनेस" और "यात्रा और परिवहन" विषय देखे, लेकिन "क्राफ़्ट" नहीं देखे विषय.

उपयोगकर्ता ने diy-clothing.example पर विज़िट किया, जिसमें "फ़ैशन और स्टाइल" विषय है, लेकिन उस साइट पर Topics API पर कोई कॉल नहीं किया गया. इस स्थिति में, इसका मतलब है कि "फ़ैशन और स्टाइल" विषय को एपीआई की मदद से, किसी भी कॉलर के जवाब में नहीं लौटाया जाएगा.

दूसरे सप्ताह में, उपयोगकर्ता किसी अन्य साइट पर जाता है:

साइट विषय साइट पर एपीआई कॉलर
sewing.example क्राफ़्ट adtech2.example

इसके अलावा, adtech2.example के कोड को diy-clothing.example में जोड़ा गया है:

साइट विषय साइट पर एपीआई कॉलर
diy-clothing.example क्राफ़्ट, फ़ैशन, और स्टाइल adtech2.example

साथ ही, "फ़िटनेस" और "यात्रा और परिवहन" पहले हफ़्ते से, इसका मतलब है कि adtech2.example अब "Crafts" पा सकेगा और "फ़ैशन और स्टाइल" विषय — लेकिन अगले एपिसोड तक नहीं, तीसरा हफ़्ता. इससे यह पक्का होता है कि तीसरे पक्ष, कुकी इस्तेमाल करने वाले उपयोगकर्ताओं की पिछली चीज़ों (इस मामले में, फ़ैशन में दिलचस्पी) के बारे में ज़्यादा जानकारी नहीं दे सकते.

और दो हफ़्ते बाद, "फ़िटनेस" और "यात्रा और परिवहन" अगर उपयोगकर्ता adtech2.example के कोड वाली किसी साइट पर नहीं जाता है, तो वह adtech2.example की योग्य विषयों की सूची से बाहर हो सकता है.

उपयोगकर्ता के कंट्रोल, पारदर्शिता, और ऑप्ट आउट करना

उपयोगकर्ताओं को Topics API का मकसद समझना चाहिए, उनके बारे में क्या कहा जा रहा है, यह पता होना चाहिए, एपीआई का इस्तेमाल कब किया जा रहा है, और उन्हें इसे चालू या बंद करने के लिए कंट्रोल मिलने चाहिए.

इस एपीआई की मदद से, उपयोगकर्ता उन विषयों के बारे में जान सकते हैं और उन्हें कंट्रोल कर सकते हैं जो उनके ब्राउज़र से उनके लिए सुझाए जा सकते हैं. इस टेक्सॉनमी को लोग आसानी से पढ़ सकते हैं. उपयोगकर्ता उन विषयों को हटा सकते हैं जिन्हें वे खास तौर पर नहीं चाहते कि Topics API, विज्ञापन देने वालों या पब्लिशर के साथ शेयर करे. इसके अलावा, उपयोगकर्ता को एपीआई के बारे में जानकारी देने और इसे चालू या बंद करने का तरीका दिखाने के लिए कंट्रोल भी उपलब्ध हो सकते हैं. Chrome, chrome://settings/adPrivacy पर Topics API के लिए जानकारी और सेटिंग उपलब्ध कराता है. इसके अलावा, गुप्त मोड में एपीआई कॉल करने वालों के लिए विषय उपलब्ध नहीं होते. साथ ही, ब्राउज़िंग इतिहास मिटाने पर विषयों को भी मिटा दिया जाता है.

विषयों की सूची खाली होगी, अगर:

  • उपयोगकर्ता ने chrome://settings/adPrivacy पर ब्राउज़र सेटिंग के ज़रिए, Topics API से ऑप्ट आउट किया.
  • उपयोगकर्ता ने अपने विषयों को (chrome://settings/adPrivacy पर ब्राउज़र सेटिंग के ज़रिए) मिटा दिया है या अपनी कुकी मिटा दी हैं.
  • ब्राउज़र गुप्त मोड में है.

जानकारी में, निजता से जुड़े लक्ष्यों के बारे में ज़्यादा जानकारी दी गई है. साथ ही, यह भी बताया गया है कि एपीआई इन्हें कैसे पूरा करता है.

साइट से ऑप्ट आउट करना

उपयोगकर्ता ऑप्ट आउट करने के अलावा, अपनी साइट या उस पर मौजूद पेजों के लिए Topics से ऑप्ट आउट भी कर सकते हैं. डेवलपर गाइड में इसका तरीका बताया गया है.

prebid.js के साथ वेबसाइटों पर Topics API का इस्तेमाल करना

जैसा कि Prebid 7 की रिलीज़ में बताया गया है, समुदाय ने एक नए मॉड्यूल के ज़रिए Topics API के साथ ऐक्टिव तौर पर इंटिग्रेशन डेवलप किया. इस मॉड्यूल को दिसंबर 2022 में मर्ज कर दिया गया था.

यहां ज़्यादा जानें:

अगले चरण

लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें