बल्क डेटा एक्सपोर्ट: Search Console के डेटा को ऐक्सेस करने का नया और बेहतर तरीका

मंगलवार, 21 फ़रवरी, 2023

आज, हम बल्क डेटा एक्सपोर्ट का एलान कर रहे हैं. यह एक नई सुविधा है. इसकी मदद से, Search Console से Google BigQuery में डेटा को लगातार एक्सपोर्ट किया जा सकता है. (ध्यान दें कि इस सुविधा को रोल आउट होने में करीब एक हफ़्ता लगेगा. इसलिए, हो सकता है कि आपके पास तुरंत ऐक्सेस न हो.)

अपने BigQuery प्रोजेक्ट में हर दिन का डेटा डालने के लिए, Search Console में एक्सपोर्ट को कॉन्फ़िगर करें. इस डेटा में, पहचान छिपाकर की गई क्वेरी के अलावा, आपकी परफ़ॉर्मेंस का सारा डेटा शामिल होता है. इसे निजता की वजहों से फ़िल्टर करके बाहर निकाल दिया जाता है. दूसरे शब्दों में, बल्क डेटा एक्सपोर्ट पर हर दिन के डेटा की पंक्ति की सीमा का कोई असर नहीं पड़ता. इसका मतलब है कि अपने डेटा को भरपूर एक्सप्लोर किया जा सकता है और डेटा को दूसरे सोर्स के साथ जोड़ा जा सकता है. साथ ही, विश्लेषण और विज़ुअलाइज़ेशन की बेहतर तकनीकों का इस्तेमाल किया जा सकता है.

यह डेटा एक्सपोर्ट, उन बड़ी वेबसाइटों के लिए खास तौर पर मददगार साबित हो सकता है, जिनमें हज़ारों पेज होते हैं या जिन्हें एक दिन में हज़ारों क्वेरी से ट्रैफ़िक मिलता है (या दोनों!). छोटी और मध्यम साइज़ तक की साइट के पास, अपने सभी डेटा का ऐक्सेस पहले से ही होता है. जैसे, यूज़र इंटरफ़ेस, Looker Studio कनेक्टर (जिसे पहले Data Studio के नाम से जाना जाता था) या Search Analytics API.

बल्क डेटा एक्सपोर्ट करने की नई सुविधा सेट अप करना

नई रिपोर्ट कॉन्फ़िगर करने के लिए आपको BigQuery खाता सेट अप करना होगा, ताकि आपको डेटा मिल सके. साथ ही, Search Console की सेटिंग में जाकर अपनी जानकारी देनी होगी. सिलसिलेवार निर्देश के लिए, सहायता केंद्र पर जाएं, लेकिन आम तौर पर इस प्रोसेस को दो चरणों में बांटा गया है:

  1. (Google Cloud Console में) अपना Cloud प्रोजेक्ट तैयार करें: इसमें अपने प्रोजेक्ट के लिए BigQuery API चालू करना और अपने Search Console के सेवा खाते को अनुमति देना शामिल है.
  2. (Search Console में) एक्सपोर्ट करने की जगह सेट करें: इसमें, अपने Google Cloud प्रोजेक्ट आईडी की जानकारी देना और डेटासेट की जगह चुनना शामिल है. ध्यान दें कि सिर्फ़ प्रॉपर्टी के मालिक ही बल्क डेटा एक्सपोर्ट करने की सुविधा सेट अप कर सकते हैं.

Search Console के बल्क डेटा एक्सपोर्ट की सुविधा की सेटिंग वाला पेज

जानकारी को Search Console में सबमिट करने के बाद, यह डेटा एक्सपोर्ट को सिम्युलेट कर देगा. डेटा एक्सपोर्ट हो जाने पर, हम सभी प्रॉपर्टी के मालिकों को ईमेल से इसकी सूचना देंगे. साथ ही, आपका मौजूदा डेटा एक्सपोर्ट 48 घंटों के अंदर शुरू हो जाएगा. अगर एक्सपोर्ट सिम्युलेशन पूरा नहीं होता है, तो आपको उस समस्या की सूचना तुरंत मिलेगी. यहां एक्सपोर्ट करने में हो सकने वाली गड़बड़ियों की सूची दी गई है.

बल्क डेटा एक्सपोर्ट करने पर उपलब्ध डेटा

बल्क डेटा एक्सपोर्ट की सुविधा सेट अप होने के बाद, BigQuery खाते में लॉग इन करके, डेटा की क्वेरी की जा सकती है.

सहायता केंद्र में, टेबल के लिए बने दिशा-निर्देश और रेफ़रंस की पूरी जानकारी उपलब्ध है. साथ ही, डेटा को प्रॉपर्टी के हिसाब से और पेज के हिसाब से एग्रीगेट करने के फ़र्क़ की वजह भी जानें. इससे आपको डेटा को बेहतर ढंग से समझने में मदद मिलेगी. यहां आपके लिए उपलब्ध तीन टेबल के बारे में जानकारी दी गई है:

  • searchdata_site_impression: इस टेबल में प्रॉपर्टी के हिसाब से एग्रीगेट किया गया डेटा शामिल होता है. इसमें क्वेरी, देश, टाइप, और डिवाइस का डेटा शामिल होता है.
  • searchdata_url_impression: इस टेबल में यूआरएल के हिसाब से डेटा एग्रीगेट किया जाता है. इससे, क्वेरी और ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) की ज़्यादा जानकारी दिखती है.
  • ExportLog: इस टेबल में उस दिन सेव किए गए डेटा की जानकारी शामिल होती है. पूरे नहीं हो सके एक्सपोर्ट को इसमें शामिल नहीं किया जाता.
BigQuery इंटरफ़ेस में बल्क डेटा एक्सपोर्ट टेबल दिखती है

अगर डेटा के बारे में क्वेरी करने के लिए आपको थोड़ी मदद चाहिए, तो सहायता केंद्र में दी गई सैंपल क्वेरी देखें. इनके ज़रिए आसानी से शुरुआत की जा सकती है. यहां एक उदाहरण दिया गया है. इसमें हमने पेजों के यूआरएल कॉम्बिनेशन की सभी क्वेरी का डेटा एक्सपोर्ट किया है. इन पेजों में पिछले दो हफ़्तों के कम से कम 100 अक्सर पूछे जाने वाले सवालों के ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के इंप्रेशन मौजूद हैं.

SELECT
  url,
  query,
  sum(impressions) AS impressions,
  sum(clicks) AS clicks,
  sum(clicks) / sum(impressions) AS ctr,
  /* Added one below, because position is zero-based */
  ((sum(sum_position) / sum(impressions)) + 1.0) AS avg_position
/* Remember to update the table name to your table */
FROM searchconsole.searchdata_url_impression
WHERE search_type = 'WEB'
  AND is_tpf_faq = true
  AND data_date BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 14 day) AND CURRENT_DATE()
  AND clicks > 100
GROUP BY 1,2
ORDER BY clicks
LIMIT 1000

हमें उम्मीद है कि Google Search का ज़्यादा डेटा उपलब्ध कराकर, वेबसाइट के मालिक और एसईओ, लॉन्ग टेल क्वेरी का विश्लेषण करके कॉन्टेंट से जुड़े ज़्यादा मौके खोज पाएंगे. इसकी मदद से, इंंटरनल सिस्टम से Search के नतीजों में पेज लेवल की जानकारी को आसानी से जोड़ा जा सकता है. साथ ही, इस जानकारी को बेहतर और ज़्यादा असरदार बनाया जा सकता है.

हमेशा की तरह, अगर आपको कोई सवाल पूछना है या कोई समस्या है, तो कृपया Google Search Central कम्यूनिटी या Twitter पर हमसे संपर्क करें.