मंगलवार, 21 फ़रवरी, 2023
आज, हम बल्क डेटा एक्सपोर्ट का एलान कर रहे हैं. यह एक नई सुविधा है. इसकी मदद से, Search Console से Google BigQuery में डेटा को लगातार एक्सपोर्ट किया जा सकता है. (ध्यान दें कि इस सुविधा को रोल आउट होने में करीब एक हफ़्ता लगेगा. इसलिए, हो सकता है कि आपके पास तुरंत ऐक्सेस न हो.)
अपने BigQuery प्रोजेक्ट में हर दिन का डेटा डालने के लिए, Search Console में एक्सपोर्ट को कॉन्फ़िगर करें. इस डेटा में, पहचान छिपाकर की गई क्वेरी के अलावा, आपकी परफ़ॉर्मेंस का सारा डेटा शामिल होता है. इसे निजता की वजहों से फ़िल्टर करके बाहर निकाल दिया जाता है. दूसरे शब्दों में, बल्क डेटा एक्सपोर्ट पर हर दिन के डेटा की पंक्ति की सीमा का कोई असर नहीं पड़ता. इसका मतलब है कि अपने डेटा को भरपूर एक्सप्लोर किया जा सकता है और डेटा को दूसरे सोर्स के साथ जोड़ा जा सकता है. साथ ही, विश्लेषण और विज़ुअलाइज़ेशन की बेहतर तकनीकों का इस्तेमाल किया जा सकता है.
यह डेटा एक्सपोर्ट, उन बड़ी वेबसाइटों के लिए खास तौर पर मददगार साबित हो सकता है, जिनमें हज़ारों पेज होते हैं या जिन्हें एक दिन में हज़ारों क्वेरी से ट्रैफ़िक मिलता है (या दोनों!). छोटी और मध्यम साइज़ तक की साइट के पास, अपने सभी डेटा का ऐक्सेस पहले से ही होता है. जैसे, यूज़र इंटरफ़ेस, Looker Studio कनेक्टर (जिसे पहले Data Studio के नाम से जाना जाता था) या Search Analytics API.
बल्क डेटा एक्सपोर्ट करने की नई सुविधा सेट अप करना
नई रिपोर्ट कॉन्फ़िगर करने के लिए आपको BigQuery खाता सेट अप करना होगा, ताकि आपको डेटा मिल सके. साथ ही, Search Console की सेटिंग में जाकर अपनी जानकारी देनी होगी. सिलसिलेवार निर्देश के लिए, सहायता केंद्र पर जाएं, लेकिन आम तौर पर इस प्रोसेस को दो चरणों में बांटा गया है:
- (Google Cloud Console में) अपना Cloud प्रोजेक्ट तैयार करें: इसमें अपने प्रोजेक्ट के लिए BigQuery API चालू करना और अपने Search Console के सेवा खाते को अनुमति देना शामिल है.
- (Search Console में) एक्सपोर्ट करने की जगह सेट करें: इसमें, अपने Google Cloud प्रोजेक्ट आईडी की जानकारी देना और डेटासेट की जगह चुनना शामिल है. ध्यान दें कि सिर्फ़ प्रॉपर्टी के मालिक ही बल्क डेटा एक्सपोर्ट करने की सुविधा सेट अप कर सकते हैं.
जानकारी को Search Console में सबमिट करने के बाद, यह डेटा एक्सपोर्ट को सिम्युलेट कर देगा. डेटा एक्सपोर्ट हो जाने पर, हम सभी प्रॉपर्टी के मालिकों को ईमेल से इसकी सूचना देंगे. साथ ही, आपका मौजूदा डेटा एक्सपोर्ट 48 घंटों के अंदर शुरू हो जाएगा. अगर एक्सपोर्ट सिम्युलेशन पूरा नहीं होता है, तो आपको उस समस्या की सूचना तुरंत मिलेगी. यहां एक्सपोर्ट करने में हो सकने वाली गड़बड़ियों की सूची दी गई है.
बल्क डेटा एक्सपोर्ट करने पर उपलब्ध डेटा
बल्क डेटा एक्सपोर्ट की सुविधा सेट अप होने के बाद, BigQuery खाते में लॉग इन करके, डेटा की क्वेरी की जा सकती है.
सहायता केंद्र में, टेबल के लिए बने दिशा-निर्देश और रेफ़रंस की पूरी जानकारी उपलब्ध है. साथ ही, डेटा को प्रॉपर्टी के हिसाब से और पेज के हिसाब से एग्रीगेट करने के फ़र्क़ की वजह भी जानें. इससे आपको डेटा को बेहतर ढंग से समझने में मदद मिलेगी. यहां आपके लिए उपलब्ध तीन टेबल के बारे में जानकारी दी गई है:
searchdata_site_impression
: इस टेबल में प्रॉपर्टी के हिसाब से एग्रीगेट किया गया डेटा शामिल होता है. इसमें क्वेरी, देश, टाइप, और डिवाइस का डेटा शामिल होता है.searchdata_url_impression
: इस टेबल में यूआरएल के हिसाब से डेटा एग्रीगेट किया जाता है. इससे, क्वेरी और ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) की ज़्यादा जानकारी दिखती है.ExportLog
: इस टेबल में उस दिन सेव किए गए डेटा की जानकारी शामिल होती है. पूरे नहीं हो सके एक्सपोर्ट को इसमें शामिल नहीं किया जाता.
अगर डेटा के बारे में क्वेरी करने के लिए आपको थोड़ी मदद चाहिए, तो सहायता केंद्र में दी गई सैंपल क्वेरी देखें. इनके ज़रिए आसानी से शुरुआत की जा सकती है. यहां एक उदाहरण दिया गया है. इसमें हमने पेजों के यूआरएल कॉम्बिनेशन की सभी क्वेरी का डेटा एक्सपोर्ट किया है. इन पेजों में पिछले दो हफ़्तों के कम से कम 100 अक्सर पूछे जाने वाले सवालों के ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के इंप्रेशन मौजूद हैं.
SELECT url, query, sum(impressions) AS impressions, sum(clicks) AS clicks, sum(clicks) / sum(impressions) AS ctr, /* Added one below, because position is zero-based */ ((sum(sum_position) / sum(impressions)) + 1.0) AS avg_position /* Remember to update the table name to your table */ FROM searchconsole.searchdata_url_impression WHERE search_type = 'WEB' AND is_tpf_faq = true AND data_date BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 14 day) AND CURRENT_DATE() AND clicks > 100 GROUP BY 1,2 ORDER BY clicks LIMIT 1000
हमें उम्मीद है कि Google Search का ज़्यादा डेटा उपलब्ध कराकर, वेबसाइट के मालिक और एसईओ, लॉन्ग टेल क्वेरी का विश्लेषण करके कॉन्टेंट से जुड़े ज़्यादा मौके खोज पाएंगे. इसकी मदद से, इंंटरनल सिस्टम से Search के नतीजों में पेज लेवल की जानकारी को आसानी से जोड़ा जा सकता है. साथ ही, इस जानकारी को बेहतर और ज़्यादा असरदार बनाया जा सकता है.
हमेशा की तरह, अगर आपको कोई सवाल पूछना है या कोई समस्या है, तो कृपया Google Search Central कम्यूनिटी या Twitter पर हमसे संपर्क करें.