BigQuery पर CrUX

BigQuery पर CrUX डेटा को स्ट्रक्चर्ड करने का तरीका जानें.

शुरुआती जानकारी

Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह डेटाबेस, Google Cloud पर होस्ट किया जाता है.

BigQuery पर CrUX की मदद से उपयोगकर्ता, 2017 के पूरे डेटासेट के लिए सीधे क्वेरी कर सकते हैं. उदाहरण के लिए, रुझानों का विश्लेषण करना, वेब टेक्नोलॉजी और मानदंड डोमेन की तुलना करना.

इस डेटा को हर महीने की रिलीज़ के हिसाब से बनाया जाता है. साथ ही, इसमें खास जानकारी वाली कई टेबल भी होती हैं, ताकि डेटा को आसानी से ऐक्सेस किया जा सके.

BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, SQL क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.

डेटासेट ऐक्सेस करना

BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और SQL की बुनियादी जानकारी होना ज़रूरी है. BigQuery पर CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टीयर की सीमा तक, इसे एक्सप्लोर किया जा सकता है. इसे हर महीने रिन्यू किया जाता है और BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ता, साइनअप क्रेडिट पा सकते हैं, ताकि फ़्री टियर के अलावा किए जाने वाले खर्चों को पूरा किया जा सके. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए, क्रेडिट कार्ड देना ज़रूरी है. ज़्यादा जानने के लिए, मुझे क्रेडिट कार्ड क्यों देना होगा? देखें.

अगर BigQuery का इस्तेमाल पहली बार किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:

  1. Google Cloud कंसोल में प्रोजेक्ट बनाएं पर जाएं.
  2. अपने नए प्रोजेक्ट को "मेरी Chrome UX रिपोर्ट" जैसा नाम दें और 'बनाएं' पर क्लिक करें.
  3. अनुरोध किए जाने पर बिलिंग की जानकारी दें.
  4. BigQuery में CrUX डेटासेट पर जाएं

अब आप डेटासेट के लिए क्वेरी करने के लिए तैयार हैं.

प्रोजेक्ट को व्यवस्थित करना

BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने को chrome-ux-report.all के तहत, नई टेबल के तौर पर रिलीज़ किया जाता है. यहां कई मटीरियलाइज़्ड टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.

ज़्यादा जानकारी वाला टेबल स्कीमा

हर देश और all डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से दी जाती हैं.

रॉ टेबल

रॉ टेबल में यह स्कीमा होता है:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

मटीरियलाइज़्ड टेबल स्कीमा

मटीरियलाइज़्ड टेबल कई मुख्य डाइमेंशन के ज़रिए खास जानकारी को आसानी से ऐक्सेस करने के लिए दी जाती हैं. कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस के डेटा को अलग-अलग हिस्सों में बांटा जाता है. इस उदाहरण में, metrics_summary टेबल की उदाहरण वाली पंक्तियों का एक सेट दिखाया गया है:

yyyymm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1,600
202203 https://example.com 0.9,209 0.052 0.0274 1,400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

इससे पता चलता है कि 202204 के डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव अच्छे एलसीपी की शर्त पूरी करता है. साथ ही, अनुमानित 75वां पर्सेंटाइल एलसीपी वैल्यू 1,600 मि॰से॰ है. यह पिछले महीनों की तुलना में थोड़ा धीमा है.

चार मटीरियलाइज़्ड टेबल दी गई हैं:

metrics_summary
महीने और शुरुआत की जगह के हिसाब से मुख्य मेट्रिक
device_summary
महीने, शुरुआत की जगह, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
महीने, शुरुआत की जगह, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
डेटासेट में शामिल सभी ऑरिजिन की सूची

metrics_summary

metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट की खास जानकारी वाले आंकड़े शामिल होते हैं:

yyyymm
डेटा इकट्ठा करने की अवधि का महीना
origin
साइट के ऑरिजिन का यूआरएल
rank
औसत लोकप्रियता की रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
परफ़ॉर्मेंस मेट्रिक का 75वां पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
सूचना की अनुमति के व्यवहार का हिस्सा
[desktop|phone|tablet]Density
डिवाइस के नाप या आकार के हिसाब से, ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
असरदार कनेक्शन टाइप के हिसाब से, ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
नेविगेशन टाइप का हिस्सा

device_summary

device_summary टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से इकट्ठा किए गए आंकड़े मौजूद हैं. metrics_summary कॉलम के अलावा:

device
डिवाइस का डिवाइस का नाप या आकार

country_summary

country_summary टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से इकट्ठा किए गए आंकड़े मौजूद हैं. metrics_summary कॉलम के अलावा:

country_code
दो अक्षर वाला देश कोड
device
डिवाइस का डिवाइस का नाप या आकार

origin_summary

origin_summary टेबल में CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची शामिल होती है. इसे डेटासेट में ऑरिजिन की नई सूची के साथ हर महीने अपडेट किया जाता है और इसमें एक कॉलम होता है: origin.

एक्सपेरिमेंट के लिए उपलब्ध डेटासेट

एक्सपेरिमेंट के तौर पर उपलब्ध डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की हूबहू कॉपी होती हैं. हालांकि, उनमें पार्टिशनिंग और क्लस्टरिंग जैसी नई और ज़्यादा बेहतर BigQuery सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, तेज़ी से, आसान, और सस्ती क्वेरी लिखी जा सकती हैं.

country

experimental.country डेटासेट में, country_CC डेटासेट से इकट्ठा किया गया डेटा होता है. इस डेटा में, डेटासेट की तारीख के लिए एक और yyyymm कॉलम होता है. स्कीमा, तारीख और country_code कॉलम जोड़ने वाली रॉ टेबल की तरह होता है. इससे समय के साथ देश के लेवल की तुलना की जा सकती है, लेकिन महीने की टेबल को जोड़े बिना ही क्वेरी चलाई जा सकती हैं.

global

experimental.global डेटासेट में, all डेटासेट से इकट्ठा किया गया डेटा होता है. इस डेटा में, डेटासेट की तारीख के लिए एक और yyyymm कॉलम होता है. स्कीमा, तारीख के साथ रॉ टेबल की तरह होता है. इससे हर महीने की टेबल में शामिल हुए बिना, टाइम के साथ क्वेरी को एक्ज़ीक्यूट किया जा सकता है.