BigQuery की CrUX रिपोर्ट में रैंक की तीव्रता जोड़ना

फ़रवरी 2021 के डेटासेट से, हम BigQuery की CrUX रिपोर्ट में, प्रयोग के तौर पर शुरू की गई एक मेट्रिक जोड़ रहे हैं. इसकी मदद से, अलग-अलग ऑर्डर के हिसाब से ऑरिजिन की लोकप्रियता के बीच अंतर किया जा सकेगा: टॉप 10 हज़ार, टॉप 10 हज़ार, टॉप 100 हज़ार, टॉप 10 लाख, ...

आइए, देखते हैं कि यह कैसा दिखता है:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 1,00,000 90,000
4 10,00,000 9,00,000
15 10,000,000 72,64,371

फ़रवरी 2021 के ग्लोबल डेटा सेट के लिए, हमें 5 बकेट मिलती हैं. उम्मीद के मुताबिक, पंक्ति 1 में, हमें 1,000 ऑरिजिन दिखते हैं, जिनकी रैंक वैल्यू 1,000 है - जो हमारी मेट्रिक के हिसाब से 1,000 सबसे लोकप्रिय ऑरिजिन है. पंक्ति 2 हैरान करने वाली लग सकती है. इससे पता चलता है कि टॉप 10 हज़ार सेट में सिर्फ़ 9 हज़ार ऑरिजिन हैं. ऐसा इसलिए, क्योंकि पंक्ति 1 की ऑरिजिन भी टॉप 10 हज़ार सेट का हिस्सा हैं. प्रमुख 10 हज़ार ऑरिजिन चुनने के लिए, किसी व्यक्ति को क्वेरी करते समय प्रयोगात्मक.popularity.rank <= 10000 की जानकारी देनी होगी.

इस डेटासेट में किसी देश के हिसाब से रैंक का तीव्रता भी शामिल होता है. उदाहरण के लिए, इस क्वेरी में उन 10 हज़ार ऑरिजिन की सूची दी गई है जो जर्मनी में सबसे ज़्यादा लोकप्रिय हैं.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

आइए, जानते हैं कि हमारी नई लोकप्रियता मेट्रिक की संभावना के बारे में जानने के लिए, फ़र्स्ट कॉन्टेंटफ़ुल पेंट मेट्रिक (एफ़सीपी) को लेकर, वेब के लोकप्रियता सेगमेंट में क्या अंतर है. इस क्वेरी के लिए, हम एक सेकंड के अनुभव को तेज़ उपयोगकर्ता अनुभव मानते हैं.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

experimental.popularity.rank <= 1,000 वाले ऑरिजिन के लिए, क्वेरी में 1,000 मि॰से॰ से कम एफ़सीपी मेट्रिक वैल्यू के लिए सभी हिस्टोग्राम बकेट डेंसिटी को जोड़ा जाता है. इसके बाद, क्वेरी को ऑरिजिन की संख्या से भाग दिया जाता है. इसका मतलब है कि क्वेरी में, एक हज़ार सबसे लोकप्रिय ऑरिजिन के लिए, तेज़ एफ़सीपी लोड के औसत प्रतिशत का हिसाब लगाया जाता है. इस क्वेरी में, सभी ऑरिजिन की अहमियत एक जैसी है, इसलिए यह सही नहीं है. हालांकि, चलिए देखते हैं कि क्या नतीजा एक्सपेरिमेंट की क्षमता को बदलने के लिए संवेदनशील है. इसके लिए, जहां क्लॉज़ में एक्सपेरिमेंट.popularity.rank <= 10000 को तय करने के लिए बदलाव किया गया है. हम यह 10 हज़ार, 1 लाख, और इसी तरह के लिए करते हैं:

मूल की रैंक का परिमाण ऑरिजिन पर औसत, एफ़सीपी < 1s का प्रतिशत
1.000 53.6%
10,000 49.6%
1,00,000 45.9%
10,00,000 43.2%
10,000,000 39.9% से ज़्यादा हुई

इससे पता चलता है कि वेब पर तेज़ उपयोगकर्ता अनुभव और लोकप्रिय होने का संबंध है.

अक्टूबर 2022 के डेटासेट में, इसे हाफ़-रैंक के चरणों के हिसाब से बांट दिया गया था. इस डेटासेट के लिए पहली क्वेरी को फिर से चलाने पर, आधे-चरण और हर रैंक में ऑरिजिन की संख्या दिखती है::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 1,00,000 50,000
6 5,00,000 400,000
7 10,00,000 5,00,000
8 50,00,000 40,00,000
9 10,000,000 50,00,000
10 5,00,00,000 76,37,195

BigQuery पर CrUX इस्तेमाल करने के बारे में ज़्यादा जानें. साथ ही, क्वेरी के ज़्यादा उदाहरण देखने के लिए, CrUX Cookbook ब्राउज़ करने के बारे में ज़्यादा जानें. अगर आपको अपनी क्वेरी शेयर करनी हैं, तो उन्हें शेयर करें और हमें बताएं कि आपको कैसा कॉन्टेंट मिला.