इस पेज का अनुवाद Cloud Translation API से किया गया है.

BigQuery की CrUX रिपोर्ट में रैंक की तीव्रता जोड़ना

Johannes Henkel

Barry Pollard

फ़रवरी 2021 के डेटासेट से, हम BigQuery की CrUX रिपोर्ट में, प्रयोग के तौर पर शुरू की गई एक मेट्रिक जोड़ रहे हैं. इसकी मदद से, अलग-अलग ऑर्डर के हिसाब से ऑरिजिन की लोकप्रियता के बीच अंतर किया जा सकेगा: टॉप 10 हज़ार, टॉप 10 हज़ार, टॉप 100 हज़ार, टॉप 10 लाख, ...

आइए, देखते हैं कि यह कैसा दिखता है:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

पंक्ति	rank_magnitude	num_origins
1	1,000	1,000
2	10,000	9,000
3	1,00,000	90,000
4	10,00,000	9,00,000
15	10,000,000	72,64,371

फ़रवरी 2021 के ग्लोबल डेटा सेट के लिए, हमें 5 बकेट मिलती हैं. उम्मीद के मुताबिक, पंक्ति 1 में, हमें 1,000 ऑरिजिन दिखते हैं, जिनकी रैंक वैल्यू 1,000 है - जो हमारी मेट्रिक के हिसाब से 1,000 सबसे लोकप्रिय ऑरिजिन है. पंक्ति 2 हैरान करने वाली लग सकती है. इससे पता चलता है कि टॉप 10 हज़ार सेट में सिर्फ़ 9 हज़ार ऑरिजिन हैं. ऐसा इसलिए, क्योंकि पंक्ति 1 की ऑरिजिन भी टॉप 10 हज़ार सेट का हिस्सा हैं. प्रमुख 10 हज़ार ऑरिजिन चुनने के लिए, किसी व्यक्ति को क्वेरी करते समय प्रयोगात्मक.popularity.rank <= 10000 की जानकारी देनी होगी.

इस डेटासेट में किसी देश के हिसाब से रैंक का तीव्रता भी शामिल होता है. उदाहरण के लिए, इस क्वेरी में उन 10 हज़ार ऑरिजिन की सूची दी गई है जो जर्मनी में सबसे ज़्यादा लोकप्रिय हैं.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

आइए, जानते हैं कि हमारी नई लोकप्रियता मेट्रिक की संभावना के बारे में जानने के लिए, फ़र्स्ट कॉन्टेंटफ़ुल पेंट मेट्रिक (एफ़सीपी) को लेकर, वेब के लोकप्रियता सेगमेंट में क्या अंतर है. इस क्वेरी के लिए, हम एक सेकंड के अनुभव को तेज़ उपयोगकर्ता अनुभव मानते हैं.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

experimental.popularity.rank <= 1,000 वाले ऑरिजिन के लिए, क्वेरी में 1,000 मि॰से॰ से कम एफ़सीपी मेट्रिक वैल्यू के लिए सभी हिस्टोग्राम बकेट डेंसिटी को जोड़ा जाता है. इसके बाद, क्वेरी को ऑरिजिन की संख्या से भाग दिया जाता है. इसका मतलब है कि क्वेरी में, एक हज़ार सबसे लोकप्रिय ऑरिजिन के लिए, तेज़ एफ़सीपी लोड के औसत प्रतिशत का हिसाब लगाया जाता है. इस क्वेरी में, सभी ऑरिजिन की अहमियत एक जैसी है, इसलिए यह सही नहीं है. हालांकि, चलिए देखते हैं कि क्या नतीजा एक्सपेरिमेंट की क्षमता को बदलने के लिए संवेदनशील है. इसके लिए, जहां क्लॉज़ में एक्सपेरिमेंट.popularity.rank <= 10000 को तय करने के लिए बदलाव किया गया है. हम यह 10 हज़ार, 1 लाख, और इसी तरह के लिए करते हैं:

मूल की रैंक का परिमाण	ऑरिजिन पर औसत, एफ़सीपी < 1s का प्रतिशत
1.000	53.6%
10,000	49.6%
1,00,000	45.9%
10,00,000	43.2%
10,000,000	39.9% से ज़्यादा हुई

इससे पता चलता है कि वेब पर तेज़ उपयोगकर्ता अनुभव और लोकप्रिय होने का संबंध है.

अक्टूबर 2022 के डेटासेट में, इसे हाफ़-रैंक के चरणों के हिसाब से बांट दिया गया था. इस डेटासेट के लिए पहली क्वेरी को फिर से चलाने पर, आधे-चरण और हर रैंक में ऑरिजिन की संख्या दिखती है::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

पंक्ति	rank_magnitude	num_origins
1	1,000	1,000
2	5,000	4,000
3	10,000	5,000
4	50,000	40,000
5	1,00,000	50,000
6	5,00,000	400,000
7	10,00,000	5,00,000
8	50,00,000	40,00,000
9	10,000,000	50,00,000
10	5,00,00,000	76,37,195

BigQuery पर CrUX इस्तेमाल करने के बारे में ज़्यादा जानें. साथ ही, क्वेरी के ज़्यादा उदाहरण देखने के लिए, CrUX Cookbook ब्राउज़ करने के बारे में ज़्यादा जानें. अगर आपको अपनी क्वेरी शेयर करनी हैं, तो उन्हें शेयर करें और हमें बताएं कि आपको कैसा कॉन्टेंट मिला.