कंपैरेटिव स्टडी

WebP, JPEG, और JPEG 2000 की तुलनात्मक अध्ययन, सितंबर 2010

ध्यान दें: हमने यह शुरुआती स्टडी WebP के पहले वर्शन के साथ की थी जिसे हमने रिलीज़ किया था, जिसमें libvpx लाइब्रेरी का इस्तेमाल किया गया था. इसके अलावा, सोर्स इमेज JPEG इमेज थीं जिन्हें हमने वेब से क्रॉल किया था. इनसे मिले सुझाव/शिकायत/राय के आधार पर कम्यूनिटी के लिए, हमने अब एक पहल की है. libwebp के 0.1.2 वर्शन के साथ नई स्टडी इसकी शुरुआत सोर्स के तौर पर लॉसलेस इमेज (पीएनजी) से होती है. नए अध्ययन ने इसकी जगह ले ली पढ़ाई.

WebP टीम ने इमेज को कंप्रेस करने के तीन तरीकों की तुलना करके, एक स्टडी की से ज़्यादा इमेज नहीं दिखेंगी. स्टडी का मकसद, कारोबार को उन उन तरीकों से किया गया कंप्रेशन और ट्रेड-ऑफ़ का विश्लेषण करने के लिए इमेज के साइज़ और कंप्रेस करने की अवधि के बीच में बदलाव कर सकते हैं.

तीन संपीड़न विधियों, WebP, JPEG 2000 और Re-JPEG, को डेटा सेट में 9,00,000 JPEG इमेज शामिल हैं. JPEG इमेज फिर से कंप्रेस की गईं साथ ही, Re-JPEG फ़ॉर्मैट में पेमेंट की प्रोसेस पूरी करें, ताकि हर इमेज, टारगेट पीक के सबसे करीब रहे सिग्नल-टू-नॉइज़ रेशियो (पीएसएनआर) की वैल्यू. टीम ने इन तस्वीरों का विश्लेषण किया उन्हें कंप्रेस करने के बाद.

बड़े स्तर पर किए गए अध्ययन के अलावा, टीम ने बिना किसी क्रम के इमेज से हमें पता चलता है कि ज़्यादातर मामलों में WebP, अच्छी विज़ुअल क्वालिटी देता है.

मीटिंग में सामने आए नतीजे

WebP का कंप्रेशन, JPEG या JPEG 2000 से ज़्यादा होता है. लाभ फ़ाइल का साइज़ छोटा करने की सुविधा, खास तौर पर ऐसी छोटी इमेज के लिए ज़्यादा होती है जो सबसे ज़्यादा खोजे गए हैं.

डेटा सेट

इस स्टडी में इस्तेमाल किए गए डेटा सेट में, बिना किसी क्रम के 10 लाख इमेज का कलेक्शन था यह डेटा, वेब से क्रॉल की गई इमेज के डेटा स्टोर करने की जगह से लिया गया है. नीचे दी गई टेबल डेटा सेट में अलग-अलग तरह की इमेज के डिस्ट्रिब्यूशन को दिखाता है.

टाइप गिनती
JPEG ~9 लाख
PNG ~47 हज़ार
GIF ~47 हज़ार
अन्य 6 हज़ार

एक्सपेरिमेंट डिज़ाइन

एक्सपेरिमेंट दो चरणों में चलाए गए:

  1. टीम ने 42 के टारगेट पीएसएनआर के साथ इमेज पर WebP चलाया. उन्होंने WebP एन्कोडर के लिए क्वालिटी पैरामीटर (QP) को तब तक इस्तेमाल करें, जब तक कि उनसे कोई नतीजा न मिल जाए यह संख्या, किसी एक इमेज के लिए 42 के करीब थी. असल इसलिए, यह ज़रूरी नहीं है कि हर इमेज के लिए पीएसएनआर की जानकारी मिले. यह ज़रूरी नहीं है कि यह दर 42 हो.

  2. टीम ने टारगेट के तौर पर WebP-कंप्रेस की गई इमेज के लिए, पीएसएनआर वैल्यू का इस्तेमाल किया JPEG 2000 और फिर से JPEG इमेज के लिए पीएसएनआर. उन्होंने एक लाइन भी परफ़ॉर्म की में JPEG 2000 और JPEG इमेज के गुणवत्ता पैरामीटर में खोजें टारगेट पीएसएनआर के जितना हो सके उतना करीब आए.

नीचे दिए गए विकल्पों का इस्तेमाल करके, वास्तविक कंप्रेशन के नतीजे को प्रतिशत के तौर पर मापा गया फ़ॉर्मूला:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

नतीजे

जांच में नेगेटिव और नॉन-नेगेटिव, दोनों तरह के नतीजे मिले कंप्रेशन गेन:

नॉन-नेगेटिव कंप्रेशन गेन

अगर किसी तरीके से इमेज का साइज़ बढ़ता है, तो उस तरीके पर कोई कार्रवाई नहीं की जाती संपीड़न के बाद. इसका मतलब है कि compression_percentage को 0 माना गया था जब कंप्रेस की गई इमेज की लंबाई,original_image.length से ज़्यादा थी.

नेगेटिव कंप्रेशन गेन

टीम ने नेगेटिव कंप्रेशन प्रतिशत के नतीजों को बेहतर बनाने की अनुमति दी इस बात की समझ है कि अलग-अलग तरह के कंप्रेसर खराब परफ़ॉर्मेंस.

नीचे दिए गए औसत कंप्रेशन प्रतिशत हैं, जो हर विकल्प मिलता है.

टाइप मिलने वाला औसत पीएसएनआर औसत संपीड़न %
(गैर-ऋणात्मक संपीड़न लाभ)
औसत कंप्रेशन %
(नेगेटिव कंप्रेशन गेन)
WebP 39.38 41.30 39.80
JPEG 2000 39.49 27.67 9.71
Re-JPEG 39.36 22.37 14.62

नेगेटिव कंप्रेशन गेन की अनुमति मिलने पर, JPEG के लिए औसत परफ़ॉर्मेंस 2000, JPEG के फ़ॉर्मैट से कम था. ऐसा, हाई फ़्रीक्वेंसी वाले आर्टफ़ैक्ट की वजह से हो सकता है JPEG इमेज में मौजूद होना चाहिए; इन आर्टफ़ैक्ट की मदद से, कम-आदर्श संपीड़न स्थिति.

प्रयोग में इस्तेमाल किए गए Kakadu को JPEG 2000 में बदलने के लिए करीब 2,40,000 इमेज को बदला नहीं जा सका.

JPEG 2000 में Re-JPEG की तुलना में कम संपीड़न प्रतिशत था, क्योंकि कई इमेज के लिए JPEG 2000 नतीजा नेगेटिव कंप्रेस किया गया था. इसके लिए की वजह से JPEG इमेज का कुल कंप्रेशन स्कोर कम रहा.

नीचे दिए गए आंकड़े, तीन तरीकों के लिए डिस्ट्रिब्यूशन ग्राफ़ दिखाते हैं:

इमेज 1: इमेज के साइज़ के आधार पर जनसंख्या का डिस्ट्रिब्यूशन

ग्राफ़ दिखाता है कि ज़्यादातर इमेज छोटी थीं. वीडियो की फ़्रीक्वेंसी जिन इमेज का साइज़ 500K से ज़्यादा होता है वे आम तौर पर 100 से कम होती हैं.

दूसरी इमेज: WebP, JPEG, और JPEG 2000 इमेज के लिए कंप्रेस करने का प्रतिशत

यह ग्राफ़ दिखाता है कि WebP की मदद से कंप्रेस की गई तस्वीरों के मुख्य हिस्से को री-jpeg और jpeg 2000 की तुलना में बेहतर कंप्रेस करना. साथ ही, कंप्रेस की गई तस्वीरें WebP फ़ॉर्मैट को, अन्य फ़ाइलों की तुलना में ज़्यादा पॉज़िटिव कंप्रेशन मिलता है.

तीसरी इमेज: इमेज के साइज़ और कंप्रेस करने के प्रतिशत की तुलना

इस ग्राफ़ से पता चलता है कि WebP फ़ॉर्मैट, अन्य फ़ॉर्मैट की तुलना में बेहतर कंप्रेशन देता है, खासकर छोटी इमेज के लिए.