دراسة مقارنة

دراسة مقارنة لتنسيق WebP وJPEG وJPEG 2000، أيلول (سبتمبر) 2010

ملاحظة: لقد أجرينا هذه الدراسة الأولية باستخدام الإصدار الأول من تنسيق WebP. الذي أطلقناه، والذي استخدم مكتبة libvpx. بالإضافة إلى ذلك، لا يمكن لمصدر الصور هي صور JPEG قمنا بالزحف إليها من الويب. استنادًا إلى ملاحظات من المجتمع، لقد أجرينا الآن دراسة جديدة باستخدام الإصدار 0.1.2 من libwebp بدءًا بالصور بدون فقدان البيانات (PNG) كمصدر. تحل الدراسة الجديدة محل هذا دراسة.

أجرى فريق WebP دراسة مقارنة لثلاث طرق لضغط الصور على مجموعة عشوائية تضم مليون صورة. كانت أهداف الدراسة هي قياس الضغط الذي تحققه هذه الطرق وتحليل المفاضلات بين أحجام الصور والضغط.

وتم تطبيق ثلاث طرق للضغط، وهي WebP وJPEG 2000 وRe-JPEG على 900,000 صورة بتنسيق JPEG ضمن مجموعة البيانات. تم إعادة ضغط الصور بتنسيق JPEG. باستخدام إعادة JPEG بحيث يكون كل منها أقرب ما يمكن إلى الذروة المستهدفة نسبة الإشارة إلى الضوضاء (PSNR). تم تحليل الفريق على الصور بعد ضغطها.

بالإضافة إلى الدراسة الواسعة النطاق، أجرى الفريق فحصًا يدويًا لـ 100 واكتشفت أن تنسيق WebP يوفر في معظم الحالات جودة مرئية مقبولة.

الاستنتاجات

ويتيح تنسيق WebP ضغطًا أعلى من JPEG أو JPEG 2000 بشكل عام. المكاسب في تصغير حجم الملف تكون عالية بشكل خاص للصور الأصغر التي تكون الأكثر شيوعًا على الويب.

مجموعة البيانات

كانت مجموعة البيانات المستخدمة في الدراسة عبارة عن مجموعة من مليون صورة عشوائيًا عينة من مستودع الصور التي تم الزحف إليها من الويب. يعرض الجدول التالي توزيع أنواع مختلفة من الصور في مجموعة البيانات.

النوع الإحصاء
JPEG 900 ألف تقريبًا
PNG 47 ألف
GIF 47 ألف
غير ذلك 6 آلاف تقريبًا

تصميم التجربة

تم إجراء التجارب على مرحلتين:

  1. استخدم الفريق تنسيق WebP على الصور مع نسبة PSNR المستهدفة تبلغ 42. ضبطوا مَعلمة الجودة (QP) لبرنامج الترميز WebP إلى أن يتم تحقيق نتيجة كان أقرب إلى 42 نقطة ممكنة لصورة معينة. القيمة الفعلية بالتالي، تم تحقيق نسبة PSNR لكل صورة، ولم يكن بالضرورة أن تكون 42.

  2. استخدَم الفريق قيمة PSNR للصور المضغوطة باستخدام WebP كهدف. PSNR للصور بتنسيق JPEG 2000 وRe-JPEG وأدّوا أيضًا خطًا فابحث عبر معلمات الجودة لصور JPEG 2000 وJPEG في لتقترب قدر الإمكان من هدف PSNR المستهدف.

تم قياس نتيجة الضغط الفعلية كنسبة مئوية باستخدام ما يلي: المعادلة:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

النتائج

أسفرت الاختبارات عن النتائج التالية للنتائج السلبية وغير السالبة زيادة الضغط:

اكتساب الضغط غير السالب

لم يجر الفريق عقوبة على طريقة إذا أدت هذه الطريقة إلى زيادة حجم الصورة بعد الضغط. وهذا يعني أنّ النسبة المئوية للضغط تساوي 0 عندما كان مضغوط_image.length أكبر من original_image.length.

اكتساب الضغط السلبي

سمح الفريق بتحسين النسب المئوية للضغط السالب التعرّف على الضواغط المختلفة الأداء الأولي.

في ما يلي متوسط النسب المئوية للضغط التي تم تحقيقها بواسطة كل من الطرق الثلاث.

النوع متوسط PSNR الذي تم الحصول عليه متوسط الضغط %
(زيادة الضغط غير سالبة)
متوسط الضغط %
(زيادة الضغط السلبية)
تنسيق WebP 39.38 41.30 39.80
JPEG 2000 39.49 27.67 9.71
Re-JPEG 39.36 22.37 14.62

عند السماح بزيادة الضغط السلبي، يكون متوسط أداء JPEG كان عام 2000 أقل من قيمة JPEG. قد يرجع ذلك إلى وجود عناصر عالية التكرار موجود في صور JPEG؛ يمكن أن تساهم هذه الأدوات في وضع ضغط أقل من المثالي.

تطبيق Kakadu المستخدَم في التجربة للتحويل إلى تنسيق JPEG 2000 تعذّر تحويل ما يقرب من 240,000 صورة.

كان الملف JPEG 2000 يحتوي على نسب ضغط أقل من Re-JPEG، ويرجع ذلك أساسًا إلى أنه كانت نتيجة JPEG 2000 عبارة عن ضغط سلبي للعديد من الصور. لذلك فإن صور JPEG حققت نتيجة ضغط إجمالية أقل.

توضح الأشكال التالية الرسوم البيانية للتوزيع للطرق الثلاث:

الشكل 1: توزيع السكان حسب حجم الصورة

يوضح الرسم البياني أن معظم الصور كانت صغيرة. تردد الصور التي يزيد حجمها عن 500 كيلوبايت يكون عمومًا أقل من 100.

الشكل 2: النسب المئوية للضغط للصور بتنسيق WebP وJPEG وJPEG 2000

يوضح هذا الرسم البياني أن نص الصور المضغوطة باستخدام تنسيق WebP قد حصل ضغط أفضل من re-jpeg وjpeg 2000. أيضًا، يتم ضغط الصور باستخدام تنسيق WebP بشكل إيجابي أكثر من الأنواع الأخرى.

الشكل 3: مقارنة بين أحجام الصور والنسبة المئوية للضغط

يوضّح هذا الرسم البياني أنّ تنسيق WebP يحقق ضغطًا أفضل من التنسيقات الأخرى خاصةً للصور الأصغر.