مطالعه فشرده سازی WebP

ما یک ارزیابی مقایسه ای از فشرده سازی تصویر WebP و JPEG بر اساس رمزگذار جدیدی که در libwebp منتشر کردیم، انجام می دهیم. هدف اجرای مجموعه‌ای از آزمایش‌های قابل تکرار با استفاده از ابزارهای عمومی و مقایسه فشرده‌سازی تصویر به‌دست‌آمده توسط WebP و JPEG است.

مطالعه مقایسه ای قبلی ما از WebP بر ارزیابی تعداد زیادی از تصاویر متمرکز بود و بر روی منابع JPEG که از وب خزیده شده بودند انجام شد. JPEG یک فرمت فشرده سازی با اتلاف است و مصنوعات فشرده سازی را به منبع معرفی می کند. علاوه بر این، ما در ابتدا از نسبت سیگنال به نویز پیک یا PSNR به عنوان معیار کیفیت استفاده کردیم. PSNR دارای معایبی است هنگامی که به عنوان معیار کیفیت تصاویر استفاده می شود. بر اساس بازخورد جامعه، ما آزمایش‌هایی را روی تصاویر PNG از جمله تصاویر موجود در چند مجموعه آزمایشی استاندارد انجام می‌دهیم. ما در این مطالعه از تشابه ساختاری یا SSIM به عنوان معیار کیفیت برای این مطالعه استفاده می کنیم. SSIM معیار کیفیت بصری بهتری در نظر گرفته می شود .

ما دو نوع ارزیابی را شرح می دهیم. در مورد اول، فشرده سازی اضافی بدست آمده توسط WebP را در همان سطح کیفی JPEG مطالعه می کنیم. به طور خاص، ما تصاویر WebP با کیفیت مشابه تصاویر JPEG (بر اساس شاخص SSIM) تولید می‌کنیم و سپس اندازه فایل‌های تصاویر WebP و JPEG را مقایسه می‌کنیم. در مورد دوم، نمودارهای SSIM در مقابل بیت در پیکسل (bpp) را برای WebP و JPEG تجزیه و تحلیل می‌کنیم. این نمودارها مبادله اعوجاج نرخ را برای WebP و JPEG نشان می دهد.

مجموعه داده‌های آزمایش‌ها شامل تصاویر PNG است. این تصاویر از مجموعه‌های تصویر تست استاندارد در دسترس عموم و همچنین مجموعه بزرگی از تصاویر PNG که از وب خزیده شده‌اند، به دست آمده‌اند.

هر آزمایش شامل اجرای مجموعه ای از دستورات است. فقط از ابزارهای خط فرمان در دسترس عموم استفاده می‌شود تا آزمایش‌ها را به‌طور منطقی برای دیگران قابل تکرار نگه دارند. ابزارهای خط فرمان مورد استفاده برای این آزمایش عبارتند از:

  • identify و convert ابزارهای خط فرمان هستند که بخشی از ImageMagick هستند. ما برای این تحلیل از نسخه 6.5.7 استفاده کردیم. ما از convert برای تبدیل بین فرمت های PNG و PPM استفاده کردیم. ما از identify برای استخراج اطلاعات عرض و ارتفاع یک تصویر استفاده کردیم.

  • cwebp و dwebp ابزارهای خط فرمان هستند که بخشی از کتابخانه libwebp هستند که در سه ماهه اول 2011 منتشر کردیم. ما از نسخه 0.1.2 کتابخانه استفاده کردیم. ما از cwebp و dwebp برای رمزگذاری و رمزگشایی تصاویر WebP استفاده کردیم. ما از پارامترهای رمزگشایی و رمزگشایی پیش‌فرض این ابزارها استفاده کردیم.

  • cjpeg و djpeg ابزارهای خط فرمان هستند که بخشی از کتابخانه libjpeg هستند. ما از نسخه 6b کتابخانه استفاده کردیم. ما از cjpeg و djpeg برای رمزگذاری و رمزگشایی تصویر JPEG استفاده کردیم. ما از cjpeg با پرچم -optimize برای بهینه سازی اندازه فایل استفاده کردیم. ما تمام پارامترهای دیگر را به مقادیر پیش فرض آنها تنظیم می کنیم.

کیفیت تصویر با استفاده از SSIM اندازه گیری شد. همانطور که قبلا ذکر شد، SSIM به طور کلی به عنوان یک معیار کیفیت بهتر از PSNR پذیرفته شده است. برای محاسبه شاخص SSIM، ما از یک پیاده سازی در دسترس عموم در C++ استفاده کردیم. خواننده ممکن است اسکریپت‌های پایتون را که در آزمایش‌ها استفاده کرده‌ایم از مخزن کد برای مرجع دانلود کند.

مجموعه داده های تصویری

ما مجموعه داده‌ها را برای ارزیابی مجموعه‌های تصویر آزمایشی استاندارد و همچنین روی مجموعه بزرگی از تصاویر انتخاب کردیم. در زیر لیستی از مجموعه داده های مورد استفاده در آزمایش ها آمده است.

  1. Lenna: تصویر Lenna پرکاربرد (512 x 512 پیکسل).

  2. کداک: 24 تصویر از مجموعه تصاویر رنگی واقعی کداک .

  3. Tecnick: 100 تصویر از مجموعه موجود در Tecnick.com . ما از 100 تصویر رنگی RGB با اندازه اصلی استفاده کردیم.

  4. Image_crawl: برای آزمایش تعداد زیادی تصویر، نمونه‌ای تصادفی از تصاویر PNG را از پایگاه داده خزیدن وب جستجوی تصویر Google جمع‌آوری کردیم. بیشتر تصاویر PNG خزیده شده آیکون ها، گرافیک ها، نمودارها، اسناد اسکن شده و غیره هستند. با این حال بیشتر تصاویر در مجموعه های تست استاندارد به جای تصاویر تولید شده توسط کامپیوتر، مانند عکس هستند. برای اینکه این مجموعه داده از نظر ماهیت مشابه مجموعه‌های تست استاندارد باشد، یک الگوریتم تشخیص چهره را روی این تصاویر PNG اجرا کردیم و فقط آن دسته از تصاویر (حدود 11000) را برای این آزمایش در نظر گرفتیم که این تست تشخیص را گذرانده‌اند.

آزمایش 1: WebP در مقابل JPEG در شاخص SSIM برابر

در این آزمایش ما تصاویر JPEG و WebP را با مقادیر قابل مقایسه SSIM تولید می کنیم و نسبت اندازه فایل ها را اندازه گیری می کنیم. مراحل آزمایش به شرح زیر است:

  1. تصویر PNG منبع را با پارامتر کیفیت ثابت Q به JPEG فشرده کنید و SSIM را بین تصویر PNG منبع و تصویر JPEG فشرده ضبط کنید.

  2. همان تصویر منبع را با یک پارامتر کیفیت به WebP فشرده کنید که تا حد امکان به SSIM ثبت شده بالا برسد.

ما دو مرحله فوق را روی تمام تصاویر موجود در یک مجموعه داده اجرا کردیم و سپس میانگین اندازه فایل و SSIM را برای تصاویر JPEG و WebP اندازه‌گیری کردیم.

جداول زیر نتایج این آزمایش را برای سه مقدار مختلف (50، 75 و 95) پارامتر کیفیت JPEG Q نشان می دهد. پارامترهای کیفیت 50 و 95 به ترتیب فشرده سازی تصویر را در نرخ بیت پایین و بالا نشان می دهند. ما همچنین پارامتر کیفیت JPEG 75 را در نظر گرفته‌ایم زیرا سطح کیفی عمومی توصیه شده برای تصاویر JPEG است.

جدول 1: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=50

لنا کداک تکنیک Image_crawl
WebP: متوسط ​​اندازه فایل
(سیم کارت متوسط)
17.4 کیلوبایت
(0.841)
31.0 کیلوبایت
(0.898)
92.4 کیلوبایت
(0.917)
6.5 کیلوبایت
(0.901)
JPEG: اندازه فایل متوسط
(سیم کارت متوسط)
23.5 کیلوبایت
(0.840)
42.7 کیلوبایت
(0.897)
124.6 کیلوبایت
(0.916)
9.9 کیلوبایت
(0.899)
نسبت اندازه فایل WebP به JPEG 0.74 0.72 0.74 0.66

جدول 2: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=75

لنا کداک تکنیک Image_crawl
WebP: متوسط ​​اندازه فایل
(سیم کارت متوسط)
26.7 کیلوبایت
(0.864)
46.5 کیلوبایت
(0.932)
139.0 کیلوبایت
(0.939)
9.9 کیلوبایت
(0.930)
JPEG: اندازه فایل متوسط
(سیم کارت متوسط)
37.0 کیلوبایت
(0.863)
66.0 کیلوبایت
(0.931)
191.0 کیلوبایت
(0.938)
14.4 کیلوبایت
(0.929)
نسبت اندازه فایل WebP به JPEG 0.72 0.70 0.73 0.69

جدول 3: میانگین اندازه فایل برای WebP و JPEG برای نمایه یکسان SSIM مطابق با JPEG Q=95

لنا کداک تکنیک Image_crawl
WebP: متوسط ​​اندازه فایل
(سیم کارت متوسط)
74.3 کیلوبایت
(0.910)
118.0 کیلوبایت
(0.978)
356.0 کیلوبایت
(0.970)
23.4 کیلوبایت
(0.969)
JPEG: اندازه فایل متوسط
(سیم کارت متوسط)
104 کیلوبایت
(0.907)
162 کیلوبایت
(0.976)
492 کیلوبایت
(0.970)
31.3 کیلوبایت
(0.968)
نسبت اندازه فایل WebP به JPEG 0.71 0.73 0.72 0.75

از جداول بالا، می‌توان مشاهده کرد که WebP در مقایسه با JPEG با شاخص SSIM برابر یا کمی بهتر، 25 تا 34 درصد افزایش فشرده‌سازی اضافی می‌دهد.

آزمایش 2: نمودارهای SSIM در مقابل BPP برای WebP و JPEG

ما مبادله نرخ-اعوجاج JPEG و WebP را مطالعه می کنیم. ما به طور خاص نمودارهای SSIM در مقابل بیت در پیکسل (bpp) را برای JPEG و WebP مطالعه می کنیم. تصویر منبع PNG را می گیریم، آن را با استفاده از تمام مقادیر کیفیت ممکن (0-100) به JPEG و WebP فشرده می کنیم. سپس برای هر مقدار کیفیت، SSIM و bpp به دست آمده برای JPEG و WebP را رسم می کنیم. شکل های زیر چنین نمودارهای SSIM در مقابل bpp را برای 3 تصویر انتخاب شده از 3 مجموعه داده عمومی که ما استفاده کرده ایم نشان می دهد.

شکل 1: SSIM در مقابل BPP برای Lenna

ssim در مقابل bpp برای Lenna

شکل 2: SSIM در مقابل BPP برای kodim19.png از مجموعه داده کداک

ssim در مقابل bpp برای Kodim19

شکل 3: SSIM در مقابل BPP برای RGB_OR_1200x1200_061.png از مجموعه داده Tecnick

ssim در مقابل bpp برای RGB_OR_1200x1200

علاوه بر این، ما رفتار میانگین نمودار SSIM در مقابل bpp را برای مجموعه داده‌های کداک و تکنیک مطالعه کردیم. برای ترسیم رفتار متوسط، تمام تصاویر موجود در یک مجموعه داده را با استفاده از WebP و JPEG در 100 مقدار کیفیت مختلف فشرده می‌کنیم. سپس میانگین SSIM و bpp را برای هر مقدار کیفیت رسم می کنیم. مجموعه داده خزیدن تصویر از تصاویر ناهمگنی تشکیل شده است که خود را به این تجمیع داده ها اختصاص نمی دهند. نمودارهای زیر میانگین رفتار SSIM و bpp را برای مجموعه داده های Kodak و Tecnick به ترتیب نشان می دهد.

شکل 4: SSIM در مقابل BPP برای مجموعه داده کداک

ssim در مقابل bpp برای کداک

شکل 5: SSIM در مقابل BPP برای مجموعه داده Tecnick

ssim در مقابل bpp برای مجموعه داده Tecnick

به طور کلی، از نمودارهای بالا می توانیم مشاهده کنیم که WebP به طور مداوم به بیت های کمتری در هر پیکسل نسبت به JPEG برای دستیابی به شاخص SSIM یکسان نیاز دارد.

نتیجه

این مطالعه فشرده سازی WebP را در مقایسه با JPEG ارزیابی کرد. ما مشاهده کردیم که میانگین اندازه فایل WebP در مقایسه با اندازه فایل JPEG در شاخص SSIM معادل 25٪ -34٪ کوچکتر است. نمودارهای SSIM در مقابل bpp نشان داد که WebP به طور مداوم به بیت‌های کمتری در هر پیکسل نسبت به JPEG برای همان شاخص SSIM نیاز دارد. این نتایج نشان می دهد که WebP می تواند بهبود فشرده سازی قابل توجهی را نسبت به JPEG ارائه دهد.


1 Huynh-Thu، Q. قنبری، م.(1387). "حوزه اعتبار PSNR در ارزیابی کیفیت تصویر/فیلم". نامه الکترونیک 44: 800-801.doi:10.1049/el:20080522.

2 Z. Wang، AC Bovik، HR Sheikh و EP Simoncelli، " ارزیابی کیفیت تصویر: از اندازه گیری خطا تا تشابه ساختاری "، پردازش تصویر، معاملات IEEE، جلد 13، شماره 4، صفحات 600-612، 2004.