ওয়েবপি কম্প্রেশন স্টাডি

ভূমিকা

আমরা libwebp এ প্রকাশিত নতুন এনকোডারের উপর ভিত্তি করে WebP এবং JPEG ইমেজ কম্প্রেশনের তুলনামূলক মূল্যায়ন করি। লক্ষ্য হল সর্বজনীনভাবে উপলব্ধ সরঞ্জামগুলি ব্যবহার করে সহজে পুনরাবৃত্তিযোগ্য পরীক্ষার একটি সেট চালানো এবং WebP এবং JPEG দ্বারা অর্জিত চিত্র সংকোচনের তুলনা করা।

ওয়েবপির আমাদের পূর্বের তুলনামূলক অধ্যয়নটি প্রচুর সংখ্যক চিত্রের মূল্যায়নের উপর দৃষ্টি নিবদ্ধ করেছিল এবং ওয়েব থেকে ক্রল করা JPEG উত্সগুলিতে পরিচালিত হয়েছিল৷ JPEG একটি ক্ষতিকারক কম্প্রেশন বিন্যাস এবং উৎসে কম্প্রেশন আর্টিফ্যাক্টের পরিচয় দেয়। উপরন্তু, আমরা প্রাথমিকভাবে পিক সিগন্যাল-টু-নয়েজ রেশিও বা PSNR একটি গুণমান মেট্রিক হিসাবে ব্যবহার করেছি। PSNR এর কিছু খারাপ দিক আছে যখন ইমেজের গুণমান মেট্রিক হিসাবে ব্যবহৃত হয়। সম্প্রদায়ের প্রতিক্রিয়ার উপর ভিত্তি করে, আমরা কয়েকটি স্ট্যান্ডার্ড টেস্ট স্যুটে উপলব্ধ ছবি সহ PNG ছবির উপর পরীক্ষা চালাই। আমরা এই গবেষণায় স্ট্রাকচারাল সিমিলারিটি বা এসএসআইএম ব্যবহার করি এই অধ্যয়নের মান মেট্রিক হিসেবে। SSIM একটি ভাল ভিজ্যুয়াল মানের মেট্রিক হিসাবে বিবেচিত হয় .

পদ্ধতি

আমরা দুই ধরনের মূল্যায়ন বর্ণনা করি। প্রথম ক্ষেত্রে, আমরা JPEG-এর একই মানের স্তরে WebP দ্বারা অর্জিত অতিরিক্ত কম্প্রেশন অধ্যয়ন করি। বিশেষ করে, আমরা JPEG ছবির মতো একই মানের (SSIM সূচক অনুযায়ী) WebP ছবি তৈরি করি এবং তারপর WebP এবং JPEG ছবির ফাইলের আকার তুলনা করি। দ্বিতীয় ক্ষেত্রে, আমরা WebP এবং JPEG-এর জন্য SSIM বনাম বিট প্রতি পিক্সেল (bpp) প্লট বিশ্লেষণ করি। এই প্লটগুলি WebP এবং JPEG-এর জন্য রেট-ডিস্টরশন ট্রেড অফ দেখায়৷

পরীক্ষার জন্য ডেটা সেটগুলি PNG চিত্রগুলি নিয়ে গঠিত। এই ছবিগুলি সর্বজনীনভাবে অ্যাক্সেসযোগ্য স্ট্যান্ডার্ড টেস্ট ইমেজ স্যুট এবং সেইসাথে ওয়েব থেকে ক্রল করা PNG ছবির একটি বৃহৎ সংগ্রহ থেকে প্রাপ্ত করা হয়েছে।

প্রতিটি পরীক্ষায় কমান্ডের একটি সেট চালানো হয়। পরীক্ষাগুলিকে অন্যদের জন্য যুক্তিসঙ্গতভাবে পুনরুত্পাদনযোগ্য রাখার জন্য শুধুমাত্র সর্বজনীনভাবে উপলব্ধ কমান্ড লাইন টুল ব্যবহার করা হয়। এই পরীক্ষার জন্য ব্যবহৃত কমান্ড লাইন টুল হল:

  • identify এবং convert হল কমান্ড-লাইন সরঞ্জাম যা ImageMagick- এর অংশ। আমরা এই বিশ্লেষণের জন্য সংস্করণ 6.5.7 ব্যবহার করেছি। আমরা PNG এবং PPM ফর্ম্যাটের মধ্যে রূপান্তর করতে convert ব্যবহার করি। আমরা একটি চিত্রের প্রস্থ এবং উচ্চতার তথ্য বের করতে identify ব্যবহার করি।

  • cwebp এবং dwebp হল কমান্ড-লাইন টুল যা libwebp লাইব্রেরির অংশ যা আমরা Q1 2011 এ প্রকাশ করেছি। আমরা লাইব্রেরির সংস্করণ 0.1.2 ব্যবহার করেছি। WebP ছবি এনকোড এবং ডিকোড করতে আমরা cwebp এবং dwebp ব্যবহার করেছি। আমরা এই টুলগুলির ডিফল্ট এনকোডিং এবং ডিকোডিং প্যারামিটার ব্যবহার করেছি।

  • cjpeg এবং djpeg হল কমান্ড-লাইন টুল যা libjpeg লাইব্রেরির অংশ। আমরা লাইব্রেরির সংস্করণ 6b ব্যবহার করেছি। আমরা JPEG ইমেজ এনকোড এবং ডিকোড করতে cjpeg এবং djpeg ব্যবহার করেছি। ফাইলের আকারের জন্য অপ্টিমাইজ করার জন্য আমরা -optimize ফ্ল্যাগের সাথে cjpeg ব্যবহার করেছি। আমরা অন্যান্য সমস্ত পরামিতি তাদের ডিফল্ট মানগুলিতে সেট করি।

SSIM ব্যবহার করে একটি চিত্রের গুণমান পরিমাপ করা হয়েছিল। পূর্বে উল্লিখিত হিসাবে, SSIM সাধারণত PSNR এর তুলনায় একটি ভাল মানের মেট্রিক হিসাবে গৃহীত হয়। SSIM সূচক গণনার জন্য, আমরা C++ এ সর্বজনীনভাবে উপলব্ধ বাস্তবায়ন ব্যবহার করেছি। পাঠক রেফারেন্সের জন্য কোড সংগ্রহস্থল থেকে পরীক্ষায় ব্যবহৃত পাইথন স্ক্রিপ্টগুলি ডাউনলোড করতে পারে।

ইমেজ ডেটা সেট

আমরা স্ট্যান্ডার্ড টেস্ট ইমেজ সংগ্রহের পাশাপাশি ইমেজের একটি বড় সেটের মূল্যায়ন করার জন্য ডেটা সেট বেছে নিয়েছি। পরীক্ষায় ব্যবহৃত ডেটা সেটের তালিকা নিচে দেওয়া হল।

  1. লেনা: ব্যাপকভাবে ব্যবহৃত লেনা ছবি (512 x 512 পিক্সেল)।

  2. কোডাক: কোডাক ট্রু কালার ইমেজ স্যুট থেকে 24টি ছবি।

  3. Tecnick: Tecnick.com এ উপলব্ধ সংগ্রহ থেকে 100টি ছবি। আমরা 100টি আসল আকারের আরজিবি রঙের ছবি ব্যবহার করেছি।

  4. Image_crawl: অনেক সংখ্যক ছবি পরীক্ষা করার জন্য, আমরা Google ইমেজ সার্চ ওয়েব ক্রল ডাটাবেস থেকে PNG ছবির একটি এলোমেলো নমুনা সংগ্রহ করেছি। ক্রল করা PNG ইমেজগুলির বেশিরভাগই হল আইকন, গ্রাফিক্স, চার্ট, স্ক্যান করা ডকুমেন্ট ইত্যাদি। তবে স্ট্যান্ডার্ড টেস্ট সংগ্রহের বেশিরভাগ ছবি কম্পিউটার জেনারেটেড ইমেজের পরিবর্তে ফটোগ্রাফের মতো। এই ডেটাসেটটিকে স্ট্যান্ডার্ড টেস্ট স্যুটগুলির মতো প্রকৃতিতে তৈরি করতে, আমরা এই PNG চিত্রগুলির উপর একটি মুখ সনাক্তকরণ অ্যালগরিদম চালিয়েছি এবং এই পরীক্ষার জন্য শুধুমাত্র সেই ছবিগুলি (প্রায় 11,000) বিবেচনা করেছি, যেগুলি এই সনাক্তকরণ পরীক্ষায় উত্তীর্ণ হয়েছে৷

পরীক্ষা 1: সমান SSIM সূচকে WebP বনাম JPEG

এই পরীক্ষায় আমরা তুলনামূলক SSIM মানগুলিতে JPEG এবং WebP চিত্র তৈরি করি এবং ফাইলের আকারের অনুপাত পরিমাপ করি। পরীক্ষার ধাপগুলি নিম্নরূপ:

  1. একটি নির্দিষ্ট মানের প্যারামিটার Q দিয়ে উত্স PNG চিত্রটিকে JPEG-তে সংকুচিত করুন এবং উত্স PNG চিত্র এবং সংকুচিত JPEG চিত্রের মধ্যে SSIM রেকর্ড করুন৷

  2. একই সোর্স ইমেজকে WebP-এ একটি মানের প্যারামিটার দিয়ে কম্প্রেস করুন যা উপরের রেকর্ড করা SSIM যতটা সম্ভব ঘনিষ্ঠভাবে অর্জন করে।

আমরা একটি ডেটাসেটের সমস্ত ছবিতে উপরের দুটি ধাপ চালিয়েছি এবং তারপর JPEG এবং WebP চিত্রগুলির জন্য গড় ফাইলের আকার এবং SSIM পরিমাপ করেছি৷

নিম্নলিখিত টেবিলগুলি JPEG গুণমান প্যারামিটারের তিনটি ভিন্ন মানের (50, 75 এবং 95) জন্য এই পরীক্ষার ফলাফলগুলি দেখায় Q. গুণমান প্যারামিটার 50 এবং 95 যথাক্রমে কম এবং উচ্চ বিট-রেটে চিত্র সংকোচনের প্রতিনিধিত্ব করে৷ আমরা JPEG মানের প্যারামিটার 75ও অন্তর্ভুক্ত করেছি কারণ এটি সাধারণত JPEG চিত্রগুলির জন্য গুণমানের স্তরের সুপারিশ করে৷

সারণি 1: ওয়েবপি এবং JPEG-এর জন্য একই SSIM সূচকের জন্য গড় ফাইলের আকার JPEG Q=50 এর সাথে সম্পর্কিত

লেনা কোডাক টেকনিক ছবি_ক্রল
WebP: গড় ফাইলের আকার
(গড় SSIM)
17.4 কেবি
(০.৮৪১)
31.0 KB
(০.৮৯৮)
92.4 KB
(০.৯১৭)
6.5 KB
(0.901)
JPEG: গড় ফাইলের আকার
(গড় SSIM)
23.5 KB
(০.৮৪০)
42.7 KB
(০.৮৯৭)
124.6 KB
(০.৯১৬)
9.9 KB
(০.৮৯৯)
WebP থেকে JPEG ফাইলের আকারের অনুপাত 0.74 0.72 0.74 0.66

সারণি 2: ওয়েবপি এবং জেপিইজির জন্য একই SSIM সূচকের জন্য গড় ফাইলের আকার JPEG Q=75 এর সাথে সম্পর্কিত

লেনা কোডাক টেকনিক ছবি_ক্রল
WebP: গড় ফাইলের আকার
(গড় SSIM)
26.7 KB
(০.৮৬৪)
46.5 KB
(০.৯৩২)
139.0 KB
(০.৯৩৯)
9.9 KB
(০.৯৩০)
JPEG: গড় ফাইলের আকার
(গড় SSIM)
37.0 KB
(০.৮৬৩)
66.0 KB
(০.৯৩১)
191.0 KB
(০.৯৩৮)
14.4 KB
(০.৯২৯)
WebP থেকে JPEG ফাইলের আকারের অনুপাত 0.72 0.70 0.73 0.69

সারণি 3: ওয়েবপি এবং JPEG-এর জন্য গড় ফাইলের আকার একই SSIM সূচকের জন্য JPEG Q=95 এর সাথে সম্পর্কিত

লেনা কোডাক টেকনিক ছবি_ক্রল
WebP: গড় ফাইলের আকার
(গড় SSIM)
74.3 KB
(০.৯১০)
118.0 KB
(০.৯৭৮)
356.0 KB
(০.৯৭০)
23.4 KB
(০.৯৬৯)
JPEG: গড় ফাইলের আকার
(গড় SSIM)
104 KB
(0.907)
162 KB
(০.৯৭৬)
492 KB
(০.৯৭০)
31.3 KB
(০.৯৬৮)
WebP থেকে JPEG ফাইলের আকারের অনুপাত 0.71 0.73 0.72 0.75

উপরের সারণী থেকে, আমরা লক্ষ্য করতে পারি যে WebP অতিরিক্ত 25%-34% কম্প্রেশন লাভ দেয় JPEG-এর তুলনায় সমান বা সামান্য ভাল SSIM সূচকে।

পরীক্ষা 2: WebP এবং JPEG এর জন্য SSIM বনাম BPP প্লট

আমরা JPEG এবং WebP-এর রেট-ডিস্টরশন ট্রেড-অফ অধ্যয়ন করি। বিশেষ করে আমরা JPEG এবং WebP-এর জন্য SSIM বনাম বিট প্রতি পিক্সেল (bpp) প্লট অধ্যয়ন করি। আমরা সোর্স পিএনজি ইমেজটি নিই, সমস্ত সম্ভাব্য (0-100) মানের মান ব্যবহার করে এটিকে JPEG এবং WebP-এ কম্প্রেস করি। তারপর প্রতিটি মানের মানের জন্য আমরা JPEG এবং WebP-এর জন্য প্রাপ্ত SSIM এবং bpp প্লট করি। নিম্নলিখিত পরিসংখ্যানগুলি আমাদের ব্যবহার করা 3টি পাবলিক ডেটা সেট থেকে নির্বাচিত 3টি চিত্রের জন্য এই জাতীয় SSIM বনাম bpp প্লট দেখায়।

চিত্র 1: লেনার জন্য SSIM বনাম BPP

লেনার জন্য ssim বনাম bpp

চিত্র 2: কোডাক ডেটাসেট থেকে kodim19.png-এর জন্য SSIM বনাম BPP

Kodim19 এর জন্য ssim বনাম bpp

চিত্র 3: Tecnick ডেটাসেট থেকে RGB_OR_1200x1200_061.png এর জন্য SSIM বনাম BPP

RGB_OR_1200x1200 এর জন্য ssim বনাম bpp

উপরন্তু, আমরা কোডাক এবং টেকনিক ডেটা সেটের জন্য SSIM বনাম bpp প্লটের গড় আচরণ অধ্যয়ন করেছি। গড় আচরণ প্লট করার জন্য, আমরা WebP এবং JPEG ব্যবহার করে 100টি ভিন্ন মানের মানগুলিতে একটি ডেটাসেটে সমস্ত ছবি সংকুচিত করি। তারপর আমরা প্রতিটি মানের মানের জন্য SSIM এবং bpp-এর গড় প্লট করি। ইমেজ ক্রল ডেটা সেটে ভিন্নধর্মী ছবি থাকে যা এই ডেটা একত্রিতকরণে নিজেদের ধার দেয় না। নিম্নলিখিত প্লটগুলি যথাক্রমে কোডাক এবং টেকনিক ডেটা সেটগুলির জন্য SSIM এবং bpp-এর গড় আচরণ দেখায়৷

চিত্র 4: কোডাক ডেটাসেটের জন্য SSIM বনাম BPP

কোডাকের জন্য ssim বনাম bpp

চিত্র 5: Tecnick ডেটাসেটের জন্য SSIM বনাম BPP

Tecnick ডেটাসেটের জন্য ssim বনাম bpp

সামগ্রিকভাবে, উপরের প্লটগুলি থেকে আমরা লক্ষ্য করতে পারি যে একই SSIM সূচক অর্জন করতে WebP-এর ধারাবাহিকভাবে JPEG-এর তুলনায় পিক্সেল প্রতি কম বিট প্রয়োজন।

উপসংহার

গবেষণায় JPEG-এর তুলনায় WebP কম্প্রেশন মূল্যায়ন করা হয়েছে। আমরা লক্ষ্য করেছি যে সমতুল্য SSIM সূচকে JPEG ফাইলের আকারের তুলনায় গড় WebP ফাইলের আকার 25%-34% ছোট। SSIM বনাম bpp প্লট দেখায় যে WebP ধারাবাহিকভাবে একই SSIM সূচকের জন্য JPEG থেকে পিক্সেল প্রতি কম বিট প্রয়োজন। এই ফলাফলগুলি নির্দেশ করে যে WebP JPEG এর তুলনায় উল্লেখযোগ্য কম্প্রেশন উন্নতি প্রদান করতে পারে।


1 Huynh-Thu, Q.; Ghanbari, M. (2008)। "ছবি/ভিডিও মানের মূল্যায়নে PSNR-এর বৈধতার সুযোগ"। ইলেকট্রনিক্স লেটার্স 44: 800-801.doi:10.1049/el:20080522।

2 Z. Wang, AC Bovik, HR শেখ, এবং EP Simoncelli, " চিত্রের গুণমান মূল্যায়ন: ত্রুটি পরিমাপ থেকে কাঠামোগত সাদৃশ্য ," চিত্র প্রক্রিয়াকরণ, IEEE লেনদেন, ভলিউম 13, ইস্যু 4, পৃষ্ঠা 600-612, 2004।