ভূমিকা
আমরা libwebp
এ প্রকাশিত নতুন এনকোডারের উপর ভিত্তি করে WebP এবং JPEG ইমেজ কম্প্রেশনের তুলনামূলক মূল্যায়ন করি। লক্ষ্য হল সর্বজনীনভাবে উপলব্ধ সরঞ্জামগুলি ব্যবহার করে সহজে পুনরাবৃত্তিযোগ্য পরীক্ষার একটি সেট চালানো এবং WebP এবং JPEG দ্বারা অর্জিত চিত্র সংকোচনের তুলনা করা।
ওয়েবপির আমাদের পূর্বের তুলনামূলক অধ্যয়নটি প্রচুর সংখ্যক চিত্রের মূল্যায়নের উপর দৃষ্টি নিবদ্ধ করেছিল এবং ওয়েব থেকে ক্রল করা JPEG উত্সগুলিতে পরিচালিত হয়েছিল৷ JPEG একটি ক্ষতিকারক কম্প্রেশন বিন্যাস এবং উৎসে কম্প্রেশন আর্টিফ্যাক্টের পরিচয় দেয়। উপরন্তু, আমরা প্রাথমিকভাবে পিক সিগন্যাল-টু-নয়েজ রেশিও বা PSNR একটি গুণমান মেট্রিক হিসাবে ব্যবহার করেছি। PSNR এর কিছু খারাপ দিক আছে যখন ইমেজের গুণমান মেট্রিক হিসাবে ব্যবহৃত হয়। সম্প্রদায়ের প্রতিক্রিয়ার উপর ভিত্তি করে, আমরা কয়েকটি স্ট্যান্ডার্ড টেস্ট স্যুটে উপলব্ধ ছবি সহ PNG ছবির উপর পরীক্ষা চালাই। আমরা এই গবেষণায় স্ট্রাকচারাল সিমিলারিটি বা এসএসআইএম ব্যবহার করি এই অধ্যয়নের মান মেট্রিক হিসেবে। SSIM একটি ভাল ভিজ্যুয়াল মানের মেট্রিক হিসাবে বিবেচিত হয় .
পদ্ধতি
আমরা দুই ধরনের মূল্যায়ন বর্ণনা করি। প্রথম ক্ষেত্রে, আমরা JPEG-এর একই মানের স্তরে WebP দ্বারা অর্জিত অতিরিক্ত কম্প্রেশন অধ্যয়ন করি। বিশেষ করে, আমরা JPEG ছবির মতো একই মানের (SSIM সূচক অনুযায়ী) WebP ছবি তৈরি করি এবং তারপর WebP এবং JPEG ছবির ফাইলের আকার তুলনা করি। দ্বিতীয় ক্ষেত্রে, আমরা WebP এবং JPEG-এর জন্য SSIM বনাম বিট প্রতি পিক্সেল (bpp) প্লট বিশ্লেষণ করি। এই প্লটগুলি WebP এবং JPEG-এর জন্য রেট-ডিস্টরশন ট্রেড অফ দেখায়৷
পরীক্ষার জন্য ডেটা সেটগুলি PNG চিত্রগুলি নিয়ে গঠিত। এই ছবিগুলি সর্বজনীনভাবে অ্যাক্সেসযোগ্য স্ট্যান্ডার্ড টেস্ট ইমেজ স্যুট এবং সেইসাথে ওয়েব থেকে ক্রল করা PNG ছবির একটি বৃহৎ সংগ্রহ থেকে প্রাপ্ত করা হয়েছে।
প্রতিটি পরীক্ষায় কমান্ডের একটি সেট চালানো হয়। পরীক্ষাগুলিকে অন্যদের জন্য যুক্তিসঙ্গতভাবে পুনরুত্পাদনযোগ্য রাখার জন্য শুধুমাত্র সর্বজনীনভাবে উপলব্ধ কমান্ড লাইন টুল ব্যবহার করা হয়। এই পরীক্ষার জন্য ব্যবহৃত কমান্ড লাইন টুল হল:
identify
এবংconvert
হল কমান্ড-লাইন সরঞ্জাম যা ImageMagick- এর অংশ। আমরা এই বিশ্লেষণের জন্য সংস্করণ 6.5.7 ব্যবহার করেছি। আমরা PNG এবং PPM ফর্ম্যাটের মধ্যে রূপান্তর করতেconvert
ব্যবহার করি। আমরা একটি চিত্রের প্রস্থ এবং উচ্চতার তথ্য বের করতেidentify
ব্যবহার করি।cwebp
এবংdwebp
হল কমান্ড-লাইন টুল যাlibwebp
লাইব্রেরির অংশ যা আমরা Q1 2011 এ প্রকাশ করেছি। আমরা লাইব্রেরির সংস্করণ 0.1.2 ব্যবহার করেছি। WebP ছবি এনকোড এবং ডিকোড করতে আমরাcwebp
এবংdwebp
ব্যবহার করেছি। আমরা এই টুলগুলির ডিফল্ট এনকোডিং এবং ডিকোডিং প্যারামিটার ব্যবহার করেছি।cjpeg
এবংdjpeg
হল কমান্ড-লাইন টুল যাlibjpeg
লাইব্রেরির অংশ। আমরা লাইব্রেরির সংস্করণ 6b ব্যবহার করেছি। আমরা JPEG ইমেজ এনকোড এবং ডিকোড করতেcjpeg
এবংdjpeg
ব্যবহার করেছি। ফাইলের আকারের জন্য অপ্টিমাইজ করার জন্য আমরা-optimize
ফ্ল্যাগের সাথেcjpeg
ব্যবহার করেছি। আমরা অন্যান্য সমস্ত পরামিতি তাদের ডিফল্ট মানগুলিতে সেট করি।
SSIM ব্যবহার করে একটি চিত্রের গুণমান পরিমাপ করা হয়েছিল। পূর্বে উল্লিখিত হিসাবে, SSIM সাধারণত PSNR এর তুলনায় একটি ভাল মানের মেট্রিক হিসাবে গৃহীত হয়। SSIM সূচক গণনার জন্য, আমরা C++ এ সর্বজনীনভাবে উপলব্ধ বাস্তবায়ন ব্যবহার করেছি। পাঠক রেফারেন্সের জন্য কোড সংগ্রহস্থল থেকে পরীক্ষায় ব্যবহৃত পাইথন স্ক্রিপ্টগুলি ডাউনলোড করতে পারে।
ইমেজ ডেটা সেট
আমরা স্ট্যান্ডার্ড টেস্ট ইমেজ সংগ্রহের পাশাপাশি ইমেজের একটি বড় সেটের মূল্যায়ন করার জন্য ডেটা সেট বেছে নিয়েছি। পরীক্ষায় ব্যবহৃত ডেটা সেটের তালিকা নিচে দেওয়া হল।
লেনা: ব্যাপকভাবে ব্যবহৃত লেনা ছবি (512 x 512 পিক্সেল)।
কোডাক: কোডাক ট্রু কালার ইমেজ স্যুট থেকে 24টি ছবি।
Tecnick: Tecnick.com এ উপলব্ধ সংগ্রহ থেকে 100টি ছবি। আমরা 100টি আসল আকারের আরজিবি রঙের ছবি ব্যবহার করেছি।
Image_crawl: অনেক সংখ্যক ছবি পরীক্ষা করার জন্য, আমরা Google ইমেজ সার্চ ওয়েব ক্রল ডাটাবেস থেকে PNG ছবির একটি এলোমেলো নমুনা সংগ্রহ করেছি। ক্রল করা PNG ইমেজগুলির বেশিরভাগই হল আইকন, গ্রাফিক্স, চার্ট, স্ক্যান করা ডকুমেন্ট ইত্যাদি। তবে স্ট্যান্ডার্ড টেস্ট সংগ্রহের বেশিরভাগ ছবি কম্পিউটার জেনারেটেড ইমেজের পরিবর্তে ফটোগ্রাফের মতো। এই ডেটাসেটটিকে স্ট্যান্ডার্ড টেস্ট স্যুটগুলির মতো প্রকৃতিতে তৈরি করতে, আমরা এই PNG চিত্রগুলির উপর একটি মুখ সনাক্তকরণ অ্যালগরিদম চালিয়েছি এবং এই পরীক্ষার জন্য শুধুমাত্র সেই ছবিগুলি (প্রায় 11,000) বিবেচনা করেছি, যেগুলি এই সনাক্তকরণ পরীক্ষায় উত্তীর্ণ হয়েছে৷
পরীক্ষা 1: সমান SSIM সূচকে WebP বনাম JPEG
এই পরীক্ষায় আমরা তুলনামূলক SSIM মানগুলিতে JPEG এবং WebP চিত্র তৈরি করি এবং ফাইলের আকারের অনুপাত পরিমাপ করি। পরীক্ষার ধাপগুলি নিম্নরূপ:
একটি নির্দিষ্ট মানের প্যারামিটার Q দিয়ে উত্স PNG চিত্রটিকে JPEG-তে সংকুচিত করুন এবং উত্স PNG চিত্র এবং সংকুচিত JPEG চিত্রের মধ্যে SSIM রেকর্ড করুন৷
একই সোর্স ইমেজকে WebP-এ একটি মানের প্যারামিটার দিয়ে কম্প্রেস করুন যা উপরের রেকর্ড করা SSIM যতটা সম্ভব ঘনিষ্ঠভাবে অর্জন করে।
আমরা একটি ডেটাসেটের সমস্ত ছবিতে উপরের দুটি ধাপ চালিয়েছি এবং তারপর JPEG এবং WebP চিত্রগুলির জন্য গড় ফাইলের আকার এবং SSIM পরিমাপ করেছি৷
নিম্নলিখিত টেবিলগুলি JPEG গুণমান প্যারামিটারের তিনটি ভিন্ন মানের (50, 75 এবং 95) জন্য এই পরীক্ষার ফলাফলগুলি দেখায় Q. গুণমান প্যারামিটার 50 এবং 95 যথাক্রমে কম এবং উচ্চ বিট-রেটে চিত্র সংকোচনের প্রতিনিধিত্ব করে৷ আমরা JPEG মানের প্যারামিটার 75ও অন্তর্ভুক্ত করেছি কারণ এটি সাধারণত JPEG চিত্রগুলির জন্য গুণমানের স্তরের সুপারিশ করে৷
সারণি 1: ওয়েবপি এবং JPEG-এর জন্য একই SSIM সূচকের জন্য গড় ফাইলের আকার JPEG Q=50 এর সাথে সম্পর্কিত
লেনা | কোডাক | টেকনিক | ছবি_ক্রল | |
---|---|---|---|---|
WebP: গড় ফাইলের আকার (গড় SSIM) | 17.4 কেবি (০.৮৪১) | 31.0 KB (০.৮৯৮) | 92.4 KB (০.৯১৭) | 6.5 KB (0.901) |
JPEG: গড় ফাইলের আকার (গড় SSIM) | 23.5 KB (০.৮৪০) | 42.7 KB (০.৮৯৭) | 124.6 KB (০.৯১৬) | 9.9 KB (০.৮৯৯) |
WebP থেকে JPEG ফাইলের আকারের অনুপাত | 0.74 | 0.72 | 0.74 | 0.66 |
সারণি 2: ওয়েবপি এবং জেপিইজির জন্য একই SSIM সূচকের জন্য গড় ফাইলের আকার JPEG Q=75 এর সাথে সম্পর্কিত
লেনা | কোডাক | টেকনিক | ছবি_ক্রল | |
---|---|---|---|---|
WebP: গড় ফাইলের আকার (গড় SSIM) | 26.7 KB (০.৮৬৪) | 46.5 KB (০.৯৩২) | 139.0 KB (০.৯৩৯) | 9.9 KB (০.৯৩০) |
JPEG: গড় ফাইলের আকার (গড় SSIM) | 37.0 KB (০.৮৬৩) | 66.0 KB (০.৯৩১) | 191.0 KB (০.৯৩৮) | 14.4 KB (০.৯২৯) |
WebP থেকে JPEG ফাইলের আকারের অনুপাত | 0.72 | 0.70 | 0.73 | 0.69 |
সারণি 3: ওয়েবপি এবং JPEG-এর জন্য গড় ফাইলের আকার একই SSIM সূচকের জন্য JPEG Q=95 এর সাথে সম্পর্কিত
লেনা | কোডাক | টেকনিক | ছবি_ক্রল | |
---|---|---|---|---|
WebP: গড় ফাইলের আকার (গড় SSIM) | 74.3 KB (০.৯১০) | 118.0 KB (০.৯৭৮) | 356.0 KB (০.৯৭০) | 23.4 KB (০.৯৬৯) |
JPEG: গড় ফাইলের আকার (গড় SSIM) | 104 KB (0.907) | 162 KB (০.৯৭৬) | 492 KB (০.৯৭০) | 31.3 KB (০.৯৬৮) |
WebP থেকে JPEG ফাইলের আকারের অনুপাত | 0.71 | 0.73 | 0.72 | 0.75 |
উপরের সারণী থেকে, আমরা লক্ষ্য করতে পারি যে WebP অতিরিক্ত 25%-34% কম্প্রেশন লাভ দেয় JPEG-এর তুলনায় সমান বা সামান্য ভাল SSIM সূচকে।
পরীক্ষা 2: WebP এবং JPEG এর জন্য SSIM বনাম BPP প্লট
আমরা JPEG এবং WebP-এর রেট-ডিস্টরশন ট্রেড-অফ অধ্যয়ন করি। বিশেষ করে আমরা JPEG এবং WebP-এর জন্য SSIM বনাম বিট প্রতি পিক্সেল (bpp) প্লট অধ্যয়ন করি। আমরা সোর্স পিএনজি ইমেজটি নিই, সমস্ত সম্ভাব্য (0-100) মানের মান ব্যবহার করে এটিকে JPEG এবং WebP-এ কম্প্রেস করি। তারপর প্রতিটি মানের মানের জন্য আমরা JPEG এবং WebP-এর জন্য প্রাপ্ত SSIM এবং bpp প্লট করি। নিম্নলিখিত পরিসংখ্যানগুলি আমাদের ব্যবহার করা 3টি পাবলিক ডেটা সেট থেকে নির্বাচিত 3টি চিত্রের জন্য এই জাতীয় SSIM বনাম bpp প্লট দেখায়।
চিত্র 1: লেনার জন্য SSIM বনাম BPP
চিত্র 2: কোডাক ডেটাসেট থেকে kodim19.png-এর জন্য SSIM বনাম BPP
চিত্র 3: Tecnick ডেটাসেট থেকে RGB_OR_1200x1200_061.png এর জন্য SSIM বনাম BPP
উপরন্তু, আমরা কোডাক এবং টেকনিক ডেটা সেটের জন্য SSIM বনাম bpp প্লটের গড় আচরণ অধ্যয়ন করেছি। গড় আচরণ প্লট করার জন্য, আমরা WebP এবং JPEG ব্যবহার করে 100টি ভিন্ন মানের মানগুলিতে একটি ডেটাসেটে সমস্ত ছবি সংকুচিত করি। তারপর আমরা প্রতিটি মানের মানের জন্য SSIM এবং bpp-এর গড় প্লট করি। ইমেজ ক্রল ডেটা সেটে ভিন্নধর্মী ছবি থাকে যা এই ডেটা একত্রিতকরণে নিজেদের ধার দেয় না। নিম্নলিখিত প্লটগুলি যথাক্রমে কোডাক এবং টেকনিক ডেটা সেটগুলির জন্য SSIM এবং bpp-এর গড় আচরণ দেখায়৷
চিত্র 4: কোডাক ডেটাসেটের জন্য SSIM বনাম BPP
চিত্র 5: Tecnick ডেটাসেটের জন্য SSIM বনাম BPP
সামগ্রিকভাবে, উপরের প্লটগুলি থেকে আমরা লক্ষ্য করতে পারি যে একই SSIM সূচক অর্জন করতে WebP-এর ধারাবাহিকভাবে JPEG-এর তুলনায় পিক্সেল প্রতি কম বিট প্রয়োজন।
উপসংহার
গবেষণায় JPEG-এর তুলনায় WebP কম্প্রেশন মূল্যায়ন করা হয়েছে। আমরা লক্ষ্য করেছি যে সমতুল্য SSIM সূচকে JPEG ফাইলের আকারের তুলনায় গড় WebP ফাইলের আকার 25%-34% ছোট। SSIM বনাম bpp প্লট দেখায় যে WebP ধারাবাহিকভাবে একই SSIM সূচকের জন্য JPEG থেকে পিক্সেল প্রতি কম বিট প্রয়োজন। এই ফলাফলগুলি নির্দেশ করে যে WebP JPEG এর তুলনায় উল্লেখযোগ্য কম্প্রেশন উন্নতি প্রদান করতে পারে।
1 Huynh-Thu, Q.; Ghanbari, M. (2008)। "ছবি/ভিডিও মানের মূল্যায়নে PSNR-এর বৈধতার সুযোগ"। ইলেকট্রনিক্স লেটার্স 44: 800-801.doi:10.1049/el:20080522।
2 Z. Wang, AC Bovik, HR শেখ, এবং EP Simoncelli, " চিত্রের গুণমান মূল্যায়ন: ত্রুটি পরিমাপ থেকে কাঠামোগত সাদৃশ্য ," চিত্র প্রক্রিয়াকরণ, IEEE লেনদেন, ভলিউম 13, ইস্যু 4, পৃষ্ঠা 600-612, 2004।