การศึกษาเชิงเปรียบเทียบ

การศึกษาเปรียบเทียบ WebP, JPEG และ JPEG 2000, กันยายน 2010

หมายเหตุ: เราได้ทำการศึกษาขั้นต้นนี้ด้วย WebP เวอร์ชันแรกที่เราเปิดตัว ซึ่งใช้ไลบรารี libvpx นอกจากนี้ รูปภาพต้นฉบับคือรูปภาพ JPEG ที่เรารวบรวมข้อมูลจากเว็บ ตอนนี้เราได้ทำการศึกษาใหม่โดยอิงตามความคิดเห็นของชุมชนโดยใช้ libwebp เวอร์ชัน 0.1.2 ซึ่งเริ่มต้นด้วยรูปภาพแบบไม่สูญเสียรายละเอียด (PNG) เป็นแหล่งที่มา การศึกษาใหม่จะมีผลแทนการศึกษานี้

ทีม WebP ได้ทำการศึกษาเปรียบเทียบวิธีบีบอัดรูปภาพ 3 วิธีผ่านชุดรูปภาพ 1 ล้านรูปแบบสุ่ม เป้าหมายของการศึกษาคือการวัดการบีบอัดที่ได้จากวิธีการเหล่านั้น และวิเคราะห์ข้อเสียระหว่างขนาดรูปภาพและการบีบอัด

วิธีการบีบอัด 3 วิธี ได้แก่ WebP, JPEG 2000 และ Re-JPEG มีผลกับรูปภาพ JPEG จำนวน 900,000 รายการที่มีอยู่ในชุดข้อมูล รูปภาพ JPEG ได้รับการบีบอัดอีกครั้งด้วย Re-JPEG เพื่อให้แต่ละรูปภาพใกล้เคียงกับค่าอัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงสุด (PSNR) เป้าหมายมากที่สุด ทีมได้ทำการวิเคราะห์รูปภาพ หลังจากที่บีบอัดแล้ว

นอกเหนือจากการศึกษาขนาดใหญ่แล้ว ทีมได้ตรวจสอบรูปภาพแบบสุ่ม 100 รูปด้วยตนเองและพบว่า ในกรณีส่วนใหญ่ WebP ให้คุณภาพของรูปภาพที่ยอมรับได้

บทสรุป

WebP ได้รับการบีบอัดโดยรวมที่สูงกว่า JPEG หรือ JPEG 2000 รายได้จากการลดขนาดไฟล์จะสูงเป็นพิเศษสำหรับภาพขนาดเล็กซึ่งเป็นภาพที่พบมากที่สุดบนเว็บ

ชุดข้อมูล

ชุดข้อมูลที่ใช้ในการศึกษาคือคอลเล็กชันรูปภาพ 1 ล้านรูปที่สุ่มมาจากที่เก็บรูปภาพที่ทำการ Crawl จากเว็บ ตารางต่อไปนี้แสดงการกระจายของรูปภาพประเภทต่างๆ ในชุดข้อมูล

Type จำนวน
JPEG ประมาณ 9 แสน
PNG ประมาณ 4.7 หมื่น
GIF ประมาณ 4.7 หมื่น
อื่นๆ ประมาณ 6 พัน

การออกแบบการทดลอง

การทดสอบนี้มี 2 ขั้นตอน ดังนี้

  1. ทีมเรียกใช้ WebP ในรูปภาพที่มี PSNR เป้าหมายอยู่ที่ 42 โดยปรับพารามิเตอร์คุณภาพ (QP) สำหรับโปรแกรมเปลี่ยนไฟล์ WebP จนกว่าจะได้ผลลัพธ์ที่ใกล้เคียงกับ 42 ครั้งเท่ากับที่ได้สำหรับรูปภาพหนึ่งๆ ดังนั้น PSNR จริงที่ได้จากแต่ละรูปภาพจึงไม่จําเป็นต้องมี 42 รูป

  2. ทีมใช้ค่า PSNR สำหรับรูปภาพที่บีบอัดด้วย WebP เป็น PSNR เป้าหมายสําหรับรูปภาพ JPEG 2000 และ Re-JPEG นอกจากนี้ยังค้นหาบรรทัดโดยใช้พารามิเตอร์คุณภาพของรูปภาพ JPEG 2000 และ JPEG เพื่อให้ใกล้เคียงกับ PSNR เป้าหมายมากที่สุด

ผลการบีบอัดจริงจะวัดเป็นเปอร์เซ็นต์โดยใช้สูตรต่อไปนี้

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

ผลลัพธ์

การทดสอบให้ผลดังต่อไปนี้สำหรับการเพิ่มการบีบอัดและไม่เป็นลบ

การได้รับการบีบอัดที่ไม่เป็นลบ

ทีมไม่ได้ลงโทษเมธอดหนึ่งหากวิธีการนั้นเพิ่มขนาดรูปภาพหลังการบีบอัด ซึ่งหมายความว่า Comput_percentage มีค่าเป็น 0 เมื่อ Composit_image.length มากกว่าค่า Original_image.length

การเพิ่มขึ้นของการบีบอัดเชิงลบ

ทีมอนุญาตให้ใช้ผลลัพธ์ของเปอร์เซ็นต์การบีบอัดเชิงลบเพื่อให้เข้าใจ ประสิทธิภาพเบื้องต้นของคอมเพรสเซอร์ต่างๆ มากขึ้น

เปอร์เซ็นต์การบีบอัดเฉลี่ยที่ได้จากวิธีทั้ง 3 วิธีมีดังนี้

Type PSNR ที่ได้รับเฉลี่ย % การบีบอัดเฉลี่ย
(ที่ได้รับการบีบอัดที่ไม่เป็นลบ)
% การบีบอัดเฉลี่ย
(ที่ได้รับการบีบอัดเชิงลบ)
WebP 39.38 41.30 39.80
JPEG 2000 39.49 27.67 9.71
JPEG ใหม่ 39.36 22.37 14.62

เมื่ออนุญาตให้ใช้การบีบอัดแบบเชิงลบ ประสิทธิภาพโดยเฉลี่ยสำหรับ JPEG 2000 จะต่ำกว่าของ JPEG ซึ่งอาจเกิดจากอาร์ติแฟกต์ที่มีความถี่สูงที่แสดงในรูปภาพ JPEG อาร์ติแฟกต์เหล่านี้จึงอาจทำให้เกิดการบีบอัดที่ไม่เป็นไปตามที่ต้องการ

การใช้ Kakadu ที่ใช้ในการทดลองเพื่อแปลงเป็น JPEG 2000 ไม่สามารถแปลงรูปภาพประมาณ 240,000 รูปได้

JPEG 2000 มีเปอร์เซ็นต์การบีบอัดต่ำกว่า Re-JPEG โดยมีเหตุผลหลักเป็น เพราะผลลัพธ์ JPEG 2000 เป็นการบีบอัดเชิงลบของรูปภาพจำนวนมาก ด้วยเหตุนี้ รูปภาพ JPEG จึงมีคะแนนการบีบอัดโดยรวมต่ำกว่า

ตัวเลขต่อไปนี้แสดงกราฟการกระจายของวิธีทั้ง 3 วิธี

รูปที่ 1: การกระจายประชากรของขนาดรูปภาพ

กราฟนี้แสดงให้เห็นว่ารูปภาพส่วนใหญ่มีขนาดเล็ก โดยทั่วไปแล้ว ความถี่ของรูปภาพที่มีขนาดเกิน 500K จะน้อยกว่า 100

รูปที่ 2: เปอร์เซ็นต์การบีบอัดสำหรับรูปภาพ WebP, JPEG และ JPEG 2000

กราฟนี้แสดงให้เห็นว่าส่วนเนื้อหาของรูปภาพที่บีบอัดด้วย WebP นั้น บีบอัดได้ดีกว่า re-jpeg และ jpeg 2000 นอกจากนี้ รูปภาพที่บีบอัดด้วย WebP มีการบีบอัดในเชิงบวกมากกว่ารูปภาพอื่นๆ

รูปที่ 3: การเปรียบเทียบขนาดรูปภาพและเปอร์เซ็นต์การบีบอัด

กราฟนี้แสดงให้เห็นว่า WebP บีบอัดได้ดีกว่ารูปแบบอื่นๆ โดยเฉพาะสำหรับรูปภาพที่มีขนาดเล็กกว่า