简介
我们根据 libwebp
中发布的新编码器对 WebP 和 JPEG 图片压缩进行了比较,目标是使用公开提供的工具运行一系列易于重复的实验,并比较 WebP 和 JPEG 实现的图片压缩。
我们早期的 WebP 比较研究侧重于评估大量图片,并且基于从网络中抓取的 JPEG 源进行。JPEG 是一种有损压缩格式,它会在源中引入压缩伪影。此外,我们最初使用峰值信噪比(即 PSNR)作为质量指标。将 PSNR 用作图片的质量指标时,存在一些缺点。根据社区的反馈,我们对 PNG 图片进行了实验,其中包括一些标准测试套件中提供的图片。在这项研究中,我们使用结构相似性(即 SSIM)作为这项研究的质量指标。SSIM 被认为是更好的视觉质量指标。
调研方法
我们将介绍两种类型的评估。在第一个案例中,我们研究了 WebP 在 JPEG 的相同质量级别下可实现的额外压缩。具体而言,我们会生成与 JPEG 图片具有相同质量(根据 SSIM 索引)的 WebP 图片,然后比较 WebP 和 JPEG 图片的文件大小。在第二种情况下,我们分析 WebP 和 JPEG 的 SSIM 与每像素比 (bpp) 图。这些曲线图展示了 WebP 和 JPEG 的速率失真权衡。
实验的数据集由 PNG 图片组成。这些图像是从可公开访问的标准测试图像套件以及从网络抓取的大量 PNG 图像中获取的。
每个实验都包括运行一组命令。只有公开提供的命令行工具用于确保实验可以合理地重现给其他人。此实验中使用的命令行工具包括:
identify
和convert
是 ImageMagick 中的命令行工具。我们使用版本 6.5.7 进行此分析。我们使用convert
在 PNG 和 PPM 格式之间进行转换。我们使用identify
提取图片的宽度和高度信息。cwebp
和dwebp
是命令行工具,是我们在 2011 年第一季度发布的libwebp
库的一部分。我们使用的是该库的 0.1.2 版。我们使用cwebp
和dwebp
对 WebP 图片进行编码和解码。我们使用了这些工具的默认编码和解码参数。cjpeg
和djpeg
是属于libjpeg
库一部分的命令行工具。我们使用的是该库的 6b 版。我们使用cjpeg
和djpeg
对 JPEG 图片进行编码和解码。我们结合使用了cjpeg
和-optimize
标志来优化文件大小。我们将所有其他参数设为其默认值。
使用 SSIM 测量图像质量。如前所述,SSIM 通常被视为比 PSNR 更好的质量指标。对于 SSIM 索引计算,我们使用了 C++ 公开提供的实现。读取器可以从代码库下载我们在实验中使用的 Python 脚本作为参考。
图像数据集
我们选择了数据集来评估标准测试图片集合以及大量图片。下面列出了实验中使用的数据集。
Lenna:广泛使用的 Lenna 图片(512 x 512 像素)。
Kodak:来自 Kodak 真彩色图像套件的 24 张图片。
Tecnick:Tecnick.com 上的图片库中的 100 张图片。我们使用了原始大小的 100 张 RGB 彩色图片。
Image_crawl::为了测试大量图片,我们从 Google 图片搜索网页抓取数据库中收集了 PNG 图片的随机样本。抓取的大多数 PNG 图片都是图标、图形、图表、扫描文档等内容。但是,标准测试集合中的大多数图片都像照片,而不是计算机生成的图片。为了使此数据集在本质上与标准测试套件类似,我们对这些 PNG 图片运行了人脸检测算法,并且在此实验中仅考虑通过了此检测测试的那些图片(约 11000 张)。
实验 1:采用相同 SSIM 索引的 WebP 与 JPEG
在此实验中,我们以类似的 SSIM 值生成 JPEG 和 WebP 图片,并测量文件大小的比率。实验步骤如下:
使用固定质量参数 Q 将源 PNG 图片压缩为 JPEG,并记录源 PNG 图片和经过压缩的 JPEG 图片之间的 SSIM。
使用尽可能接近上述录制 SSIM 的质量参数将同一源图片压缩为 WebP 格式。
我们对数据集中的所有图片执行了上述两个步骤,然后测量了 JPEG 和 WebP 图片的平均文件大小和 SSIM。
下表显示了此实验针对 JPEG 质量参数 Q 的三个不同值(50、75 和 95)的结果。质量参数 50 和 95 分别表示低比特率和高比特率的图片压缩。我们还添加了 JPEG 质量参数 75,因为它是 JPEG 图片通常建议的质量级别。
表 1:JPEG Q=50 中相同 SSIM 索引对应的 WebP 和 JPEG 的平均文件大小
伦娜 | Kodak | 泰奇尼克 | Image_crawl | |
---|---|---|---|---|
WebP:平均文件大小 (平均 SSIM 卡) |
17.4 KB (0.841) |
31.0 KB (0.898) |
92.4 KB (0.917) |
6.5 KB (0.901) |
JPEG:平均文件大小 (平均 SSIM 卡) |
23.5 KB (0.840) |
42.7 KB (0.897) |
124.6 KB (0.916) |
9.9 KB (0.899) |
WebP 与 JPEG 文件大小的比率 | 0.74 | 0.72 | 0.74 | 0.66 |
表 2:WebP 和 JPEG 的平均文件大小(对应于 JPEG Q=75 的相同 SSIM 索引)
伦娜 | Kodak | 泰奇尼克 | Image_crawl | |
---|---|---|---|---|
WebP:平均文件大小 (平均 SSIM 卡) |
26.7 KB (0.864) |
46.5 KB (0.932) |
139.0 KB (0.939) |
9.9 KB (0.930) |
JPEG:平均文件大小 (平均 SSIM 卡) |
37.0 KB (0.863) |
66.0 KB (0.931) |
191.0 KB (0.938) |
14.4 KB (0.929) |
WebP 与 JPEG 文件大小的比率 | 0.72 | 0.70 | 0.73 | 0.69 |
表 3:JPEG Q=95 对应的相同 SSIM 索引对应的 WebP 和 JPEG 的平均文件大小
伦娜 | Kodak | 泰奇尼克 | Image_crawl | |
---|---|---|---|---|
WebP:平均文件大小 (平均 SSIM 卡) |
74.3 KB (0.910) |
118.0 KB (0.978) |
356.0 KB (0.970) |
23.4 KB (0.969) |
JPEG:平均文件大小 (平均 SSIM 卡) |
104 KB (0.907) |
162 KB (0.976) |
492 KB (0.970) |
31.3 KB (0.968) |
WebP 与 JPEG 文件大小的比率 | 0.71 | 0.73 | 0.72 | 0.75 |
从上表中,我们观察到,与 SSIM 索引相同或略高的 JPEG 相比,WebP 可额外提供 25%-34% 的压缩增益。
实验 2:针对 WebP 和 JPEG 的 SSIM 与 BPP 图
我们研究了 JPEG 和 WebP 的速率失真权衡。具体而言,我们研究了 JPEG 和 WebP 的 SSIM 与每像素比特 (bpp) 图。我们获取 PNG 源图片,并使用所有可能的 (0-100) 质量值将其压缩为 JPEG 和 WebP。然后,对于每个质量值,我们绘制 JPEG 和 WebP 的 SSIM 和 bpp。下图显示了从我们使用的 3 个公开数据集中挑选的 3 张图片的 SSIM 与 bpp 图。
图 1:Lenna 的 SSIM 与 BPP 对比
图 2:来自 Kodak 数据集的 kodim19.png 的 SSIM 与 BPP 对比
图 3:Tecnick 数据集内 RGB_OR_1200x1200_061.png 的 SSIM 与 BPP
此外,我们还研究了 Koodak 和 Tecnick 数据集的 SSIM 与 bpp 图的平均行为。为了绘制平均行为,我们使用 WebP 和 JPEG 以 100 个不同的质量值压缩数据集中的所有图片。然后,我们绘制每个质量值的 SSIM 和 bpp 的平均值。图片抓取数据集由不适合进行此类数据聚合的异构图片组成。以下曲线图分别显示了 Kodak 和 Tecnick 数据集的 SSIM 和 bpp 的平均行为。
图 4:柯达数据集的 SSIM 与 BPP 对比
图 5:Tecnick 数据集的 SSIM 与 BPP 对比
总的来说,从以上曲线图中可以看出,为了实现相同的 SSIM 索引,WebP 始终需要比 JPEG 更少的每像素位数。
总结
该研究评估了 WebP 压缩的效果(与 JPEG 相比)。我们发现,与采用相同 SSIM 索引下的 JPEG 文件大小相比,WebP 文件的平均大小要小 25%-34%。SSIM 与 bpp 的对比图表明,对于相同的 SSIM 索引,WebP 需要的每像素位数始终比 JPEG 少。这些结果表明,与 JPEG 相比,WebP 可以在压缩率方面得到显著改善。
1 Huynh-Thu, Q.;Ghanbari, M. (2008 年)。“PSNR 在图片/视频质量评估中的有效性范围”。电子信函 44:800-801.doi:10.1049/el:20080522。
2 Z. Wang、A. C. Bovik, H. R. Sheikh 和 E. P. Simoncelli,“图像质量评估:从错误测量到结构相似性”,图像处理,IEEE 交易,第 13 卷,第 4 期,第 600-612 页,2004 年。