Сравнительное исследование

Сравнительное исследование WebP, JPEG и JPEG 2000, сентябрь 2010 г.

Примечание. Мы провели это начальное исследование с первой выпущенной нами версией WebP, в которой использовалась библиотека libvpx . Кроме того, исходными изображениями были изображения в формате JPEG, которые мы просканировали из Интернета. Основываясь на отзывах сообщества, мы провели новое исследование с версией 0.1.2 libwebp , начиная с изображений без потерь (PNG) в качестве источника. Новое исследование заменяет это исследование.

Команда WebP провела сравнительное исследование трех методов сжатия изображений на случайном наборе из 1 миллиона изображений. Цели исследования состояли в том, чтобы измерить степень сжатия, достигаемую этими методами, и проанализировать компромиссы между размером изображения и сжатием.

К 900 000 изображений JPEG, содержащихся в наборе данных, были применены три метода сжатия: WebP, JPEG 2000 и Re-JPEG. Изображения JPEG были повторно сжаты с помощью Re-JPEG, чтобы каждое из них было как можно ближе к целевому пиковому значению отношения сигнал-шум (PSNR). Команда анализировала изображения после того, как они были сжаты.

В дополнение к крупномасштабному исследованию команда вручную проверила 100 случайных изображений и обнаружила, что в большинстве случаев WebP обеспечивает приемлемое визуальное качество.

Выводы

WebP обеспечивает в целом более высокое сжатие, чем JPEG или JPEG 2000. Преимущества минимизации размера файла особенно велики для небольших изображений, которые чаще всего встречаются в Интернете.

Набор данных

Набор данных, использованный в исследовании, представлял собой набор из 1 миллиона изображений, случайно выбранных из хранилища изображений, просканированных из Интернета. В следующей таблице показано распределение различных типов изображений в наборе данных.

Тип Считать
JPEG ~900К
PNG ~47К
гифка ~47К
Другой ~6К

Дизайн эксперимента

Опыты проводились в два этапа:

  1. Команда запускала WebP на изображениях с целевым PSNR 42. Они настраивали параметр качества (QP) для кодировщика WebP, пока не достигли результата, максимально близкого к 42, насколько они могли получить для данного изображения. Таким образом, фактический PSNR, достигнутый для каждого изображения, не обязательно точно равен 42.

  2. Команда использовала значение PSNR для изображений, сжатых с помощью WebP, в качестве целевого PSNR для изображений JPEG 2000 и Re-JPEG. Они также выполнили линейный поиск по параметрам качества изображений JPEG 2000 и JPEG, чтобы максимально приблизиться к целевому PSNR.

Фактический результат сжатия измерялся в процентах по следующей формуле:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

Полученные результаты

Тесты дали следующие результаты для отрицательного и неотрицательного усиления сжатия:

Неотрицательный коэффициент сжатия

Команда не штрафовала метод, если этот метод увеличивал размер изображения после сжатия. То есть, Compression_percentage считался равным 0, когда сжатый_image.length был больше, чем original_image.length.

Отрицательное усиление сжатия

Команда допустила отрицательные результаты процента сжатия, чтобы лучше понять исходную производительность различных компрессоров.

Ниже приведены средние проценты сжатия, достигнутые каждым из трех методов.

Тип Среднее значение PSNR получено Средняя степень сжатия, %
(неотрицательный коэффициент сжатия)
Средняя степень сжатия, %
(отрицательное усиление сжатия)
WebP 39,38 41.30 39,80
JPEG 2000 39,49 27,67 9,71
Re-JPEG 39,36 22.37 14,62

Когда было разрешено отрицательное усиление сжатия, средняя производительность для JPEG 2000 была ниже, чем для JPEG. Это может быть связано с высокочастотными артефактами, присутствующими в изображениях JPEG; эти артефакты могут способствовать неидеальной ситуации сжатия.

Реализация Kakadu, используемая в эксперименте для преобразования в JPEG 2000, не смогла преобразовать примерно 240 000 изображений.

JPEG 2000 имел более низкий процент сжатия, чем Re-JPEG, прежде всего потому, что результат JPEG 2000 был отрицательным для многих изображений. По этой причине изображения в формате JPEG получили более низкий общий показатель сжатия.

На следующих рисунках представлены графики распределения для трех методов:

Рис. 1. Распределение популяции по размеру изображения

На графике видно, что большинство изображений были маленькими. Частота изображений размером более 500К обычно меньше 100.

Рисунок 2: Процент сжатия для изображений WebP, JPEG и JPEG 2000

Этот график показывает, что основная часть изображений, сжатых с помощью WebP, сжимается лучше, чем re-jpeg и jpeg 2000. Кроме того, изображения, сжатые с помощью WebP, имеют более положительное сжатие, чем другие.

Рис. 3. Сравнение размеров изображений и степени сжатия

Этот график показывает, что WebP обеспечивает лучшее сжатие, чем другие форматы, особенно для небольших изображений.