Estudo comparativo

Estudo comparativo de WebP, JPEG e JPEG 2000, setembro de 2010

Observação:realizamos esse estudo inicial com a primeira versão do WebP que lançamos, que usou a biblioteca libvpx. Além disso, as imagens de origem eram imagens JPEG que rastreiamos da Web. Com base no feedback da comunidade, realizamos um novo estudo com a versão 0.1.2 de libwebp começando com imagens sem perdas (PNG) como origem. O novo estudo substitui este.

A equipe do WebP realizou um estudo comparativo de três métodos de compactação de imagens em um conjunto aleatório de 1 milhão de imagens. Os objetivos do estudo foram medir a compressão alcançada por esses métodos e analisar as compensações entre tamanhos de imagem e compactação.

Três métodos de compactação, WebP, JPEG 2000 e Re-JPEG, foram aplicados às 900.000 imagens JPEG contidas no conjunto de dados. As imagens JPEG foram recompactadas com Re-JPEG para que cada uma estivesse o mais próximo possível de um valor máximo de proporção sinal-ruído (PSNR, na sigla em inglês) desejado. A análise da equipe foi feita nas imagens depois que elas foram compactadas.

Além do estudo em grande escala, a equipe inspecionou manualmente 100 imagens aleatórias e descobriu que, na maioria dos casos, o WebP fornece qualidade visual aceitável.

Conclusões

O formato WebP atinge uma compressão geral mais alta do que JPEG ou JPEG 2000. Os ganhos na minimização do tamanho do arquivo são particularmente altos para imagens menores, que são as mais comuns encontradas na Web.

Conjunto de dados

O conjunto de dados usado no estudo foi uma coleção de 1 milhão de imagens amostradas aleatoriamente de um repositório de imagens rastreadas da Web. A tabela a seguir mostra a distribuição de diferentes tipos de imagens no conjunto de dados.

Tipo Count
JPEG Aprox. 900 mil
PNG Aprox. 47 mil
GIF Aprox. 47 mil
Outros Cerca de 6 mil

Design do experimento

Os experimentos foram realizados em duas etapas:

  1. A equipe executou o WebP nas imagens com um PSNR 42. Eles ajustaram o parâmetro de qualidade (QP) para o codificador WebP até alcançar um resultado o mais próximo possível de 42 para uma determinada imagem. Portanto, o PSNR real alcançado para cada imagem não era necessariamente exatamente 42.

  2. A equipe usou o valor da PSNR para as imagens compactadas por WebP como o PSNR de destino para as imagens JPEG 2000 e Re-JPEG. A empresa também realizou uma pesquisa linear sobre os parâmetros de qualidade das imagens JPEG 2000 e JPEG para chegar o mais próximo possível do PSNR de destino.

O resultado real da compactação foi medido como uma porcentagem usando a seguinte fórmula:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

Resultados

Os testes produziram os seguintes resultados para ganho de compactação negativo e não negativo:

Ganho de compactação não negativo

A equipe não penalizou um método que aumentasse o tamanho da imagem após a compactação. Ou seja, compression_percentage foi considerada 0 quando o valor de compact_image.length for maior que o original_image.length.

Ganho de compactação negativo

A equipe permitiu resultados negativos de porcentagem de compressão para entender melhor o desempenho bruto dos vários compressores.

Veja a seguir as porcentagens médias de compactação alcançadas por cada um dos três métodos.

Tipo PSNR média obtida % média de compressão
(ganho de compactação não negativo)
% de compressão média
(ganho de compactação negativo)
WebP 39,38 41.30 39,80
JPEG 2000 39,49 27.67 9.71
Re-JPEG 39,36 22.37 14.62

Quando o ganho de compactação negativo era permitido, o desempenho médio do JPEG 2000 era menor do que o do JPEG. Isso pode ocorrer devido a artefatos de alta frequência presentes nas imagens JPEG. Esses artefatos podem contribuir para uma situação de compactação abaixo do ideal.

A implementação do Kakadu usada no experimento para converter para JPEG 2000 não conseguiu converter aproximadamente 240.000 imagens.

O JPEG 2000 teve porcentagens de compactação mais baixas do que o Re-JPEG, principalmente porque o resultado do JPEG 2000 foi uma compactação negativa para muitas imagens. Por esse motivo, as imagens JPEG alcançaram uma pontuação de compactação geral menor.

As figuras a seguir mostram gráficos de distribuição para os três métodos:

Figura 1: distribuição populacional do tamanho da imagem

O gráfico mostra que a maioria das imagens era pequena. A frequência das imagens com tamanho superior a 500 K geralmente é inferior a 100.

Figura 2: porcentagens de compactação para imagens WebP, JPEG e JPEG 2000

Este gráfico demonstra que o corpo de imagens compactadas com WebP foi compactada melhor do que as imagens rejpeg e jpeg 2000. Além disso, as imagens compactadas com WebP receberam uma compactação mais positiva do que as outras.

Figura 3: comparação dos tamanhos das imagens e da porcentagem de compactação

Este gráfico mostra que o WebP atinge uma compressão melhor do que os outros formatos, principalmente para imagens menores.