비교 연구

WebP, JPEG, JPEG 2000의 비교 연구, 2010년 9월

참고: Google에서는 libvpx 라이브러리를 사용하여 출시한 첫 번째 WebP 버전으로 이 초기 연구를 진행했습니다. 또한 소스 이미지는 웹에서 크롤링한 JPEG 이미지였습니다. Google에서는 커뮤니티의 의견에 따라 libwebp 버전 0.1.2에서 무손실 이미지 (PNG)를 소스로 사용하는 새로운 연구를 시작했습니다. 새로운 연구가 이 연구를 대체합니다.

WebP팀에서는 100만 개의 무작위 이미지 세트를 대상으로 세 가지 이미지 압축 방법에 관한 비교 연구를 수행했습니다. 이 연구의 목표는 이러한 방법으로 얻는 압축을 측정하고 이미지 크기와 압축 간의 절충점을 분석하는 것이었습니다.

데이터 세트에 포함된 900,000개의 JPEG 이미지에 세 가지 압축 메서드인 WebP, JPEG 2000, Re-JPEG가 적용되었습니다. JPEG 이미지는 Re-JPEG로 재압축되어 각 이미지가 타겟 최대 신호 대 잡음비 (PSNR) 값에 최대한 가까웠습니다. 이미지를 압축한 후에 분석했습니다.

대규모 연구 외에도 팀은 무작위 이미지 100개를 직접 조사한 결과 대부분의 경우 WebP가 허용 가능한 시각적 품질을 제공하는 것을 확인했습니다.

결론

WebP는 JPEG 또는 JPEG 2000보다 전반적으로 높은 압축을 달성합니다. 파일 크기 최소화의 이점은 웹에서 가장 흔하게 발견되는 작은 이미지의 경우 특히 높게 나타납니다.

데이터 세트

연구에서 사용된 데이터 세트는 웹에서 크롤링된 이미지 저장소에서 무작위로 샘플링한 100만 개의 이미지 모음입니다. 다음 표는 데이터 세트에서 다양한 유형의 이미지 분포를 보여줍니다.

유형 개수
JPEG 약 90만
PNG 약 4.7만
GIF 약 4.7만
기타 약 6,000명

실험 설계

실험은 두 단계로 진행되었습니다.

  1. 팀은 타겟 PSNR이 42인 이미지에서 WebP를 실행했습니다. 특정 이미지에서 얻을 수 있는 최대 42의 결과를 얻을 때까지 WebP 인코더의 품질 매개변수 (QP)를 조정했습니다. 따라서 각 이미지에 관해 달성된 실제 PSNR은 정확히 42가 아니었습니다.

  2. 팀은 WebP 압축 이미지의 PSNR 값을 JPEG 2000 및 Re-JPEG 이미지의 타겟 PSNR로 사용했습니다. 또한 타겟 PSNR에 최대한 근접하기 위해 JPEG 2000 및 JPEG 이미지의 품질 매개변수에 관해 라인 검색을 실행했습니다.

실제 압축 결과는 다음 수식을 사용하여 백분율로 측정했습니다.

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

결과

테스트 결과 음성 및 비음성 압축 이득에 관해 다음과 같은 결과가 나왔습니다.

비음수 압축 이득

팀은 이 메서드가 압축 후 이미지 크기를 늘리는 경우 페널티를 적용하지 않았습니다. 즉, compressed_image.length가 원본_image.length보다 크면 압축률_비율이 0으로 간주되었습니다.

음수 압축 게인

팀은 다양한 압축 프로그램의 원시 성능을 더 잘 이해할 수 있도록 압축률 음수 결과를 얻었습니다.

다음은 세 가지 방법을 통해 달성한 평균 압축 비율입니다.

유형 획득한 평균 PSNR 평균 압축 %
(음이 아닌 압축 이득)
평균 압축 %
(음수 압축 이득)
WebP 3,938만 41.30 39,800원
JPEG 2000 39,490원 27.67 9.71
다시 JPEG 3,936만 22.37 14.62

음수 압축 이득이 허용된 경우 JPEG 2000의 평균 성능은 JPEG의 성능보다 낮았습니다. 이는 JPEG 이미지에 고주파수 아티팩트가 있기 때문일 수 있습니다. 이러한 아티팩트는 이상적인 압축 상황에 영향을 줄 수 있습니다.

이 실험에서 JPEG 2000으로 변환하는 데 사용된 Kakadu 구현에서는 약 240,000개의 이미지를 변환하지 못했습니다.

JPEG 2000은 Re-JPEG보다 압축률이 낮았습니다. 주로 많은 이미지에서 JPEG 2000 결과가 네거티브 압축이었기 때문입니다. 따라서 JPEG 이미지의 전체 압축 점수가 더 낮았습니다.

다음 그림은 세 가지 방법의 분포 그래프를 보여줍니다.

그림 1: 이미지 크기 인구 분포

그래프는 대부분의 이미지가 작다는 것을 보여줍니다. 크기가 500K를 초과하는 이미지의 빈도는 일반적으로 100보다 작습니다.

그림 2: WebP, JPEG, JPEG 2000 이미지의 압축 비율

이 그래프는 WebP로 압축된 사진의 본문이 re-jpeg 및 jpeg 2000보다 더 나은 압축을 달성했음을 보여줍니다. 또한 WebP로 압축된 사진은 다른 사진보다 더 포지티브 압축적입니다.

그림 3: 이미지 크기와 압축 비율 비교

이 그래프는 WebP가 특히 작은 이미지의 경우 다른 형식보다 더 나은 압축을 달성함을 보여줍니다.