WebP 容器规范

简介

WebP 是一种图片格式,它使用 (i) VP8 关键帧编码,以有损方式压缩图片数据,或者 (ii) WebP 无损编码。这些编码方案可以使其比 JPEG、GIF 和 PNG 等旧格式更加高效。它针对通过网络(例如,网站)快速传输映像进行了优化。WebP 格式也与其他格式具有同等的功能(颜色配置文件、元数据、动画等)。本文档介绍了 WebP 文件的结构。

WebP 容器(即 WebP 的 RIFF 容器)可在 WebP 的基本用例(即包含编码为 VP8 关键帧的单张图片)之上提供功能支持。WebP 容器为以下各项提供了额外的支持:

  • 无损压缩:可以使用 WebP 无损格式对图像进行无损压缩。

  • 元数据:图片可能包含以可交换图片文件格式 (Exif) 或可扩展元数据平台 (XMP) 格式存储的元数据。

  • 透明度:图片可具有透明度,即 alpha 通道。

  • 颜色配置文件:如国际颜色联盟所述,图片可能具有嵌入式 ICC 配置文件。

  • 动画:一个图像可以有多个帧,这些帧之间带有暂停,这使其成为动画。

命名

建议在引用 WebP 容器时使用以下类型:

容器格式名称WebP
文件扩展名.webp
MIME 类型image/webp
统一类型标识符org.webmproject.webp

术语与基础知识

本文档中的“必须”“不得”“必需”“会”“不会”“应”“不应”“建议”“不推荐”“可以”和“可选”一词将按 BCP 14(RFC 21174 中的大写字母)所述进行解读,且仅按照 BCP 14 RFC 21174 中的所有规范显示。

WebP 文件包含静态图片(即经过编码的像素矩阵)或动画。(可选)它还可以包含透明度信息、颜色配置文件和元数据。我们将像素矩阵称为图片的“画布”

区块图中的位编号从最高有效位 (MSB 0) 的 0 开始,如 RFC 1166 中所述。

以下是本文档中使用的其他术语:

读取者/写入者
读取 WebP 文件的代码称为读取器,而编写此类文件的代码称为写入器
uint16
16 位小端字节序、无符号整数。
uint24
一个 24 位、小端字节序、无符号整数。
uint32
32 位、小端字节序、无符号整数。
FourCC
四字符代码 (FourCC) 是通过按小端顺序串联四个 ASCII 字符而创建的 uint32。这意味着“aaaa”(0x61616161) 和“AAAA”(0x41414141) 被视为不同的 FourCCs
从 1 开始
存储值按 -1 偏移的无符号整数字段,例如,此类字段会将值 25 存储为 24
ChunkHeader('ABCD')
用于描述各个分块的 FourCCChunk Size 标头,其中“ABCD”是分块的 FourCC。此元素的大小为 8 个字节。

RIFF 文件格式

WebP 文件格式基于 RIFF(资源交换文件格式)文档格式。

RIFF 文件的基本元素是区块。其中包括:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                         Chunk FourCC                          |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                          Chunk Size                           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         Chunk Payload                         :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
分块 FourCC:32 位
用于区块识别的 ASCII 四字符代码。
分块大小:32 位 (uint32)
区块的大小(以字节为单位),不包括此字段、区块标识符或填充。
分块载荷:分块大小字节
数据载荷。如果分块大小为奇数,则添加一个填充字节,该字节必须为 0 以符合 RIFF。

注意:RIFF 有一个惯例,即全大写的分块 FourCC 是适用于任何 RIFF 文件格式的标准分块,而专用于一种文件格式的 FourCC 全小写。WebP 不遵循此惯例。

WebP 文件标题

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|      'R'      |      'I'      |      'F'      |      'F'      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                           File Size                           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|      'W'      |      'E'      |      'B'      |      'P'      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
“RIFF”:32 位
ASCII 字符“R”“I”“F”“F”。
文件大小:32 位 (uint32)
文件的大小(以字节为单位),从偏移量 8 开始。此字段的最大值为 2^32 减去 10 个字节,因此整个文件的大小最多为 4 GiB 减去 2 个字节。
“WEBP”:32 位
ASCII 字符“W”“E”“B”“P”。

WebP 文件必须以 RIFF 标头开头,并带有 FourCC“WEBP”。标头中的文件大小是后面的分块的总大小加上“WEBP”FourCC 的 4 个字节。文件不应在文件大小指定的数据之后包含任何数据。读取器可以解析此类文件,忽略尾随数据。由于任何分块的大小都是偶数,因此 RIFF 标头指定的大小也是偶数。以下部分介绍了各个分块的内容。

简单文件格式(有损)

如果图片需要进行有损编码,并且不需要透明度或扩展格式提供的其他高级功能,则应使用此布局。 采用此布局的文件较小,且受旧版软件支持。

简单的 WebP(有损)文件格式:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                    WebP file header (12 bytes)                |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        'VP8 ' Chunk                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

“VP8”文本块:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8 ')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                           VP8 data                            :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
VP8 数据:Chunk Size 字节
VP8 比特流数据。

请注意,“VP8”FourCC 中的第四个字符是 ASCII 空格 (0x20)。

VP8 数据格式和解码指南中介绍了 VP8 比特流格式规范。请注意,VP8 帧标头包含 VP8 帧宽度和高度。假设这就是画布的宽度和高度。

VP8 规范介绍了如何将图像解码为 Y'CbCr 格式。如需转换为 RGB,应使用建议 BT.601。应用可以使用其他转换方法,但各解码器的可视化结果可能会有所不同。

简单文件格式(无损)

注意:旧款读取器可能不支持使用无损格式的文件。

如果图像需要进行无损编码(具有可选的透明度通道),并且不需要扩展格式提供的高级功能,则应使用此布局。

简单的 WebP(无损)文件格式:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                    WebP file header (12 bytes)                |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         'VP8L' Chunk                          :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

“VP8L”代码块:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8L')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                           VP8L data                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
VP8L 数据:Chunk Size 字节
VP8L 比特流数据。

如需了解 VP8L 比特流的当前规范,请参阅 WebP 无损比特流格式。请注意,VP8L 头文件包含 VP8L 图片的宽度和高度。这假定为画布的宽度和高度。

扩展文件格式

注意:年长的阅读器可能不支持使用扩展格式的文件。

扩展格式文件包含以下内容:

  • 包含文件中所用功能相关信息的“VP8X”分块。

  • 具有颜色配置文件的可选“ICCP”块。

  • 包含动画控制数据的可选“ANIM”分块。

  • 图片数据。

  • 带有 Exif 元数据的可选“EXIF”块。

  • 可选的“XMP”块,其中包含 XMP 元数据。

  • 未知分块的可选列表。

对于静态图片,图片数据由单个帧组成,该帧由以下部分组成:

对于动画图片图片数据由多个帧组成。如需详细了解帧,请参阅动画部分。

所有分块的放置顺序应与上面列出的顺序相同。如果某个分块出现在错误的位置,则表示文件无效,但读取器可以解析该文件,从而忽略顺序有误的分块。

说明:设置分块的顺序应该可以加快文件解析速度。例如,如果“ALPH”块未显示在其所需位置上,则解码器可以选择停止搜索它。忽略延迟区块的规则应使需要执行完整搜索的程序提供与提前停止的程序相同的结果。

扩展的 WebP 文件标题:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                   WebP file header (12 bytes)                 |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8X')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Rsv|I|L|E|X|A|R|                   Reserved                    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|          Canvas Width Minus One               |             ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...  Canvas Height Minus One    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
预留 (Rsv):2 位
必须是 0。读取程序必须忽略此字段。
ICC 配置文件 (I):1 位
当文件包含“ICCP”分块时设置。
Alpha (L):1 位
如果图片的任何帧包含透明度信息(“alpha”),则设置此项。
Exif 元数据 (E):1 位
如果文件包含 Exif 元数据,则设置此参数。
XMP 元数据 (X):1 位
如果文件包含 XMP 元数据,则设置此项。
动画 (A):1 位
设置此图片是否为动画图片。“ANIM”和“ANMF”数据块中的数据应用于控制动画。
预留 (R):1 位
必须是 0。读取程序必须忽略此字段。
预留:24 位
必须是 0。读取程序必须忽略此字段。
画布宽度减一:24 位
画布宽度(以像素为单位),从 1 开始。 实际画布宽度为 1 + Canvas Width Minus One
画布高度减一:24 位
画布高度(以像素为单位),从 1 开始。 实际画布高度为 1 + Canvas Height Minus One

Canvas WidthCanvas Height 的乘积不得超过 2^32 - 1

以后的规范可能会添加更多字段。必须忽略未知字段。

动画

动画由“ANIM”和“ANMF”分块控制。

“ANIM”文本块:

对于动画图片,此数据块包含动画的全局参数

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ANIM')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       Background Color                        |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|          Loop Count           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
背景颜色:32 位 (uint32)
画布的默认背景颜色,按 [蓝色、绿色、红色、Alpha] 字节顺序排列。此颜色可以用于填充画布上帧周围未使用的空间以及第一帧的透明像素。当 Disposal 方法是 1 时,也会使用背景颜色。

注意

  • 背景颜色可以包含非不透明 Alpha 值,即使“VP8X”分块中的 Alpha 标志未设置也是如此。

  • 查看器应用应将背景颜色值视为提示,并且不需要使用该值。

  • 在每次循环开始时清除画布。为此,可以使用背景颜色。

循环计数:16 位 (uint16)
动画循环播放的次数。如果为 0,则表示无限。

如果“VP8X”分块中的 Animation 标记,则必须显示该分块。 如果未设置 Animation 标记,且存在此分块,则必须忽略该标记。

“ANMF”文本块:

对于动画图片,此数据块包含有关单个帧的信息。如果未设置 Animation 标志,则不应显示此区块。

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ANMF')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                        Frame X                |             ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...          Frame Y            |   Frame Width Minus One     ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...             |           Frame Height Minus One              |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                 Frame Duration                |  Reserved |B|D|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         Frame Data                            :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
帧 X:24 位 (uint24)
帧左上角的 X 坐标为 Frame X * 2
帧 Y:24 位 (uint24)
帧左上角的 Y 坐标为 Frame Y * 2
帧宽度减 1:24 位 (uint24)
帧的宽度,从 1 开始。 框架宽度为 1 + Frame Width Minus One
帧高度减 1:24 位 (uint24)
帧的高度(从 1 开始)。框架高度为 1 + Frame Height Minus One
帧时长:24 位 (uint24)
在显示下一帧之前等待的时间(以 1 毫秒为单位)。请注意,对帧时长为 0(通常小于或等于 10)的解释由实现定义。许多工具和浏览器都会指定与 GIF 类似的最短时长。
预留:6 位
必须是 0。读取程序必须忽略此字段。
混合方法 (B):1 位

指示当前帧的透明像素与上一画布的相应像素混合程度的程度:

  • 0:使用 Alpha 混合。处理上一帧后,使用 Alpha 混合在画布上渲染当前帧(见下文)。如果当前帧没有 Alpha 通道,则假设 Alpha 值为 255,实际上是替换矩形。

  • 1:请勿混合。处理完上一帧后,覆盖当前帧所覆盖的矩形,以在画布上渲染当前帧。

处置方法 (D):1 位

指示当当前帧在画布上显示后(渲染下一帧之前)该如何处理该帧:

  • 0:请勿丢弃。将画布保留原样。

  • 1:处理背景颜色。在被当前帧覆盖的画布上,使用“ANIM”分块中指定的背景颜色填充矩形

注意

  • 帧处置仅适用于帧矩形,即由帧 X帧 Y帧宽度帧高度定义的矩形。不一定能覆盖整个画布。

  • Alpha 混合:

    鉴于每个 R、G、B 和 A 通道都是 8 位,并且 RGB 通道没有被 alpha 预乘,因此将“dst”混合到“src”通道的公式为:

    blend.A = src.A + dst.A * (1 - src.A / 255)
    if blend.A = 0 then
      blend.RGB = 0
    else
      blend.RGB =
          (src.RGB * src.A +
           dst.RGB * dst.A * (1 - src.A / 255)) / blend.A
    
  • Alpha 混合应在线性颜色空间中进行,考虑到图片的颜色配置文件。如果颜色配置文件不存在,则假定采用标准 RGB (sRGB)。(请注意,由于灰度系数约为 2.2,因此 sRGB 也需要线性化。)

帧数据:Chunk Size - 16 字节

包含:

注意:上文中的“ANMF”载荷(即上文的“帧数据”)由各个填充的区块组成,如 RIFF 文件格式所述。

Alpha

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ALPH')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Rsv| P | F | C |     Alpha Bitstream...                        |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
预留 (Rsv):2 位
必须是 0。读取程序必须忽略此字段。
预处理 (P):2 位

这些信息性位用于指示压缩期间执行的预处理。例如,解码器可以使用此信息在显示之前抖动值或平滑渐变。

  • 0:不预处理。
  • 1:降低级别。

解码器无需以任何指定方式使用这些信息。

过滤方法 (F):2 位

下面介绍了所使用的过滤方法:

  • 0:无。
  • 1:横向过滤条件。
  • 2:纵向滤镜。
  • 3:渐变滤镜。

对于每个像素,过滤是通过以下计算执行的。假设当前 X 位置周围的 Alpha 值标记为:

 C | B |
---+---+
 A | X |

我们尝试计算位置 X 处的 alpha 值。首先,根据过滤方法进行预测:

  • 方法 0:predictor = 0
  • 方法 1:predictor = A
  • 方法 2:Predictor = B
  • 方法 3:predictor = clip(A + B - C)

其中 clip(v) 等于:

  • 如果 v < 0,则为 0,
  • 如果 v > 255,则为 255,或
  • v 否则

最终值通过以下方式派生出:将解压缩的值 X 添加到预测器,并使用模 256 算术将 [256..511] 范围封装到 [0..255] 范围中:

alpha = (predictor + X) % 256

最左侧和最顶部的像素位置有一些特殊情况。例如,位置 (0, 0) 处的左上角值使用 0 作为预测器值。否则:

  • 对于水平或渐变过滤方法,位置 (0, y) 最左侧的像素是使用上述位置 (0, y-1) 预测的。
  • 对于垂直或渐变过滤方法,位置 (x, 0) 最顶部的像素是使用左侧的位置 (x-1, 0) 预测的。
压缩方法 (C):2 位

使用的压缩方法:

  • 0:不压缩。
  • 1:使用 WebP 无损格式进行压缩。
Alpha 比特流:分块大小 - 1 字节

编码的 Alpha 比特流。

该可选块包含该帧的已编码 Alpha 数据。包含“VP8L”分块的帧不应包含此分块。

说明:透明度信息已经是“VP8L”分块的一部分。

Alpha 通道数据以未压缩的原始数据形式存储(当压缩方法为“0”时),或使用无损格式进行压缩(当压缩方法为“1”时)。

  • 原始数据:由长度 = 宽度 * 高度的字节序列组成,包含所有 8 位透明度值(按扫描顺序)。

  • 无损格式压缩:字节序列是一个隐式维度(宽度 x 高度)的压缩图像流(如“WebP 无损比特流格式”中所述)。也就是说,此图片流不包含任何描述图片尺寸的标头。

    说明:这些维度已经是其他来源已知的维度,因此再次存储这些维度是多余的,并且容易出错。

    将图像流解码为 Alpha、红色、绿色、蓝色 (ARGB) 颜色值后,必须按照无损格式规范中所述的过程,从 ARGB 四元组的绿色通道提取透明度信息。

    说明:规范中允许绿色通道使用其他可以提高压缩率的额外转换步骤(与其他通道不同)。

比特流 (VP8/VP8L)

此分块包含单个帧的压缩比特流数据。

比特流区块可以是 (i) 使用“VP8”(注意有效的第四个字符空间)作为其 FourCC 的“VP8”区块,或者 (ii) 使用“VP8L”作为其 FourCC 的“VP8L”区块。

简单文件格式(有损)简单文件格式(无损)部分分别介绍了“VP8”和“VP8L”分块的格式。

颜色配置文件

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ICCP')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                       Color Profile                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
颜色配置文件:Chunk Size 字节
ICC 配置文件。

此数据块必须显示在图片数据之前。

此类分块最多只能有一个。如果有更多这样的分块,读取器可以忽略除第一个分块之外的所有分块。 如需了解详情,请参阅 ICC 规范

如果此分块不存在,应假定使用 sRGB。

元数据

元数据可存储在“EXIF”或“XMP”块中。

每种类型(EXIF 和“XMP”)最多只有一个分块。如果此类分块的数量更多,则读取器可以忽略除第一个分块之外的所有分块。

这些块的定义如下:

“EXIF”文本块:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('EXIF')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        Exif Metadata                          :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Exif 元数据:Chunk Size 字节
Exif 格式的图片元数据。

“XMP”文本块:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('XMP ')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        XMP Metadata                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
XMP 元数据:Chunk Size 字节
XMP 格式的图片元数据。

请注意,“XMP”FourCC 中的第四个字符是 ASCII 空格 (0x20)。

如需关于处理元数据的更多指导,请参阅元数据工作组的“处理元数据指南”

未知数据块

其 FourCC 不同于本文档中描述的任何分块的 RIFF 分块(在 RIFF 文件格式部分进行描述)会被视为未知分块。

说明:允许未知块为将来的格式扩展提供了预配,同时允许存储任何特定于应用的数据。

文件可能包含未知分块:

读取器应忽略这些分块。写入者应按原始顺序保留这些区块(除非他们明确打算修改这些区块)。

通过框架组装画布

下面简要介绍了在动画图片的情况下,读者必须如何组装画布。

首先,使用“VP8X”区块中指定的尺寸创建一个画布,即宽 Canvas Width Minus One + 1 像素,高 Canvas Height Minus One + 1 像素。“ANIM”分块中的 Loop Count 字段用于控制动画过程的重复次数。如果 Loop Count 值不为零,则为 Loop Count - 1;如果 Loop Count 为零,则为无限。

在每次循环迭代开始时,画布使用“ANIM”分块中的背景颜色或应用定义的颜色进行填充。

“ANMF”分块包含按显示顺序给定的各个帧。在渲染每一帧之前,系统会应用上一帧的 Disposal method

使用画布左上角作为原点,从笛卡尔坐标(2 * Frame X2 * Frame Y)开始渲染解码帧。Frame Width Minus One + 1(宽)x Frame Height Minus One + 1(高)像素是使用 Blending method 渲染到画布上。

画布显示 Frame Duration 毫秒。此过程会一直持续到显示“ANMF”分块的所有帧。然后开始新的循环迭代;如果所有迭代都已完成,则画布将保持其最终状态。

以下伪代码说明了呈现过程。表示法 VP8X.field 表示“VP8X”分块中具有相同说明的字段。

VP8X.flags.hasAnimation MUST be TRUE
canvas ← new image of size VP8X.canvasWidth x VP8X.canvasHeight with
         background color ANIM.background_color.
loop_count ← ANIM.loopCount
dispose_method ← Dispose to background color
if loop_count == 0:
  loop_count = ∞
frame_params ← nil
next chunk in image_data is ANMF MUST be TRUE
for loop = 0..loop_count - 1
  clear canvas to ANIM.background_color or application-defined color
  until eof or non-ANMF chunk
    frame_params.frameX = Frame X
    frame_params.frameY = Frame Y
    frame_params.frameWidth = Frame Width Minus One + 1
    frame_params.frameHeight = Frame Height Minus One + 1
    frame_params.frameDuration = Frame Duration
    frame_right = frame_params.frameX + frame_params.frameWidth
    frame_bottom = frame_params.frameY + frame_params.frameHeight
    VP8X.canvasWidth >= frame_right MUST be TRUE
    VP8X.canvasHeight >= frame_bottom MUST be TRUE
    for subchunk in 'Frame Data':
      if subchunk.tag == "ALPH":
        alpha subchunks not found in 'Frame Data' earlier MUST be
          TRUE
        frame_params.alpha = alpha_data
      else if subchunk.tag == "VP8 " OR subchunk.tag == "VP8L":
        bitstream subchunks not found in 'Frame Data' earlier MUST
          be TRUE
        frame_params.bitstream = bitstream_data
    render frame with frame_params.alpha and frame_params.bitstream
      on canvas with top-left corner at (frame_params.frameX,
      frame_params.frameY), using Blending method
      frame_params.blendingMethod.
    canvas contains the decoded image.
    Show the contents of the canvas for
    frame_params.frameDuration * 1 ms.
    dispose_method = frame_params.disposeMethod

文件布局示例

使用 alpha 的有损编码图像可能如下所示:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ALPH (alpha bitstream)
+- VP8 (bitstream)

无损编码图像可能如下所示:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- VP8L (lossless bitstream)
+- XYZW (unknown chunk)

包含 ICC 配置文件和 XMP 元数据的无损图像可能如下所示:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ICCP (color profile)
+- VP8L (lossless bitstream)
+- XMP  (metadata)

包含 Exif 元数据的动画图片可能如下所示:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ANIM (global animation parameters)
+- ANMF (frame1 parameters + data)
+- ANMF (frame2 parameters + data)
+- ANMF (frame3 parameters + data)
+- ANMF (frame4 parameters + data)
+- EXIF (metadata)