了解噪声的含义、添加位置以及对衡量工作的影响。
摘要报告是可汇总报告的汇总结果。当可汇总报告由收集器分批处理并由汇总服务处理时,系统会向生成的摘要报告中添加噪声(随机数量的数据)。添加噪声是为了保护用户隐私。此机制的目标是拥有一个可以支持差分隐私衡量的框架。

摘要报告中的噪声简介
虽然目前广告效果衡量通常不添加噪声,但在许多情况下,添加的噪声不会显著改变您对结果的解读。
您可以通过以下方式思考这个问题:如果某些数据没有噪声,您是否会很有信心根据这些数据做出决策?
例如,如果广告系列 A 获得了 15 次转化,广告系列 B 获得了 16 次转化,广告客户是否有信心据此更改其广告系列策略或预算?
如果答案是否定的,则噪声无关紧要。
您需要配置 API 使用情况,以便:
- 上述问题的答案是肯定的。
- 噪声的管理方式不会显著影响您根据特定数据做出决策的能力。您可以按如下方式进行处理:对于预期的最低转化次数,您希望收集的指标中的噪声保持在一定百分比以下。
在本部分和下一部分中,我们将概述实现 2 的策略。
核心概念
每次请求摘要报告时,汇总服务都会向每个摘要值添加一次噪声(即每个键一次)。
这些噪声值是从特定概率分布中随机抽取的,下文对此进行了介绍。
影响噪声的所有元素都依赖于两个主要概念。
无论摘要值是低还是高,噪声分布(详见下文)都是相同的。因此,摘要值越高,相对于此值,噪声的影响就越小。
例如,假设总购买金额为 2 万美元的汇总数据和总购买金额为 200 美元的汇总数据都受到来自同一分布的数据噪声的影响。
假设此分布中的噪声大致在 -100 到 +100 之间变化。
- 对于摘要购买价值 2 万美元,噪声介于 0 到 100/20,000=0.5% 之间。
- 对于摘要购买价值 200 美元,噪声介于 0 到 100/200=50% 之间。
因此,噪声对 2 万美元的汇总购买金额的影响可能低于对 200 美元的购买金额的影响。相对而言,2 万美元的数据噪声可能较少,也就是说,信噪比可能较高。
这具有一些重要的实际意义,下一部分将对此进行介绍。此机制是 API 设计的一部分,其实际影响是长期性的。在广告技术平台设计和评估各种汇总策略时,这些指标将继续发挥重要作用。
虽然噪声是从相同的分布中提取的,但该分布取决于多个参数。在已完成的来源测试期间,广告技术平台可以更改其中一个参数(即 epsilon),以评估各种实用性/隐私权调整。不过,请将调整 epsilon 的功能视为暂时性的。我们非常欢迎您就用例以及效果良好的 epsilon 值提供反馈。
虽然广告技术公司无法直接控制噪声的添加方式,但可以影响噪声对其效果衡量数据的影响。在下一部分中,我们将深入探讨在实践中如何影响噪声。
在开始之前,我们先来详细了解一下噪声的应用方式。
放大:如何应用噪声
一种噪声分布
噪声是从拉普拉斯分布中提取的,具有以下参数:
- 平均值 (
μ
) 为 0。这意味着,最可能的噪声值为 0(未添加噪声),并且带噪声的值与原始值一样可能小于原始值,也可能大于原始值(这有时称为无偏)。 b = CONTRIBUTION_BUDGET
/epsilon
的缩放参数。CONTRIBUTION_BUDGET
在浏览器中定义。epsilon
在汇总服务中使用。
下图显示了 μ=0、b = 20 的拉普拉斯分布的概率密度函数:

随机噪声值,一种噪声分布
假设广告技术平台请求两个汇总键(key1 和 key2)的摘要报告。
汇总服务会根据相同的噪声分布选择两个噪声值 x1 和 x2。x1 会添加到 key1 的摘要值,x2 会添加到 key2 的摘要值。
在图表中,我们将噪声值表示为相同。这只是一个简化;实际上,噪声值会因从分布中随机抽取而有所不同。
这说明噪声值均来自同一分布,并且与应用于它们的摘要值无关。
噪声的其他属性
系统会对每个摘要值(包括空值 [0])应用噪声。

例如,即使给定键的真实摘要值为 0,您在该键的摘要报告中看到的噪声摘要值(很可能)也不会为 0。
噪声可以是正数,也可以是负数。

例如,如果扣除噪声后的购买金额为 327,000,噪声可能为 +6,000 或 -6,000(这些值只是示例值)。
评估噪声
计算噪声的标准差
噪声的标准差为:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
示例
当 epsilon = 10 时,噪声的标准差为:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
评估测量差异是否显著
由于您会知道聚合服务向每个输出值添加的噪声的标准差,因此可以确定适当的比较阈值,以确定观察到的差异是否可能由噪声引起。
例如,如果添加到某个值的噪声大约为 +/- 10(考虑到缩放),而两个广告系列之间的值差异超过 100,那么我们可以肯定地得出结论,测量到的每个广告系列之间的值差异并非仅仅由噪声造成。
互动和分享反馈
您可以参与试用并试用此 API。
- 了解可汇总报告和汇总服务,提出问题并提出反馈。
- 阅读归因报告指南。
- 在 Privacy Sandbox 开发者支持代码库中提问并加入讨论。
后续步骤
- 如需了解您可以控制哪些变量来提高信噪比,请参阅处理噪声。
- 如需帮助规划汇总报告策略,请参阅试验摘要报告设计决策。
- 试用噪声实验。