了解噪声的含义、噪声来源,以及噪声对衡量工作的影响。
摘要报告是汇总可汇总报告的结果。 当收集器对可汇总报告进行批量处理并由汇总服务处理时,系统会在生成的摘要报告中添加噪声(随机数量的数据)。 添加了噪声以保护用户隐私。此机制的目标是拥有一个可以支持差分隐私衡量的框架。
摘要报告中的噪声简介
虽然添加干扰数据目前通常不纳入衡量广告效果,但在很多情况下,添加干扰数据不会大幅改变您对结果的解读方式。
您不妨这样想一想: 如果一部分数据并不嘈杂,您是否有信心根据该数据做出决策?
例如,如果广告系列 A 获得了 15 次转化,广告系列 B 获得了 16 次转化,广告客户是否有信心更改广告系列策略或预算?
如果答案是否定的,则表示噪声不相关。
您需要按照以下方式配置 API 使用:
- 上述问题的答案是“是”。
- 管理噪声时,不会对您根据特定数据做出决策产生很大影响。您可以按以下方式处理:对于预期的最低转化次数,您希望将所收集指标中的噪声保持在一定百分比以下。
在本节和后续部分中,我们将概述实现以下目标的策略:2.
核心概念
每当请求摘要报告时,汇总服务都会向每个摘要值添加一次噪声(即每个键添加一次噪声)。
这些噪声值是从下文讨论的特定概率分布中随机抽取的。
影响噪声的所有元素都依赖于两个主要概念。
无论摘要值是低还是高,噪声分布(详情见下文)都是一样的。因此,相对于此值,汇总值越高,噪声产生的影响越小。
例如,假设总购买总价值为 20,000 美元和总购买总价值 200 美元均需应用从同一分布中选择的噪声。
我们假设此分布的噪声大约在 -100 到 +100 之间。
- 对于 20,000 美元的总购买价值,噪声在 0 到 100/20,000=0.5% 之间不等。
- 对于 200 美元的总购买价值,噪声在 0 到 100/200=50% 之间不等。
因此,相较于 200 美元,噪声对 20,000 美元总购买价值的影响可能较小。相对而言,20,000 美元的噪声很小,也就是说,信号与噪声比可能会比较高。
这会带来一些重要的实际影响,将在下一部分中介绍。此机制是 API 设计的一部分,其实际影响是长期的。在广告技术平台设计和评估各种汇总策略时,它们将继续发挥重要作用。
虽然噪声是从同一个分布中抽取的,而不考虑摘要值,但这种分布取决于多个参数。在结束的源试用期间,广告技术平台可以更改其中一个参数 epsilon,以评估各种实用性/隐私权调整。不过,将调整 epsilon 的功能视为临时能力。我们欢迎您针对自己的使用场景以及 epsilon 价值观提供反馈。
虽然广告技术公司无法直接控制噪声的添加方式,但可能会影响噪声对其衡量数据的影响。在接下来的部分中,我们将深入探讨在实践中如何影响噪声。
在此之前,让我们详细了解一下应用噪声的方式。
放大:应用噪声的方式
一种噪声分布
噪声是根据拉普拉斯分布绘制的,具有以下参数:
- 平均值 (
μ
) 为 0。这意味着最可能的噪声值为 0(没有添加噪声),并且噪声值可能小于原始值并更大(这有时称为无偏差值)。 - 缩放参数为
b = CONTRIBUTION_BUDGET
/epsilon
。CONTRIBUTION_BUDGET
是在浏览器中定义的。- 汇总服务器中的
epsilon
是固定的。
下图显示了 μ=0、b = 20 时,拉普拉斯分布的概率密度函数:
随机噪声值,一种噪声分布
假设某个广告技术平台请求获得两个汇总键(key1 和 key2)的摘要报告。
汇总服务按照相同的噪声分布选择两个噪声值 x1 和 x2。x1 会添加到 key1 的摘要值中,x2 会添加到 key2 的摘要值中。
在图中,我们将噪声值表示为相同的噪声值。这只是简化操作;实际上,噪声值会有所不同,因为它们是从分布中随机抽取的。
这表明噪声值都来自同一分布,并且独立于它们所应用到的汇总值。
噪声的其他属性
系统会对每个汇总值应用噪声,包括空值 (0)。
例如,即使给定键的真实摘要值为 0,您也会在摘要报告中看到关于此键的噪声摘要值(很可能)不是 0。
噪声可以是正数,也可以是负数。
例如,如果预噪声购买量为 327,000,噪声可能是 +6,000 或 -6,000(这些是任意示例值)。
评估噪声
计算噪声的标准差
噪声的标准差为:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
示例
当 epsilon = 10 时,噪声的标准差为:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
在衡量结果差异显著时进行评估
由于您了解汇总服务输出的每个值所添加的噪声的标准差,因此您可以确定适当的比较阈值,从而确定观察到的差异是否可能是噪声造成的。
例如,如果为某个值添加的噪声约为 +/- 10(用于调整规模),而两个广告系列之间的价值差值超过 100,则很有可能得出一个结论:每个广告系列之间测得的数值差异并非仅由噪声导致。
互动和分享反馈
您可以参与试用并试用此 API。
- 了解可汇总报告和汇总服务,提出问题并提出反馈。
- 阅读归因报告指南。
- 在 Privacy Sandbox 开发者支持代码库中提问并加入讨论。
后续步骤
- 要了解您可以控制哪些变量来提高信噪比,请参阅使用噪声。
- 查看针对摘要报告设计决策进行的实验,以便规划汇总报告策略。
- 不妨试试噪音实验室。