了解如何在可汇总报告中使用、考虑和降低噪声的影响。
准备工作
在继续操作之前,如需深入了解什么是干扰数据及其影响,请参阅了解摘要报告中的噪声。
噪声控制
虽然您无法直接控制添加到可汇总报告中的噪声,但您可以采取一些措施来尽可能减少影响。以下部分介绍了这些策略。
扩容至捐赠预算
如“了解噪声”中所述,应用于每个键汇总值的噪声基于 0-65,536 刻度 (0-CONTRIBUTION_BUDGET
)。
因此,为了尽可能提高相对于噪声的信号,您应该先放大每个值,然后再将其设为可汇总的值,也就是说,将每个值乘以某个特定系数(即缩放比例),同时确保该值不超出贡献预算。
计算缩放比例
缩放比例表示您要对给定的可汇总值进行缩放的程度。 其值应为贡献预算除以特定键的最大可汇总值所得的值。
例如,我们假设广告客户希望了解总购买价值。您知道,除了您决定忽略的一些异常值之外,单笔购买交易的最高预期购买价值为 2,000 美元:
- 计算缩放比例:
<ph type="x-smartling-placeholder">
- </ph>
- 为了最大限度地提高信噪比,您需要将此值扩展到 65,536(贡献预算)。
- 这会得出 65,536 / 2,000,约为 32x 的缩放比例。实际上,您可以将该系数向上或向下舍入。
- 在汇总前扩展值。每消费 $1,将跟踪的指标增加 32。例如,对于金额为 $120 的购买交易,请将可汇总值设置为 120*32 = 3,840。
- 在汇总后缩小值。收到摘要报告(其中包含多位用户的总购买价值)后,请使用您在汇总之前使用的缩放比例缩小汇总价值。在我们的示例中,我们使用了 32 预汇总的缩放比例,因此我们需要将摘要报告中收到的汇总值除以 32。因此,如果摘要报告中给定键的摘要购买价值为 76,800,则购买摘要价值(含噪声)为 76,800/32 = $2,400。
拆分预算
如果您有多个衡量目标(例如购买次数和购买价值),不妨为这些目标分配预算。
在这种情况下,对于不同的可汇总值,缩放比例会有所不同,具体取决于给定可汇总值的预期最大值。
如需了解详情,请参阅了解汇总键。
例如,假设您在跟踪购买次数和购买价值,并且您决定平均分配预算。
65,536 / 2 = 32,768 可按衡量类型和来源分配。
- 购买次数:
<ph type="x-smartling-placeholder">
- </ph>
- 您只跟踪一次购买,因此一次转化的购买数量上限为 1。
- 因此,您决定将购买次数的调整系数设置为 32,768 / 1 = 32,768。
- 购买价值:
<ph type="x-smartling-placeholder">
- </ph>
- 假设单笔购买交易的最高预期购买金额为 2,000 美元。
- 因此,您决定将购买价值的调整系数设置为 32,768 / 2,000 = 16.384 或约 16。
使用粗略汇总键可提高信噪比
由于使用粗略键可捕获比细化键更多的转化事件,因此粗略键通常会生成较高的摘要值。
摘要值越高,受到噪声的影响越小;摘要值越高,受噪声的影响就越小;相对于此值而言,这些值上的噪声可能更低。
与使用更粗略键收集的值相比,使用更粗略键收集的值可能相对少一些噪声。
示例
在所有其他条件相同的情况下,与在国家/地区一级跟踪转化的键相比,用于跟踪全球购买价值的键(所有国家/地区汇总)将产生更高的摘要购买价值(和更高的摘要转化次数)。
因此,在特定国家/地区,总购买价值的相对噪声将高于所有国家/地区的总购买价值的相对噪声。
同样,在其他条件相同的情况下,鞋子的总购买价值要低于所有商品(包括鞋子)的总购买价值。
因此,鞋子总购买价值的相对噪声将高于对所有商品的总购买价值的相对噪声。
对汇总值(总览)进行求和的同时,也会对它们的噪声数据进行求和
通过对摘要报告中的摘要值进行求和来访问更高级的数据,还可以对这些摘要值中的噪声进行求和。
我们来看看两种不同的方法: - 方法 A:在键中添加地理位置 ID。摘要报告会显示地理位置 ID 级键,每个键都与特定地理位置 ID 级的摘要购买价值相关联。 - 方法 B:不在键中添加地理位置 ID。摘要报表直接显示所有地理位置 ID / 地理位置的摘要购买价值。
如需查看国家/地区级别的购买价值,请按以下步骤操作: - 使用方法 A 时,您要对地理位置 ID 级别的摘要值求和,从而对它们的噪声值求和。这可能会导致地理位置 ID 级的最终购买价值增加更多噪声。 - 采用方法 B 时,您可以直接查看摘要报告中显示的数据。系统只会向这些数据添加一次噪声。
因此,使用方法 A 时,给定地理位置 ID 的摘要购买价值可能会更嘈杂。
同样,与将粗略的键和区域级维度搭配使用,在键中添加邮政编码级维度可能会导致结果更多嘈杂。
在较长的时间段内进行聚合会增加信噪比
降低请求摘要报告的频率意味着,与更频繁地请求报告相比,每个摘要值可能会更高;在较长的时间范围内可能会发生更多转化。
如前所述,摘要值越高,相对噪声可能就越低。因此,降低请求摘要报告的频率会导致信噪比更高(更好)。
下面举例说明:
- 如果您请求 24 小时内的每小时摘要报告,然后对每份每小时报告中的摘要值求和以访问日级数据,则系统会添加 24 次噪声。
- 在一份每日摘要报告中,噪声只会添加一次。
Epsilon 较高,噪声较低
Epsilon 值越高,噪声越低,隐私保护力度越低。
利用过滤和去重功能
在不同键之间分配预算的一个重要环节是了解指定事件可以发生的次数。例如,广告客户可能对每次点击只关心一次购买,但可能对最多 3 次“产品页面浏览”感兴趣转化次数。为了支持这些用例,您还可以利用以下 API 功能来控制生成的报告数量和统计的转化:
- 过滤。详细了解过滤功能。
- 去重。详细了解重复信息删除。
使用 Epsilon 值进行实验
广告技术平台可以将 epsilon 设置为大于 0 且不超过 64 的值。此范围可让您灵活地进行测试。Epsilon 值越小,隐私保护效果就越好。我们建议从 epsilon=10 开始。
实验建议
我们建议您采取以下措施: - 以 Epsilon 值开始 = 10。 - 如果这会导致明显的效用问题,则逐渐增加 Epsilon 值。 - 针对您在数据易用性方面可能发现的具体拐点,分享您的反馈。
互动和分享反馈
您可以参与试用并试用此 API。
- 了解可汇总报告和汇总服务,提出问题并提出反馈。
- 阅读归因报告指南。
- 在 Privacy Sandbox 开发者支持代码库中提问并加入讨论。
后续步骤
- 要详细了解影响报告的因素(如广告系列变量、批处理频率和维度粒度),请参阅针对摘要报告设计决策进行实验。
- 不妨试试 Noise 实验室。