处理噪声

了解如何在可汇总报告中使用噪声,并考虑这些噪声并降低其影响。

准备工作

在继续操作之前,如需深入了解噪声是什么及其影响,请参阅了解摘要报告中的噪声

你可以控制噪声

虽然您无法直接控制添加到可汇总报告中的噪声,但您可以采取一些措施来最大限度地减少这类影响。以下部分介绍了这些策略。

扩展至贡献预算

如“了解噪声”中所述,应用于每个键的摘要值的噪声基于 0-65,536 量表 (0-CONTRIBUTION_BUDGET)。

噪声分布根据预算计算得出。

因此,为了最大程度地提高相对于噪声的信号数量,您应该先纵向扩容每个值,然后再将其设置为可汇总的值,也就是说,将每个值乘以特定系数(缩放系数),同时确保该值不超出贡献预算。

使用和未缩放的相对噪声。

计算缩放比例

缩放比例表示您要缩放给定的可汇总值的幅度。其值应为贡献预算除以特定键的最大可汇总值。

根据贡献预算确定调整系数。

例如,假设广告客户希望了解总购买价值。您知道单笔购买交易的预计最高交易金额为 2,000 美元,但忽略的一些值除外:

  • 计算缩放比例
    • 为了最大限度地提高信噪比,您需要将此值调整为 65,536(贡献预算)。
    • 这样一来,缩放比例为 65,536 / 2,000,缩放比例约为 32x。在实践中,您可以将此因数向上或向下舍入。
  • 在聚合之前对值进行纵向扩容。每完成 $1 的购买交易,将跟踪的指标增加 32。例如,对于金额为 $120 的购买交易,请将可汇总值设置为 120*32 = 3,840。
  • 在聚合后缩减值。收到包含多名用户总购买价值的摘要报告后,请使用您在汇总前使用的调整系数来缩减摘要值。在我们的示例中,我们在预汇总时使用了缩放系数 32,因此需要将摘要报告中收到的汇总值除以 32。因此,如果摘要报告中某个键的购买摘要价值为 76,800,则摘要购买价值(有噪声)为 76,800/32 = $2,400。

分配预算

如果您有多个衡量目标(例如“购买次数”和“购买价值”),则可能需要在这些目标之间分配预算。

在这种情况下,缩放比例因可汇总值而异,具体取决于给定可汇总值的预期最大值。

如需了解详情,请参阅了解汇总键

例如,假设您在跟踪购买次数和购买价值,并且决定平均分配预算。

65,536 / 2 = 32,768 可按衡量类型和来源分配。

  • 购买交易数量:
    • 您只跟踪一次购买,因此指定转化的购买次数上限为 1 次。
    • 因此,您决定将购买次数的调整系数设置为 32,768 / 1 = 32,768。
  • 购买价值:
    • 假设单笔购买交易预计的最高购买金额为 2,000 美元。
    • 因此,您决定将购买价值的调整系数设置为 32,768 / 2,000 = 16.384 或约 16。

使用粗略的汇总键可以提高信噪比

由于粗略键可以捕获比精细键更多的转化事件,因此粗略键通常会带来较高的摘要值。

摘要值越高,噪声影响越小;与此值相比,噪声影响较小;相对于此值,这些值的噪声可能会较低。

与使用更细粒度的键收集的值相比,使用粗略键收集的值可能相对较少噪声。

示例

在所有其他条件保持不变的情况下,与在国家/地区级别跟踪转化的键相比,跟踪全球购买价值的键(在所有国家/地区的总和)与汇总购买价值更高(以及汇总转化计数更多)。

因此,在特定国家/地区,总购买价值的相对噪声将高于所有国家/地区对总购买价值的相对噪声。

同样,在所有其他保持相等的条件下,鞋子的总购买价值低于所有商品(包括鞋子)的总购买价值。

因此,鞋类总购买价值的相对噪声数将高于所有商品总购买价值的相对噪声。

使用精细键与粗键键对噪声的影响。

对汇总值进行求和(汇总)也会将其噪声值求和

通过对摘要报告中的汇总值进行汇总,以访问更高级的数据,您也可以对这些汇总值中的噪声进行求和。

使用汇总键的精细键与不使用汇总键的粗略键的噪声程度

我们来看两种不同的方法: - 方法 A:在键中添加地理位置 ID。摘要报告会显示地理位置 ID 级键,每个键都与特定地理位置 ID 级的购买摘要值相关联。 - 方法 B:不在键中包含地理位置 ID。摘要报表会直接显示所有地理位置 ID / 地理位置的摘要购买价值。

若要获取国家/地区一级的购买价值,请执行以下操作: - 采用方法 A 时,您需要对地理位置 ID 一级的摘要值求和,从而对噪声进行求和。这可能会导致在地理位置 ID 级最终购买值的基础上增加更多噪声。 - 使用方法 B 时,您可以直接查看摘要报告中呈现的数据。该数据仅添加了一次噪声。

因此,使用方法 A 时,给定地理位置 ID 的购买摘要值可能更具噪声。

同样,与使用区域级别维度较为粗略的键相比,在键中添加邮政编码级别的维度可能会导致结果中包含更多噪声。

通过在较长的时间段内进行汇总,可提高信噪比

如果您请求获取摘要报告的频率较低,则意味着每个摘要值可能会高于您更频繁地请求生成的报告的值;因此,在较长的时间范围内可能会发生更多转化。

如前所述,汇总值越高,相对噪声可能就越低。因此,减少请求摘要报告的频率,可以提高(更好的)信噪比。

降低请求摘要报告的频率,会导致更高的信噪比

下面举例说明:

  • 如果您请求 24 小时内的每小时摘要报告,然后对各个每小时报告中的摘要值求和以访问天级数据,则系统会添加 24 次噪声。
  • 在一份每日摘要报告中,仅添加了一次噪声。

epsilon 较高,噪声较低

epsilon 值越高,噪声越低,隐私保护就越低。

利用过滤和重复信息删除功能

在不同键之间分配预算的一个重要环节是了解指定事件可以发生多少次。例如,某个广告客户可能只关心每次点击带来的一次购买,但可能对最多 3 次“产品网页浏览”转化感兴趣。为了支持这些用例,您可能还希望利用以下 API 功能来控制生成的报表数量和要统计的转化:

使用 epsilon 进行实验

广告技术平台可以将 epsilon 设置为大于 0 且小于或等于 64 的值。此范围可灵活进行测试。epsilon 值越小,隐私保护就越好。我们建议您从 epsilon=10 开始。

实验建议

我们建议的做法: - 以 epsilon = 10 开头。 - 如果这会导致明显的效用问题,请逐渐增加 epsilon。 - 请就您在数据易用性方面可能会遇到的具体拐点提供反馈。

互动和分享反馈

您可以参与试用并试用此 API

后续步骤