ノイズの取り扱い

集計可能レポートでノイズを考慮し、ノイズの影響を軽減する方法を解説します。

始める前に

先に進む前に、ノイズの概要と影響について詳しくは、サマリー レポートのノイズについてをご覧ください。

ノイズ コントロール

集計可能レポートに追加されるノイズを直接管理することはできませんが、その影響を最小限に抑える方法がいくつかあります。以降のセクションでは、これらの戦略について説明します。

資金提供の予算を増やす

「ノイズについて」で説明したように、各キーのサマリー値に適用されるノイズは、0 ~ 65,536 のスケール(0 ~CONTRIBUTION_BUDGET)に基づきます。

ノイズ分布は予算に基づきます。

このため、ノイズに対するシグナルを最大化するには、各値を集計可能な値に設定する前にスケールアップする必要があります。つまり、各値に特定の係数(スケーリング ファクタ)を乗算し、予算内に収まるようにする必要があります。

スケーリングありとスケーリングなしの相対ノイズ。

スケーリング ファクタの計算

スケーリング ファクタは、特定の集計可能値をどの程度スケーリングするかを表します。値は、資金提供の予算を特定のキーの集計可能な最大値で割った数値になります。

資金提供バジェットに基づいてスケーリング ファクタを決定する。

たとえば、広告主が合計購入額を知りたいとします。1 回の購入で予想される最大購入額は 2,000 ドルであることがわかっていますが、次のような外れ値を無視することに決めました。

  • スケーリング ファクタを計算する:
    • 信号対雑音比を最大化するには、この値を 65,536(寄付予算)にスケーリングする必要があります。
    • これにより、スケーリング ファクタは約 32x の 65,536 / 2,000 となります。実際には、この係数は切り上げたり切り上げたりできます。
  • 集計前に値をスケールアップする。購入 1 ドルごとに、トラッキング対象指標を 32 ずつ増分します。たとえば、$120 の購入の場合、集計可能値は 120 × 32 = 3,840 に設定します。
  • 集計後に値をスケールダウンする。複数のユーザーの購入額が合計された概要レポートを受け取ったら、集計前に使用したスケーリング ファクタで概要値をスケールダウンします。この例では、事前集計のスケーリング ファクタ 32 を使用しているため、サマリー レポートで受け取ったサマリー値を 32 で除算する必要があります。したがって、サマリー レポートの特定のキーのサマリー購入額が 76,800 の場合、サマリー購入額(ノイズあり)は 76,800 ÷ 32 = $2,400 となります。

予算を分割する

購入回数と購入額など、測定目標が複数ある場合は、これらの目標に予算を分割することをおすすめします。

この場合、スケーリング ファクタは、特定の集計可能値の予想される最大値に応じて、集計可能な値ごとに異なります。

詳しくは、集計キーについてをご覧ください。

たとえば、購入回数と購入額の両方をトラッキングしていて、予算を均等に配分するとします。

測定タイプとソースごとに 65,536 ÷ 2 = 32,768 を割り当てることができます。

  • 購入回数:
    • トラッキングしている購入が 1 件のみであるため、1 回のコンバージョンあたりの購入回数の上限は 1 回となります。
    • したがって、購入回数のスケーリング ファクタを 32,768 ÷ 1 = 32,768 に設定します。
  • 購入額:
    • 1 回の購入で見込まれる最大購入額が 2,000 ドルであるとします。
    • したがって、購入額のスケーリング ファクタを 32,768 ÷ 2,000 = 16.384(約 16)に設定します。

粗い集約キーにより信号対雑音比が向上

大まかなキーは詳細なキーよりも多くのコンバージョン イベントを検出するため、一般的に、概要の値は高くなります。

サマリー値が高いほど、ノイズの影響が小さくなります。これらの値のノイズは、この値よりも低くなる可能性があります。

きめが粗いキーで収集された値は、細かいキーで収集される値よりもノイズが比較的少なくなる可能性があります。

他の条件がすべて同じであれば、世界全体で購入額をトラッキングするキー(すべての国で合計)は、国レベルでコンバージョンをトラッキングするキーよりも、合計購入額(および合計コンバージョン数)が多くなります。

そのため、特定の国の合計購入額の相対ノイズは、すべての国の合計購入額の相対ノイズよりも高くなります。

同様に、他のすべての条件が同じである場合、靴の合計購入額は、すべてのアイテム(靴を含む)の合計購入額よりも低くなります。

そのため、靴の合計購入額に対する相対的ノイズは、全商品アイテムの合計購入額に対する相対的ノイズよりも高くなります。

きめ細かなキーと大まかなキーによるノイズの影響。

サマリー値(ロールアップ)を合計すると、そのノイズも合計される

サマリー レポートのサマリー値を合計して上位レベルのデータにアクセスすることで、サマリー値のノイズも合計します。

ロールアップを使用したきめ細かなキーとロールアップなしの大まかなキーによるノイズの度合い

2 種類の方法を見てみましょう。 - 方法 A: キーに地域 ID を含めます。概要レポートには地域 ID レベルのキーが表示され、各キーは特定の地域 ID レベルで概要購入額に関連付けられます。- アプローチ B: キーに地域 ID を含めない。概要レポートには、すべての地域 ID / 地域について、購入概要額が直接表示されます。

国レベルの購入額にアクセスする手順は次のとおりです。 - アプローチ A では、地域 ID レベルのサマリー値を合計するため、そのノイズも合計します。これにより、地域 ID 単位の最終的な購入額にノイズが加わる可能性があります。 - アプローチ B では、サマリー レポートで公開されているデータを直接確認します。そのデータにノイズが追加されたのは 1 回だけです。

そのため、ある地域 ID のサマリー購入額は、アプローチ A の方がノイズが多くなる可能性が高くなります。

同様に、キーに郵便番号レベルのディメンションを含めると、地域レベルのディメンションで大まかなキーを使用する場合よりも、ノイズの多い結果になる可能性があります。

長期間にわたって集計すると、信号対雑音比が高くなる

概要レポートをリクエストする頻度が低くなると、各サマリー値は、レポートを頻繁にリクエストした場合よりも高くなる可能性があり、より長い期間でより多くのコンバージョンが発生する可能性が高くなります。

前述のように、サマリー値が高いほど、相対ノイズは低くなる可能性が高くなります。したがって、サマリー レポートをリクエストする頻度が低いほど、より高い(良好な)信号雑音比が得られます。

サマリー レポートをリクエストする頻度が低いと、信号対雑音比が高くなる

次に例を示します。

  • 24 時間を超える時間別サマリー レポートをリクエストし、各時間別レポートの概要値を合計して日単位のデータにアクセスする場合、ノイズは 24 回追加されます。
  • 1 つの日次概要レポートでは、ノイズは 1 回だけ追加されます。

イプシロンが高く、ノイズを低減

イプシロン値が高いほど、ノイズは少なく、プライバシー保護は低くなります。

フィルタリングと重複除去の活用

異なるキー間で予算を割り当てる際に重要なのは、特定のイベントが発生する回数を把握することです。たとえば、広告主はクリックごとに 1 件の購入のみを重視し、「商品ページの閲覧」コンバージョンを最大 3 件獲得したいとします。このようなユースケースをサポートするには、生成されるレポートの数とカウントするコンバージョンを制御できる次の API 機能を活用することをおすすめします。

イプシロンの実験

広告テクノロジーでは、イプシロンに 0 より大きく 64 以下の値を設定できます。この範囲により、柔軟なテストが可能になります。イプシロンの値が小さいほど、プライバシー保護が強化されます。イプシロン=10 から始めることをおすすめします。

テストすべき最適化案

次の方法をおすすめします。 - イプシロン = 10 から始めます。 - ユーティリティに関する顕著な問題が生じた場合は、イプシロンを段階的に増やしてください。 - データのユーザビリティに関して見つけた特定の転換点について、フィードバックをお寄せください。

フィードバックを共有

この API に参加して試すことができます。

次のステップ