搭配噪音

瞭解如何使用及考量可匯總報表中的雜訊,並降低雜訊造成的影響。

事前準備

請先參閱「瞭解摘要報表中的雜訊」一文,深入瞭解雜訊和影響,再繼續操作。

雜訊控制選項

雖然您無法直接控制新增至可匯總報表的雜訊,但可以採取步驟將影響降到最低。以下各節將說明這些策略。

向上擴充以發放貢獻預算

如「瞭解雜訊」一文所述,套用至每個鍵的摘要值雜訊,是根據 0 至 65,536 的尺度 (0 至 CONTRIBUTION_BUDGET) 而定。

雜訊分配取決於預算。

因此,為了盡可能提高信號相對於雜訊的成效,您必須先擴充每個值,再設為可匯總值,也就是將每個值乘以特定係數 (也就是按比例調整因素),同時確保出價維持在貢獻預算範圍內。

是否有縮放且未經縮放的相對雜訊。

計算縮放比例係數

縮放比例係數代表您想針對特定可匯總值調度資源的程度。 其值是將貢獻預算除以某個鍵的可匯總值上限。

根據捐款預算決定縮放比例係數。

舉例來說,假設廣告客戶想知道總購物價值。您知道任何單筆交易的最高購物價值最高為 $2,000 美元,但您決定忽略的幾項離群值則不在此限:

  • 計算縮放比例係數
    • 如要盡可能提高信號雜訊比率,您必須將這個值調整為 65,536 (貢獻預算)。
    • 這會得出 65,536 / 2,000 的縮放比例係數約為 32x。實際上,您可以將此係數上下四捨五入。
  • 在匯總前擴充值。針對每消費 $1 美元,將追蹤的指標遞增 32。舉例來說,如果交易金額為 $120 美元,請將可匯總值設為「120*32 = 3,840」。
  • 在匯總後縮減值。收到摘要報表,內含多位使用者的購物價值總和後,請使用匯總前使用的比例係數縮小摘要值。在這個範例中,我們已使用 32 預先匯總的縮放比例係數,因此需要將摘要報表中收到的摘要值除以 32。因此,如果摘要報表中指定鍵的購買價值摘要為 76,800,則總購買價值 (包含雜訊) 為 76,800/32 = $2,400。

分配預算

設定評估目標 (例如購買次數和購物價值) 時,建議將預算分配給這些目標。

在這種情況下,不同的可匯總值會採用不同的縮放比例係數,取決於特定可匯總值的預期最大值。

詳情請參閱瞭解匯總鍵

舉例來說,假設你同時追蹤購買次數和購物價值,且你決定平均分配預算。

65,536 / 2 = 32,768 個可以按評估類型和每個來源分配。

  • 購買次數:
    • 您只追蹤一次購買,因此一筆轉換最多只能追蹤 1 次。
    • 因此,您決定將購買次數的縮放比例係數設為 32,768 / 1 = 32,768。
  • 購物價值:
    • 假設每筆購物交易的最高預期購物價值是 $2,000 美元,
    • 因此,您決定將購物價值的縮放比例係數設為 32,768 / 2,000 = 16.384 或大約 16。

更粗的匯總鍵可改善信號雜訊比

粗略的鍵可吸引的轉換事件比精細的鍵多,因此較不精確的鍵通常能帶來較高的摘要值。

較高的摘要值受到雜訊低於較低值的影響,因此這些值的雜訊可能會比這個值低。

使用較粗的鍵收集的值,可能比使用更精細的鍵收集的值少得多。

範例

在所有其他條件相同的情況下,與在一個國家/地區追蹤轉換的鍵相較,可追蹤全球購物價值的鍵 (在所有國家/地區的總和) 能產生更高的總價值 (摘要轉換次數也更高)。

因此,特定國家/地區的總購物價值相對雜訊,會高於所有國家/地區總購物價值的相對雜訊。

同樣地,在所有其他條件相同的情況下,鞋子的總購物價值會低於所有商品 (包括鞋子) 的總購物價值。

因此,鞋子總購物價值的相對雜訊,高於所有商品總購物價值的相對雜訊。

使用精細與粗略的鍵,帶來雜訊影響。

加總摘要值 (匯總資料) 時也會納入雜訊

將摘要報表中的摘要值加總後,即可存取更高階的資料,同時就能加總這些摘要值中的雜訊。

使用匯總資料和概略鍵時,雜訊強度 (不含匯總資料)

讓我們看看兩種不同的做法: - 方法 A:在金鑰中加入地理位置 ID。摘要報表會顯示地理區域 ID 層級的鍵,每個鍵與特定地理區域 ID 層級的購買摘要值相關聯。- 方法 B:請勿在鍵中加入地理區域 ID,摘要報表會直接顯示所有地理區域 ID / 地點的購買摘要值,

如何查看國家/地區層級的購物價值: - 使用方法 A 時,您會加總地理區域 ID 層級的摘要值,因此也會計入雜訊量。因此,最終地理區域 ID 層級購物價值可能會加入更多雜訊。 - 方法 B 可讓您直接查看摘要報表中顯示的資料。系統只為該資料加入一次雜訊。

因此,對方法 A 來說,特定地理區域 ID 的購物價值摘要可能會比較雜訊。

同樣地,在鍵中加入郵遞區號層級維度,可能會比使用含區域維度的粗略鍵,產生更加雜訊的結果。

匯總較長的時間範圍會提高信號雜訊比

要求摘要報表較少,意味著每個摘要值可能會高於您要求報告的頻率,轉換發生在更長的時間範圍內可能會更多。

如前文所述,摘要值越高,相對雜訊就越低。因此,要求摘要報表減少的頻率較低,能提高雜訊比例 (更佳)。

索取摘要報表的頻率減少,會導致信號的雜訊比率較高

請參考以下範例的說明:

  • 如果您申請的每小時摘要報告為 24 小時以上,並將每個每小時報表中的摘要值加總以存取日層級資料,則雜訊會加 24 次。
  • 在單一每日摘要報告中,雜訊只會加入一次。

矽膠,噪音較低

Epsilon 的值越高,雜訊越低,隱私保護服務的價值也越低。

運用篩選和簡化功能

在不同鍵之間分配預算的一大重點,在於瞭解特定事件可能發生的次數。舉例來說,廣告客戶可能只重視每次點擊的一次購買,但可能會感興趣的最多 3 次「產品網頁瀏覽」轉換。為支援這些用途,您也可以利用下列 API 功能,控制要產生的報表數量及計算轉換次數:

Epsilon 的實驗

廣告技術可以將 Epsilon 設為大於 0 且最多 (包含 64) 的值。這個範圍可彈性測試。Epsilon 的值越低,就越能保障隱私。建議你從 epsilon=10 開始。

實驗建議

建議您採取下列做法: - 以 epsilon = 10 開始。 - 如果造成重大公用事業問題,請逐步提升 epsilon。 - 請針對資料可用性的具體轉折點提供意見。

交流及分享意見回饋

您可以參與這個 API 並進行實驗

後續步驟