搭配噪音

瞭解如何處理可匯總報表中的雜訊,並降低影響因素。

事前準備

繼續操作前,請先參閱「瞭解摘要報表中的雜訊」,進一步瞭解雜訊及其影響。

噪音控制選項

雖然您無法直接控制可匯總報表中新增的雜訊,但可以採取一些步驟來盡量減少影響。以下各節將說明這些策略。

向上擴充至貢獻預算

如「瞭解雜訊」一節所述,每個鍵套用至摘要值的雜訊是以 0 至 65,536 分 (0 至 CONTRIBUTION_BUDGET) 計算得出。

雜訊分配功能是以預算為依據。

因此,為了盡可能根據雜訊處理信號,建議您先將每個值放大,再將其設為可匯總值。也就是說,將每個值乘以特定因素 (即縮放比例係數),即可確保曝光不會超出貢獻的預算。

相對噪音 (無論是否放大調整)。

計算縮放比例係數

縮放比例係數代表您要為特定可匯總值調度資源的程度。 這個值應該是貢獻預算除以特定鍵的最高可匯總值。

根據貢獻預算決定調整比例係數。

舉例來說,假設廣告客戶想知道總購物價值,您瞭解,每筆購買交易的預期最高消費金額是 $2,000 美元,但您決定忽略下列幾個異常值:

  • 計算縮放比例係數
    • 如要盡可能提高信號雜訊比,請將這個值調整為 65,536 (貢獻預算)。
    • 因此產生約 65,536 / 2,000 的縮放比例係數約為 32。實際執行時,您可以將此因數四捨五入。
  • 在匯總前先擴充值。每購買 $1 美元,追蹤的指標就會增加 32。舉例來說,如果要購買 $120 美元,請將可匯總值設為 120*32 = 3,840。
  • 匯總後縮減值。收到摘要報表 (其中包含多位使用者加總的購物價值) 後,請使用匯總前使用的縮放比例係數縮減匯總值。在範例中,我們使用 32 預先匯總的縮放比例係數,因此必須將摘要報告中收到的摘要值除以 32。因此,如果摘要報表中特定鍵的摘要購買價值是 76,800,摘要購買價值 (含雜訊) 就是 76,800/32 = $2,400 美元。

拆分預算

如果你有多個評估目標 (例如購買次數和購物價值),建議將預算分配給這些目標。

在這種情況下,不同的可匯總值會有不同的縮放比例係數,具體取決於特定可匯總值的預期最大值。

詳情請參閱瞭解匯總鍵

舉例來說,假設您同時追蹤購買次數和購買價值,並決定平均分配預算。

每個評估類型和每個來源可分配 65,536 / 2 = 32,768。

  • 購買次數:
    • 您只追蹤一次購物,因此指定轉換的最大購買次數為 1 次。
    • 因此,您決定將購買次數的縮放比例係數設為 32,768 / 1 = 32,768。
  • 購物價值:
    • 假設每筆購物的預期最高消費金額是 $2,000 美元,
    • 因此,您決定將購買價值的縮放比例係數設為 32,768 / 2,000 = 16.384 或約 16。

粗略匯總鍵可提升訊號雜訊比

由於粗略的鍵能擷取的轉換事件比精細鍵更多,因此粗略的鍵通常能產生較高的摘要值。

匯總值越高,受到干擾值的影響小於較低的值;相對於這個值,這些值的雜訊可能較低。

相較於使用較精細的鍵收集的值,透過粗略的鍵收集的值可能相對較低。

範例

在所有其他條件都相同的情況下,比起追蹤國家/地區層級追蹤轉換的鍵,可追蹤全球購物價值的鍵 (所有國家/地區的加總值) 能帶來較高的摘要購物價值 (以及更高的摘要轉換次數)。

也就是說,特定國家/地區總購買價值的相對幹擾性會高於所有國家/地區總購買價值的相對雜訊。

同樣地,在所有其他條件維持不變的情況下,鞋子的總購物價值低於所有產品 (包括鞋子) 的總購物價值。

也就是說,鞋子總購買價值的相對幹擾性會高於所有商品總購買價值的相對雜訊。

使用精細或粗略的鍵,影響雜訊。

將摘要值 (匯總) 加總也能夠將雜訊加總

只要加總摘要報表中的摘要值,即可存取較高層級的資料,藉此加總這些摘要值中的雜訊。

匯總鍵與不匯總作業的粗鍵雜訊程度

讓我們來看看兩種不同的做法: - 方法 A:您可以在金鑰中加入地理位置 ID。摘要報表會顯示地理區域 ID 層級的鍵,每個鍵都與特定地理區域 ID 層級的匯總購買價值相關聯。 - 方法 B:不要在鍵中加入地理位置 ID。摘要報表會直接顯示所有地理位置 ID / 位置的購買價值摘要資料。

如何查看國家/地區層級的購物價值: - 使用方法 A 時,您需要加總地理位置 ID 層級的摘要值,因此也會加總這些雜訊。這很可能導致最終的地理區域 ID 層級購買價值中增加雜訊。 - 使用方法 B 時,您可以直接查看摘要報表中顯示的資料。系統只將該資料加入雜訊一次。

因此,採用 A 方法時,特定地理區域 ID 的摘要購買價值可能會較為雜亂。

同樣地,在鍵中加入郵遞區號層級的維度,會比使用含有區域層級維度的粗略鍵產生雜訊更清晰的結果。

將時間較長的時間匯總起來,可提高訊號雜訊比

這意味著,要求摘要報告的頻率較低,這表示每個摘要值可能高於您要求報告的頻率。較長的時間範圍可能會發生的轉換次數。

如前所述,摘要值越高,相對雜訊可能越低。因此,要求摘要報告的頻率較低,導致訊號與雜訊比例較高 (品質較佳)。

要求摘要報告的頻率較低,導致訊號與雜訊比例較高

請參考以下範例說明:

  • 如果您要求取得超過 24 小時的每小時摘要報表,並加總每份每小時報表的摘要值來存取日層級資料,系統會增加 24 次雜訊。
  • 在一份每日摘要報表中,雜訊只會加入一次。

較高 Epsilon,雜訊較少

Epsilon 值越高,雜訊越低,隱私保護服務就越低。

利用篩選和簡化功能

如要分配不同鍵的預算,關鍵在於瞭解特定事件的發生次數。舉例來說,對於每次點擊,廣告客戶可能只關心一次購買,但可能對最多 3 次「產品網頁瀏覽」感興趣轉換。為配合這些使用情境,建議您也使用下列 API 功能來控制要產生的報表數量,以及要計算哪些轉換:

嘗試 Epsilon

廣告技術可以將 Epsilon 設為大於 0 且小於 64 的值。這個範圍允許彈性測試。較低的 Epsilon 值可提供更完善的隱私保護。建議一開始先使用 epsilon=10。

實驗建議

建議您採取下列做法: - 開頭為 epsilon = 10。 - 在這種情況下,如有明顯的公用程式問題,請以漸進方式增加 Epsilon。 - 與我們分享您對資料可用性方面的特定轉折點意見。

交流及分享意見回饋

您可以參與這個 API 並進行實驗

後續步驟