噪音實驗室

關於這份文件

閱讀這份文件,即表示您將:

  • 在產生摘要報表前,請先瞭解要建立哪些策略。
  • 我們推出了 Noise Lab,這項工具可協助你掌握各種雜訊參數的效果,並快速探索及評估各種雜訊管理策略。
,瞭解如何調查及移除這項存取權。
Noise Lab 的螢幕截圖
Noise Lab

提供意見

本文件摘要列出與摘要報表的幾項原則 雜訊管理的方法有很多種,但可能並未反映 此處。歡迎您提出建議、新增內容和問題!

  • 如要向大眾提供有關噪音管理策略的意見,請點按以下按鈕: API (Epsilon) 的公用程式或隱私權,並分享您在 以 Noise Lab 模擬結果: 對這個問題發表留言
  • 如要對 Noise Lab 提供公開意見 (如提問、回報錯誤、 要求新功能): 在這裡建立新問題
  • 如何針對 API 的另一方面提供公開意見回饋: 在這裡建立新問題

事前準備

  1. 如需相關簡介,請參閱「歸因報表:摘要報表」和「歸因報表完整系統總覽」一文。
  2. 如要充分運用本指南,請掃描「瞭解雜訊」和「瞭解匯總鍵」這兩篇文章。

設計決策

核心設計原則

第三方 Cookie 和摘要報表的運作方式存在基本差異。其中一個主要差異是 noise 已加進摘要報表。另一種方式則是安排報表的傳送方式。

存取信號雜訊較高的摘要報表評估資料 比率、需求端平台 (DSP) 和廣告評估服務供應商 與廣告客戶合作,制定噪音管理策略。為了製定這些策略,需求端平台和評估服務供應商必須制定設計決策。這些決策圍繞一個重要概念:

雖然分佈狀況的雜訊值是完全依據,但僅取決於兩個參數⏤epsilon 和貢獻預算⏤ 輸出測量資料的訊號及雜訊比

雖然我們預期反覆式流程才能做出最明智的決策,但對於這些決策的不同之處, 導入設定會有些許不同,因此您必須在撰寫每個程式碼疊代 (以及放送廣告前) 之前做出這些決定。

決策:維度精細程度

在 Noise Lab 中試用

  1. 前往進階模式。
  2. 在參數側邊面板中,找出轉換資料。
  3. 觀察預設參數。預設值為每天 TOTAL 可歸因的轉換次數為 1,000。這個平均值大約是每秒 40 個 如果您使用預設設定 (預設維度、預設數量 每個維度可能出現的不同值,也就是主要策略 A)。請留意 在輸入的平均每日可歸因轉換次數中,這個值為 40 每個值區
  4. 按一下 [模擬],使用預設參數執行模擬。
  5. 在「參數」側邊面板中找出「維度」。重新命名 將「Geography」為「City」,並將可能不同值的數量變更為 50。
  6. 觀察這項變更對於平均每日可歸因轉換的影響 每個值區的數量它現在變得更低了。這是因為如果流量 這個維度中可能值的數量,但不會變更 在其他情況下,可以在不變更的情況下增加值區總數 每個值區中的轉換事件數量
  7. 按一下「模擬」。
  8. 觀察結果模擬的雜訊比例:雜訊比是 比前一次模擬得高

根據核心設計原則,較小的匯總值 雜訊大於大型摘要值因此,您的設定選項 會影響各值區中最終的歸因轉換事件數量 (否則 稱為匯總鍵),該數量會影響 最終輸出結果摘要報表。

一項會影響已歸因轉換事件的數量的設計決策 維度精細程度請參考以下範例 及其維度

  • 方法 1:單一維度結構較粗的:國家/地區 x 廣告活動 (或大型廣告活動) 匯總值區) x 產品類型 (在 10 個可能的產品類型中)
  • 方法 2:採用精細維度的單一主要結構:城市 x 廣告素材 ID x 產品 (共 100 項產品)

「城市」是比「國家/地區」更精細的維度。廣告素材 ID 較為精細 (大於「廣告活動」);和「產品」比「產品類型」更精細。因此 方法 2 在每個區間 (= 鍵) 的摘要報表輸出,而非方法 1。由於雜訊 輸出結果與值區中的事件數量、評估資料無關 採用方法 2 會比較繁雜摘要針對每個廣告客戶嘗試各種 為了確保金鑰的實用性 結果。

決策:主要結構

在 Noise Lab 中試用

在簡易模式中,系統會使用預設鍵結構。進階課程 可以測試不同的主要結構部分維度範例 已包含;也可以修改這些項目

  1. 前往進階模式。
  2. 在「參數」側邊面板中找出「主要策略」。觀察 工具中的預設策略 (名為 A) 使用精細的 包含所有維度的結構:地理位置 x 廣告活動 ID x 產品 類別
  3. 按一下「模擬」。
  4. 觀察結果模擬的雜訊比例。
  5. 將主要策略變更為 B。畫面上會顯示其他控制選項 您能設定金鑰結構
  6. 設定金鑰結構,例如:如下所示:
    1. 金鑰結構數量:2
    2. 金鑰結構 1 = 地理位置 x 產品類別。
    3. 金鑰結構 2 = 廣告活動 ID x 產品類別。
  7. 按一下「模擬」。
  8. 您會發現,現在每個評估目標類型都會有兩份摘要報表 (針對購買次數,兩個,兩組代表購買價值), 有兩個不同的金鑰結構觀察牠們的噪音比例。
  9. 您也可以使用自己的自訂維度嘗試此做法。方法很簡單,只要 第二種是 [維度]建議移除範例 然後在「新增/移除/重設」選項中自行建立 按鈕。

會影響歸因轉換次數的另一項設計決策 單一值區中的事件 主要結構 由您決定請參考以下匯總鍵範例:

  • 一個包含所有維度的鍵結構;命名為「重要策略 A」
  • 兩個主要結構,每個主要結構都有維度子集:我們稱之為 重點策略 B:
圖:

策略 A 較為簡單,但您可能需要匯總 (加總) 包含摘要報表的雜訊摘要值,才能查看特定洞察資料。將這些值加總,也能達到雜訊的總和。 使用策略 B 時,摘要值會顯示在摘要中 報表可能已提供您所需的資訊。也就是策略 B 相比之下,策略 A 的信號雜訊比可能會更好。不過, 策略 A 可能可以接受雜訊,因此您還是可以決定 策略 A,簡單易懂。 進一步瞭解這兩種策略的詳細範例

管理金鑰是相當複雜的主題。有多種具體技巧 我想提高訊號雜訊比。請參閱「進階金鑰」一節 管理

決策:批次處理頻率

在 Noise Lab 中試用

  1. 前往簡易模式 (或進階模式),兩種模式皆可 以批次方式執行頻率)
  2. 在參數側邊面板中,找出你的匯總策略 >批次處理頻率。這是指批次處理頻率 透過匯總服務處理的可匯總報表 單一工作。
  3. 觀察預設批次處理頻率:預設為每日批次作業 頻率為模擬頻率
  4. 按一下「模擬」。
  5. 觀察結果模擬的雜訊比例。
  6. 將批次處理頻率變更為每週。
  7. 觀察結果模擬的雜訊比例:雜訊比是 比先前的模擬結果低 (優於之前的模擬結果)。

會影響歸因轉換次數的另一項設計決策 是您決定使用的批次頻率。 批次處理頻率是指系統處理可匯總報表的頻率。

如果定期執行更頻繁的匯總報表 (例如每小時), 內含的轉換事件少於一份報表,但頻率較低 匯總排程 (例如每週)。因此,每小時報表會包含更多雜訊。`` 內含的轉換事件少於一份報表,但頻率較低 匯總排程 (例如每週)。因此,每小時報表 的信號雜訊比低於每週報表,其他條件都相同。嘗試各種頻率的報表需求條件,並評估每種頻率的信號雜訊比。

詳情請參閱: 批次處理 以及匯總較長時間範圍的資料

決策:影響可歸因轉換的廣告活動變數

在 Noise Lab 中試用

雖然這可能難以預測,而且 除了季節性影響之外,建議您 可歸因於 10: 10、100、 1,000 或 10,000。

  1. 前往進階模式。
  2. 在參數側邊面板中,找出轉換資料。
  3. 觀察預設參數。預設值為每天 TOTAL 可歸因的轉換次數為 1,000。這個平均值大約是每秒 40 個 如果您使用預設設定 (預設維度、預設數量 每個維度可能出現的不同值,也就是主要策略 A)。請留意 在輸入的平均每日可歸因轉換次數中,這個值為 40 每個值區
  4. 按一下 [模擬],使用預設參數執行模擬。
  5. 觀察結果模擬的雜訊比例。
  6. 現在,請將 TOTAL 每日可歸因轉換次數設為 100。 請留意,這樣會降低每日平均歸因價值 每個值區的轉換次數。
  7. 按一下「模擬」。
  8. 您會發現雜訊比現在更高,這是因為 每個值區的轉換量較少,系統會套用更多雜訊來維持 隱私權。

其中一個重要區別就是 這個值與可能歸因轉換的總次數。 後者最終會影響摘要報表中的雜訊。歸因 「轉換次數」是廣告活動中可能促成的轉換總數 例如廣告預算和廣告指定目標等變數。舉例來說,假設您希望使用者 $1,000 萬美元廣告活動帶來的歸因轉換次數升幅 (相較於 $1 萬美元的廣告) 其他條件都相同

注意事項:

  • 針對同一部裝置的單一接觸點評估歸因轉換 歸因模式,因為這些都屬於摘要報表 收集與歸屬數據
  • 請同時思考最壞情況的數量,以及最理想的情況數量 歸因於歸因轉換舉例來說,如果其他條件都相同,請考慮使用 廣告客戶可以獲得的最低和最高廣告活動預算 並預測這兩項結果的可歸因轉換 模擬情境
  • 如果您考慮使用 Android Privacy Sandbox 將跨平台歸因轉換納入計算

決策:使用資源調度

在 Noise Lab 中試用

  1. 前往進階模式。
  2. 在參數側邊面板中,找出你的匯總策略 >資源調度。且預設為「是」。
  3. 為了瞭解擴充雜訊會帶來哪些正面影響 請先將「資源調度」設為「否」
  4. 按一下「模擬」。
  5. 觀察結果模擬的雜訊比例。
  6. 將「Scaling」設為「是」。請注意,Noise Lab 會自動計算 指定要使用的縮放比例係數 挑選合適的評估目標在實際系統或來源試用中 建議您自行計算縮放比例係數。
  7. 按一下「模擬」。
  8. 您會發現此秒的噪音比率現在較低 (優於) 模擬情境因為您是採用資源調度。

根據核心設計原則,加入的雜訊 貢獻預算的功能

因此,如要提高信號雜訊比,您就可以決定 將轉換價值擴大以 貢獻預算 (匯總後對其減少比例)。使用縮放功能提升訊號雜訊比。

決策:評估目標數量和隱私權預算分配比例

這與資源調度相關請務必詳閱使用 資源調度

在 Noise Lab 中試用

評估目標是指在轉換事件中收集的不同資料點。

  1. 前往進階模式。
  2. 在「參數」側邊面板中,找出要追蹤的資料: 評估目標。在預設情況下,您有兩種評估目標:購買 價值和購買數量
  3. 按一下 [模擬],使用預設目標執行模擬作業。
  4. 按一下「移除」。這樣會移除最後一個評估目標 (購買) 計數)。
  5. 按一下「模擬」。
  6. 您會發現此數據的雜訊比例現在較低 。這是因為 這樣就能在評估目標時 捐款預算。
  7. 按一下「重設」。您現在又有兩個評估目標:購買 價值和購買數量請注意,Noise Lab 會自動計算 指定縮放比例係數時, 評估目標對象根據預設,Noise Lab 會 對所有成效評估目標設定相同的預算。
  8. 按一下「模擬」。
  9. 觀察結果模擬的雜訊比例。記下 模擬結果中顯示的縮放比例係數。
  10. 現在要自訂隱私預算分配方式, 即判定訊號與雜訊的比率。
  11. 調整為每個評估目標指定的預算百分比。提供預設值 參數, 評估目標 1, 也就是購物價值 範圍 (介於 0 到 1000 之間) 的範圍就會大於評估目標 2,即 購買次數 (介於 1 到 1 之間,也就是一律等於 1)。因為 因為系統需要「有更多空間可調整」 因此指派更多 將預算分配給成效評估目標 1 (與成效評估目標 2 相比), 可以更有效率地擴充 (請參閱「資源調度」一節),
  12. 將 70% 的預算指派給成效評估目標 1。為評估指派 30% 目標 2。
  13. 按一下「模擬」。
  14. 觀察結果模擬的雜訊比例。購買 雜訊比現在明顯低於先前 模擬情境購買次數大致維持不變。
  15. 持續調整不同指標的預算分配方式。觀察影響 雜訊

請注意,如要自訂評估目標,您可以使用 新增/移除/重設按鈕。


如果您評估某個轉換事件 (例如評估目標) 的轉換事件,例如 就能計算出所有貢獻預算 (65536)。如果您針對單一轉換事件設定多個評估目標, 例如轉換次數和購物價值等 分配捐款預算換句話說,擴充 輕鬆分配獎金

因此,達到的評估目標越多,信號雜訊比就越低 則是 (雜訊較高)

系統也會根據預算分配來制定成效評估目標。如果將貢獻預算平均分配給兩個資料點,則每個資料點會獲得 65536/2 的預算 = 32768。這取決於 每個資料點的最大可能值。比方說,如果您要評估 購物價值上限為 1,購物價值升幅為 介於 1 和 120 之間,只要客戶輸入 「更多空間」也就是向上擴充 捐款預算。您會看到是否有應優先採用某些評估目標 其他與雜訊的影響

決策:離群值管理

在 Noise Lab 中試用

評估目標是指在轉換事件中收集的不同資料點。

  1. 前往進階模式。
  2. 在參數側邊面板中,找出你的匯總策略 >資源調度。
  3. 確認資源調度已設定為是。請注意,Noise Lab 自動計算要使用的縮放比例係數 您為評估目標指定的範圍 (平均值和最大值)。
  4. 假設史上最大的購買金額是 $2, 000 美元, 購買次數大多介於 $10 美元至 $120 美元之間。首先來看看會發生什麼事 若使用常值調整方法 (不建議採用):輸入 $2000 美元做為 purchaseValue 的最大值。
  5. 按一下「模擬」。
  6. 請留意雜訊比例偏高。因為我們的擴充 係數目前是以 $2, 000 美元計算 購物價值自然會比較低
  7. 現在,讓我們用更務實的資源調度方法。調整最高 購物價值設為 $120 美元
  8. 按一下「模擬」。
  9. 您會發現在第二次模擬中,雜訊比例較低 (優於)。

如要實作縮放比例,通常會根據 特定轉換事件的最大值 (詳情請參閱這個範例)。

不過,請避免使用常值最大值來計算縮放係數。 因為這會使你的訊號雜訊比例變差。請改為移除離群值 使用實際的最大值。

離群值管理是相當深入的主題。有多種具體技巧 我想提高訊號雜訊比。這項指令會在 進階離群值管理

後續步驟

您已評估自身用途的各種噪音管理策略, 準備開始試用摘要報表了 透過來源試用運作評估資料查看試用 API 的指南和提示。

附錄

Noise Lab 快速導覽

Noise Lab 可協助您迅速完成 評估及比較噪音管理策略。其用途如下:

  • 瞭解影響雜訊的主要參數,以及 以及已造成的傷害
  • 模擬雜訊對輸出測量資料的影響 每個人的設計決策都有所不同微調設計參數,直到達成 適合您的用途
  • 針對摘要報表的實用性提供意見: 多個 Epsilon 值和雜訊參數適用於在哪裡? 出現轉折點?

不妨將這部影片視為準備步驟。噪音實驗室 產生評估資料,以根據報表結果模擬摘要報表 。不會保存或分享任何資料。

Noise Lab 有兩種不同的模式:

  1. 簡易模式:瞭解您對控制的基本概念 雜訊
  2. 進階模式:測試不同的雜訊管理策略,並評估 根據您的用途,選擇合適的信號雜訊比。

點選頂端選單中的按鈕,即可在兩者之間切換 模式 (下方螢幕截圖中的#1.)。

簡易模式
  • 透過簡易模式,您可以控制參數 (可在左側 或 #2.)。
  • 每個參數都有工具提示 (「?」按鈕)。按一下這些即可查看 各參數的說明 (下方螢幕截圖中的#3.)
  • 首先,按一下 [模擬]看看輸出內容 喜歡 (下方螢幕截圖中的#4.)
  • 您可以在「輸出」部分查看各種詳細資料。只有部分通知 元素旁邊都有 `?`。請花點時間點選各個 `?` 來查看 對各種資訊的解釋
  • 在「Output」(輸出) 部分中,按一下「Details」(詳細資料) 切換按鈕 如果想查看展開的表格 (下方螢幕截圖中的#5.)
  • 在輸出部分的各個資料表下方,有一個選項 下載表格供離線使用。此外,在底部 您可以選擇下載所有資料表格 (#6. 請見下方螢幕截圖)
  • 在「參數」部分中測試不同的參數設定 然後按一下「模擬」,即可查看結果如何影響輸出內容:
    噪音
    適用於簡易模式的 Noise Lab 介面。
進階模式
  • 在進階模式中,您可以進一步控管參數。個人中心 可以加入自訂評估目標和維度 (如螢幕截圖中的第 1 名和第 2 點 )
  • 在「參數」部分中再向下捲動,並查看索引鍵 策略選項。可用來測試不同的鍵結構 (下方螢幕截圖中的 3.)。
    • 如要測試不同的金鑰結構,請將主要策略切換為「B」
    • 輸入要使用的不同鍵結構數量 (預設值為「2」)
    • 按一下「產生金鑰結構」
    • 畫面上隨即會顯示指定鍵結構的選項 找出要加入各個鍵結構的鍵,然後勾選旁邊的核取方塊
    • 按一下「模擬」即可查看輸出內容。
      進階模式提供成效評估目標和要追蹤的維度控制項,並以側欄醒目顯示。
      進階模式的 Noise Lab 介面。
      ,瞭解如何調查及移除這項存取權。
      進階模式也是側欄「參數」部分中的主要策略選項。
      進階模式的 Noise Lab 介面。

雜訊指標

核心概念

加入雜訊以保護個別使用者的隱私權。

如果雜訊值偏高,表示值區/索引鍵是稀疏型 含有部分敏感事件的貢獻。完成了 由 Noise Lab 自動處理,讓個別使用者「藏在人群中」。或於 也就是保護這些受限人士進一步保障隱私 雜訊

雜訊值偏低,表示資料設定是針對這種 好比人類「在人群中隱藏」。也就是說, 值區內含的事件數量足以確保 保護個別使用者的隱私權

此陳述式適用於平均百分比錯誤 (APE) 和 RMSRE_T (根均方平方相對誤差,含門檻)。

APE (平均百分比錯誤)

APE 是信號本身雜訊的比例,也就是真實摘要值。p> APE 值越低,表示訊號雜訊比越好。

公式

針對特定摘要報表,APE 的計算方式如下:

APE 的方程式。必須提供絕對值,因為雜訊可以是負值。

True 是真實的摘要值。APE 是個別雜訊的平均值 真實摘要值,摘要報表中所有項目的平均值。 在 Noise Lab 中,這個值會乘以 100 即可算出百分比。

優缺點

大小較小的值區會對 APE 的最終值產生不成比例的影響。這可能會在評估雜訊時造成誤導。因此,我們加入了另一個指標 RMSRE_T,目的是減輕 APE 的這項限制。詳情請參閱範例

程式碼

查看原始碼 的數字

RMSRE_T (根數與平方差相對誤差,含門檻)

RMSRE_T (根平均正方形相對誤差具有門檻) 是另一種計算雜訊的指標。

如何解讀 RMSRE_T

RMSRE_T 值越低,表示訊號雜訊比越好。
舉例來說,如果您的使用情況可以使用 20%,而 RMSRE_T 為 0.2,表示雜訊等級落在可接受的範圍內。

公式

針對特定摘要報告,RMSRE_T 的計算方式如下:

公式
RMSRE_T 的方程式。必須提供絕對值,因為雜訊可以是負值。
優缺點

相較於 APE,RMSRE_T 的清除功能較為複雜。不過,這有以下幾項優點,因此比 APE 更適合分析摘要報表中的雜訊:

  • RMSRE_T 較為穩定。「T」為閾值「T」用於在計算 RMSRE_T 時將權重分配給轉換較少的值區,由於範圍較小,因此對雜訊而言更加敏感。如果使用 T,指標在轉換次數不多的值區中不會達到高峰。如果 T 等於 5,在轉換次數為 0 的值區中,雜訊值小如 1 會顯示為高於 1。而是 0.2,相當於 1/5,因為 T 等於 5。這個指標會降低對較雜訊較敏感的較小值區所設的權重,因此指標較為穩定,可讓您更輕鬆地比較兩項模擬。
  • RMSRE_T 能讓您輕鬆匯總。知道多個值區的 RMSRE_T 及其真正計數後,您就可以計算總和的 RMSRE_T。此外,也可讓您針對這些合併值最佳化 RMSRE_T。

雖然 APE 可以使用匯總功能,但這個公式相當複雜,因為涉及 Laplace 雜訊的絕對值。這使得 APE 難以進行最佳化。

程式碼

查看原始碼進行 RMSRE_T 計算。

範例

包含三個值區的摘要報表:

  • bucket_1 = 雜訊:10,trueSummaryValue:100
  • bucket_2 = 雜訊:20,trueSummaryValue: 100
  • bucket_3 = 雜訊:20,trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

包含三個值區的摘要報表:

  • bucket_1 = 雜訊:10,trueSummaryValue:100
  • bucket_2 = 雜訊:20,trueSummaryValue: 100
  • bucket_3 = 雜訊:20,trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

包含三個值區的摘要報表:

  • bucket_1 = 雜訊:10,trueSummaryValue:100
  • bucket_2 = 雜訊:20,trueSummaryValue: 100
  • bucket_3 = 雜訊:20,trueSummaryValue: 0

APE = (0.1 + 0.2 + Infinity) / 3 = Infinity

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

進階金鑰管理

需求端平台或廣告評估公司可能會在全球刊登數千則廣告 客戶,橫跨多個產業、貨幣和購買價格 潛力無窮也就是說,您可以建立並管理一個匯總鍵 很不切實際此外, 很難選取可匯總值的上限,以及匯總預算 限制全球數千位廣告主的噪音成效。 讓我們來看看以下情境:

重點策略 A

廣告技術供應商決定針對自家所有供應商決定建立及管理單一鍵 廣告客戶在所有廣告主和所有幣別中, 購買量主要來自低流量、高流量或高流量 購買。這會產生以下鍵:

金鑰 (多種貨幣)
可匯總值上限 5,000,000
購物價值範圍 [120 - 5000000]
重點策略 B

廣告技術供應商決定建立及管理自家機構的兩個鍵 廣告客戶因此決定依貨幣區分鍵。全部 廣告客戶和所有貨幣購買時,購買的數量往往來自於低流量 鎖定高量、低階的買氣請根據貨幣 他們會建立 2 個金鑰:

鍵 1 (美元) 金鑰 2 (¥)
可匯總值上限 $40,000 美元 日幣
購物價值範圍 [120 至 40,000 個] [15,000 至 5,000,000 個]

和重點策略 A 相比,關鍵策略 B 結果的雜訊較少,因為 貨幣金額不會統一分配 (跨貨幣)。例如: 思考一下,「¥」(石) 和 USD 會變更基礎資料,並產生雜訊輸出。

關鍵策略 C

廣告技術供應商決定建立及管理四個鍵, 按貨幣 x 廣告客戶區隔 產業:

索引鍵 1
(美元 x 高級珠寶廣告主)
索引鍵 2
(¥ x 高級珠寶廣告客戶)
按鍵 3
(美元 x 服飾零售商廣告主)
按鍵 4
(¥ x 服飾零售商廣告主)
可匯總值上限 $40,000 美元 日幣 $500 美元 ¥65,000 日圓
購物價值範圍 [10,000 至 40,000 個] [1,250,000 至 5,000,000 個] [120 - 500] [15,000 至 65,000]

策略 C 的結果會比主要策略 B 少,因為 廣告客戶購物價值不會統一分配至所有廣告客戶。適用對象 例如,想想如何選購並搭配其他商品購買高級珠寶 ,這就會改變基礎資料並產生雜訊輸出。

考慮建立共同的匯總值上限和共同的資源調度係數 找出多個廣告客戶的共通點,以減少 輸出內容例如,您可以嘗試不同的策略,以獲得翻譯成效。 您的廣告客戶:

  • 一項以貨幣 (美元、¥、加幣等) 劃分的策略
  • 依廣告主產業區分的策略 (保險、汽車、 零售等)
  • 一種以購物價值範圍 ([100]、 [1000]、[10000] 等)

就廣告客戶共通性、重點和 較容易管理,且信號雜訊比 更高。測試不同的廣告客戶策略 能發掘提升雜訊影響 (相較於程式碼) 的連貫性 以自動化做法管理成本


進階離群值管理

我們來看看兩位廣告主的情境:

  • 廣告客戶 A:
    • 廣告客戶 A 網站上所有產品的購買價格 可能介於 [$120 - $1,000] 之間,介於 $880 美元之間。
    • 購買價格平均分配於 $880 美元的金額範圍內 不含與購買價格中位數相差兩個標準差額以外的異常值。
  • 廣告客戶 B:
    • 廣告客戶 B 網站上所有產品的購買價格 可能介於 [$120 - $1,000] 之間,介於 $880 美元之間。
    • 購買價格非常偏向 $120 - $500 美元, 其中只有 5% 的消費都發生在 $500 - $1,000 美元之間

由於 捐款預算規定 以及根據結果套用雜訊的方法,廣告主 B 在預設情況下提供的輸出內容比 因為廣告客戶 B 對離群較有影響 基本計算

您可以透過特定的金鑰設定緩解這個問題。測試主要策略 協助管理離群資料,以及更平均地分配購物價值 而是在鍵的購買範圍內

針對廣告客戶 B,您可以建立兩個不同的鍵來擷取兩個不同的鍵 購物價值範圍在這個範例中,廣告技術指出異常值 高於 $500 美元的購物價值請嘗試實作兩個不同的 此廣告主:

  • 主要結構 1:只能擷取 介於 $120 - $500 美元之間 (涵蓋總購買量約 95%)。
  • 主要結構 2:只能擷取超過 $500 美元的消費次數 (涵蓋總購買量的 5% 左右)。

執行這項關鍵策略應該能妥善管理廣告客戶 B 和廣告客戶 B 的干擾 以充分利用摘要報表的實用性。有新的 範圍、鍵 A 和鍵 B 現在應採用更統一的資料分佈情形 分別用於先前的單一鍵。這會產生 在每個索引鍵的輸出內容中,對前一個索引鍵的雜訊影響較小。