關於這份文件
閱讀這份文件,即表示您將:
- 在產生摘要報表前,請先瞭解要建立哪些策略。
- 我們推出了 Noise Lab,這項工具可協助你掌握各種雜訊參數的效果,並快速探索及評估各種雜訊管理策略。
提供意見
本文件摘要列出與摘要報表的幾項原則 雜訊管理的方法有很多種,但可能並未反映 此處。歡迎您提出建議、新增內容和問題!
- 如要向大眾提供有關噪音管理策略的意見,請點按以下按鈕: API (Epsilon) 的公用程式或隱私權,並分享您在 以 Noise Lab 模擬結果: 對這個問題發表留言
- 如要對 Noise Lab 提供公開意見 (如提問、回報錯誤、 要求新功能): 在這裡建立新問題
- 如何針對 API 的另一方面提供公開意見回饋: 在這裡建立新問題
事前準備
- 如需相關簡介,請參閱「歸因報表:摘要報表」和「歸因報表完整系統總覽」一文。
- 如要充分運用本指南,請掃描「瞭解雜訊」和「瞭解匯總鍵」這兩篇文章。
設計決策
核心設計原則
第三方 Cookie 和摘要報表的運作方式存在基本差異。其中一個主要差異是 noise 已加進摘要報表。另一種方式則是安排報表的傳送方式。
存取信號雜訊較高的摘要報表評估資料 比率、需求端平台 (DSP) 和廣告評估服務供應商 與廣告客戶合作,制定噪音管理策略。為了製定這些策略,需求端平台和評估服務供應商必須制定設計決策。這些決策圍繞一個重要概念:
雖然分佈狀況的雜訊值是完全依據,但僅取決於兩個參數⏤epsilon 和貢獻預算⏤ 輸出測量資料的訊號及雜訊比。
雖然我們預期反覆式流程才能做出最明智的決策,但對於這些決策的不同之處, 導入設定會有些許不同,因此您必須在撰寫每個程式碼疊代 (以及放送廣告前) 之前做出這些決定。
決策:維度精細程度
在 Noise Lab 中試用
- 前往進階模式。
- 在參數側邊面板中,找出轉換資料。
- 觀察預設參數。預設值為每天 TOTAL 可歸因的轉換次數為 1,000。這個平均值大約是每秒 40 個 如果您使用預設設定 (預設維度、預設數量 每個維度可能出現的不同值,也就是主要策略 A)。請留意 在輸入的平均每日可歸因轉換次數中,這個值為 40 每個值區
- 按一下 [模擬],使用預設參數執行模擬。
- 在「參數」側邊面板中找出「維度」。重新命名 將「Geography」為「City」,並將可能不同值的數量變更為 50。
- 觀察這項變更對於平均每日可歸因轉換的影響 每個值區的數量它現在變得更低了。這是因為如果流量 這個維度中可能值的數量,但不會變更 在其他情況下,可以在不變更的情況下增加值區總數 每個值區中的轉換事件數量
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例:雜訊比是 比前一次模擬得高
根據核心設計原則,較小的匯總值 雜訊大於大型摘要值因此,您的設定選項 會影響各值區中最終的歸因轉換事件數量 (否則 稱為匯總鍵),該數量會影響 最終輸出結果摘要報表。
一項會影響已歸因轉換事件的數量的設計決策 維度精細程度請參考以下範例 及其維度
- 方法 1:單一維度結構較粗的:國家/地區 x 廣告活動 (或大型廣告活動) 匯總值區) x 產品類型 (在 10 個可能的產品類型中)
- 方法 2:採用精細維度的單一主要結構:城市 x 廣告素材 ID x 產品 (共 100 項產品)
「城市」是比「國家/地區」更精細的維度。廣告素材 ID 較為精細 (大於「廣告活動」);和「產品」比「產品類型」更精細。因此 方法 2 在每個區間 (= 鍵) 的摘要報表輸出,而非方法 1。由於雜訊 輸出結果與值區中的事件數量、評估資料無關 採用方法 2 會比較繁雜摘要針對每個廣告客戶嘗試各種 為了確保金鑰的實用性 結果。
決策:主要結構
在 Noise Lab 中試用
在簡易模式中,系統會使用預設鍵結構。進階課程 可以測試不同的主要結構部分維度範例 已包含;也可以修改這些項目
- 前往進階模式。
- 在「參數」側邊面板中找出「主要策略」。觀察 工具中的預設策略 (名為 A) 使用精細的 包含所有維度的結構:地理位置 x 廣告活動 ID x 產品 類別
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例。
- 將主要策略變更為 B。畫面上會顯示其他控制選項 您能設定金鑰結構
- 設定金鑰結構,例如:如下所示:
- 金鑰結構數量:2
- 金鑰結構 1 = 地理位置 x 產品類別。
- 金鑰結構 2 = 廣告活動 ID x 產品類別。
- 按一下「模擬」。
- 您會發現,現在每個評估目標類型都會有兩份摘要報表 (針對購買次數,兩個,兩組代表購買價值), 有兩個不同的金鑰結構觀察牠們的噪音比例。
- 您也可以使用自己的自訂維度嘗試此做法。方法很簡單,只要 第二種是 [維度]建議移除範例 然後在「新增/移除/重設」選項中自行建立 按鈕。
會影響歸因轉換次數的另一項設計決策 單一值區中的事件 主要結構 由您決定請參考以下匯總鍵範例:
- 一個包含所有維度的鍵結構;命名為「重要策略 A」
- 兩個主要結構,每個主要結構都有維度子集:我們稱之為 重點策略 B:
策略 A 較為簡單,但您可能需要匯總 (加總) 包含摘要報表的雜訊摘要值,才能查看特定洞察資料。將這些值加總,也能達到雜訊的總和。 使用策略 B 時,摘要值會顯示在摘要中 報表可能已提供您所需的資訊。也就是策略 B 相比之下,策略 A 的信號雜訊比可能會更好。不過, 策略 A 可能可以接受雜訊,因此您還是可以決定 策略 A,簡單易懂。 進一步瞭解這兩種策略的詳細範例。
管理金鑰是相當複雜的主題。有多種具體技巧 我想提高訊號雜訊比。請參閱「進階金鑰」一節 管理
決策:批次處理頻率
在 Noise Lab 中試用
- 前往簡易模式 (或進階模式),兩種模式皆可 以批次方式執行頻率)
- 在參數側邊面板中,找出你的匯總策略 >批次處理頻率。這是指批次處理頻率 透過匯總服務處理的可匯總報表 單一工作。
- 觀察預設批次處理頻率:預設為每日批次作業 頻率為模擬頻率
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例。
- 將批次處理頻率變更為每週。
- 觀察結果模擬的雜訊比例:雜訊比是 比先前的模擬結果低 (優於之前的模擬結果)。
會影響歸因轉換次數的另一項設計決策 是您決定使用的批次頻率。 批次處理頻率是指系統處理可匯總報表的頻率。
如果定期執行更頻繁的匯總報表 (例如每小時), 內含的轉換事件少於一份報表,但頻率較低 匯總排程 (例如每週)。因此,每小時報表會包含更多雜訊。`` 內含的轉換事件少於一份報表,但頻率較低 匯總排程 (例如每週)。因此,每小時報表 的信號雜訊比低於每週報表,其他條件都相同。嘗試各種頻率的報表需求條件,並評估每種頻率的信號雜訊比。
詳情請參閱: 批次處理 以及匯總較長時間範圍的資料。
決策:影響可歸因轉換的廣告活動變數
在 Noise Lab 中試用
雖然這可能難以預測,而且 除了季節性影響之外,建議您 可歸因於 10: 10、100、 1,000 或 10,000。
- 前往進階模式。
- 在參數側邊面板中,找出轉換資料。
- 觀察預設參數。預設值為每天 TOTAL 可歸因的轉換次數為 1,000。這個平均值大約是每秒 40 個 如果您使用預設設定 (預設維度、預設數量 每個維度可能出現的不同值,也就是主要策略 A)。請留意 在輸入的平均每日可歸因轉換次數中,這個值為 40 每個值區
- 按一下 [模擬],使用預設參數執行模擬。
- 觀察結果模擬的雜訊比例。
- 現在,請將 TOTAL 每日可歸因轉換次數設為 100。 請留意,這樣會降低每日平均歸因價值 每個值區的轉換次數。
- 按一下「模擬」。
- 您會發現雜訊比現在更高,這是因為 每個值區的轉換量較少,系統會套用更多雜訊來維持 隱私權。
其中一個重要區別就是 這個值與可能歸因轉換的總次數。 後者最終會影響摘要報表中的雜訊。歸因 「轉換次數」是廣告活動中可能促成的轉換總數 例如廣告預算和廣告指定目標等變數。舉例來說,假設您希望使用者 $1,000 萬美元廣告活動帶來的歸因轉換次數升幅 (相較於 $1 萬美元的廣告) 其他條件都相同
注意事項:
- 針對同一部裝置的單一接觸點評估歸因轉換 歸因模式,因為這些都屬於摘要報表 收集與歸屬數據
- 請同時思考最壞情況的數量,以及最理想的情況數量 歸因於歸因轉換舉例來說,如果其他條件都相同,請考慮使用 廣告客戶可以獲得的最低和最高廣告活動預算 並預測這兩項結果的可歸因轉換 模擬情境
- 如果您考慮使用 Android Privacy Sandbox 將跨平台歸因轉換納入計算
決策:使用資源調度
在 Noise Lab 中試用
- 前往進階模式。
- 在參數側邊面板中,找出你的匯總策略 >資源調度。且預設為「是」。
- 為了瞭解擴充雜訊會帶來哪些正面影響 請先將「資源調度」設為「否」
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例。
- 將「Scaling」設為「是」。請注意,Noise Lab 會自動計算 指定要使用的縮放比例係數 挑選合適的評估目標在實際系統或來源試用中 建議您自行計算縮放比例係數。
- 按一下「模擬」。
- 您會發現此秒的噪音比率現在較低 (優於) 模擬情境因為您是採用資源調度。
根據核心設計原則,加入的雜訊 貢獻預算的功能
因此,如要提高信號雜訊比,您就可以決定 將轉換價值擴大以 貢獻預算 (匯總後對其減少比例)。使用縮放功能提升訊號雜訊比。
決策:評估目標數量和隱私權預算分配比例
這與資源調度相關請務必詳閱使用 資源調度。
在 Noise Lab 中試用
評估目標是指在轉換事件中收集的不同資料點。
- 前往進階模式。
- 在「參數」側邊面板中,找出要追蹤的資料: 評估目標。在預設情況下,您有兩種評估目標:購買 價值和購買數量
- 按一下 [模擬],使用預設目標執行模擬作業。
- 按一下「移除」。這樣會移除最後一個評估目標 (購買) 計數)。
- 按一下「模擬」。
- 您會發現此數據的雜訊比例現在較低 。這是因為 這樣就能在評估目標時 捐款預算。
- 按一下「重設」。您現在又有兩個評估目標:購買 價值和購買數量請注意,Noise Lab 會自動計算 指定縮放比例係數時, 評估目標對象根據預設,Noise Lab 會 對所有成效評估目標設定相同的預算。
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例。記下 模擬結果中顯示的縮放比例係數。
- 現在要自訂隱私預算分配方式, 即判定訊號與雜訊的比率。
- 調整為每個評估目標指定的預算百分比。提供預設值 參數, 評估目標 1, 也就是購物價值 範圍 (介於 0 到 1000 之間) 的範圍就會大於評估目標 2,即 購買次數 (介於 1 到 1 之間,也就是一律等於 1)。因為 因為系統需要「有更多空間可調整」 因此指派更多 將預算分配給成效評估目標 1 (與成效評估目標 2 相比), 可以更有效率地擴充 (請參閱「資源調度」一節),
- 將 70% 的預算指派給成效評估目標 1。為評估指派 30% 目標 2。
- 按一下「模擬」。
- 觀察結果模擬的雜訊比例。購買 雜訊比現在明顯低於先前 模擬情境購買次數大致維持不變。
- 持續調整不同指標的預算分配方式。觀察影響 雜訊
請注意,如要自訂評估目標,您可以使用 新增/移除/重設按鈕。
如果您評估某個轉換事件 (例如評估目標) 的轉換事件,例如 就能計算出所有貢獻預算 (65536)。如果您針對單一轉換事件設定多個評估目標, 例如轉換次數和購物價值等 分配捐款預算換句話說,擴充 輕鬆分配獎金
因此,達到的評估目標越多,信號雜訊比就越低 則是 (雜訊較高)
系統也會根據預算分配來制定成效評估目標。如果將貢獻預算平均分配給兩個資料點,則每個資料點會獲得 65536/2 的預算 = 32768。這取決於 每個資料點的最大可能值。比方說,如果您要評估 購物價值上限為 1,購物價值升幅為 介於 1 和 120 之間,只要客戶輸入 「更多空間」也就是向上擴充 捐款預算。您會看到是否有應優先採用某些評估目標 其他與雜訊的影響
決策:離群值管理
在 Noise Lab 中試用
評估目標是指在轉換事件中收集的不同資料點。
- 前往進階模式。
- 在參數側邊面板中,找出你的匯總策略 >資源調度。
- 確認資源調度已設定為是。請注意,Noise Lab 自動計算要使用的縮放比例係數 您為評估目標指定的範圍 (平均值和最大值)。
- 假設史上最大的購買金額是 $2, 000 美元, 購買次數大多介於 $10 美元至 $120 美元之間。首先來看看會發生什麼事 若使用常值調整方法 (不建議採用):輸入 $2000 美元做為 purchaseValue 的最大值。
- 按一下「模擬」。
- 請留意雜訊比例偏高。因為我們的擴充 係數目前是以 $2, 000 美元計算 購物價值自然會比較低
- 現在,讓我們用更務實的資源調度方法。調整最高 購物價值設為 $120 美元
- 按一下「模擬」。
- 您會發現在第二次模擬中,雜訊比例較低 (優於)。
如要實作縮放比例,通常會根據 特定轉換事件的最大值 (詳情請參閱這個範例)。
不過,請避免使用常值最大值來計算縮放係數。 因為這會使你的訊號雜訊比例變差。請改為移除離群值 使用實際的最大值。
離群值管理是相當深入的主題。有多種具體技巧 我想提高訊號雜訊比。這項指令會在 進階離群值管理。
後續步驟
您已評估自身用途的各種噪音管理策略, 準備開始試用摘要報表了 透過來源試用運作評估資料查看試用 API 的指南和提示。
附錄
Noise Lab 快速導覽
Noise Lab 可協助您迅速完成 評估及比較噪音管理策略。其用途如下:
- 瞭解影響雜訊的主要參數,以及 以及已造成的傷害
- 模擬雜訊對輸出測量資料的影響 每個人的設計決策都有所不同微調設計參數,直到達成 適合您的用途
- 針對摘要報表的實用性提供意見: 多個 Epsilon 值和雜訊參數適用於在哪裡? 出現轉折點?
不妨將這部影片視為準備步驟。噪音實驗室 產生評估資料,以根據報表結果模擬摘要報表 。不會保存或分享任何資料。
Noise Lab 有兩種不同的模式:
- 簡易模式:瞭解您對控制的基本概念 雜訊
- 進階模式:測試不同的雜訊管理策略,並評估 根據您的用途,選擇合適的信號雜訊比。
點選頂端選單中的按鈕,即可在兩者之間切換 模式 (下方螢幕截圖中的#1.)。
簡易模式
- 透過簡易模式,您可以控制參數 (可在左側 或 #2.)。
- 每個參數都有工具提示 (「?」按鈕)。按一下這些即可查看 各參數的說明 (下方螢幕截圖中的#3.)
- 首先,按一下 [模擬]看看輸出內容 喜歡 (下方螢幕截圖中的#4.)
- 您可以在「輸出」部分查看各種詳細資料。只有部分通知 元素旁邊都有 `?`。請花點時間點選各個 `?` 來查看 對各種資訊的解釋
- 在「Output」(輸出) 部分中,按一下「Details」(詳細資料) 切換按鈕 如果想查看展開的表格 (下方螢幕截圖中的#5.)
- 在輸出部分的各個資料表下方,有一個選項 下載表格供離線使用。此外,在底部 您可以選擇下載所有資料表格 (#6. 請見下方螢幕截圖)
- 在「參數」部分中測試不同的參數設定 然後按一下「模擬」,即可查看結果如何影響輸出內容:
進階模式
- 在進階模式中,您可以進一步控管參數。個人中心 可以加入自訂評估目標和維度 (如螢幕截圖中的第 1 名和第 2 點 )
- 在「參數」部分中再向下捲動,並查看索引鍵
策略選項。可用來測試不同的鍵結構
(下方螢幕截圖中的 3.)。
- 如要測試不同的金鑰結構,請將主要策略切換為「B」
- 輸入要使用的不同鍵結構數量 (預設值為「2」)
- 按一下「產生金鑰結構」
- 畫面上隨即會顯示指定鍵結構的選項 找出要加入各個鍵結構的鍵,然後勾選旁邊的核取方塊
- 按一下「模擬」即可查看輸出內容。 ,瞭解如何調查及移除這項存取權。
雜訊指標
核心概念
加入雜訊以保護個別使用者的隱私權。
如果雜訊值偏高,表示值區/索引鍵是稀疏型 含有部分敏感事件的貢獻。完成了 由 Noise Lab 自動處理,讓個別使用者「藏在人群中」。或於 也就是保護這些受限人士進一步保障隱私 雜訊
雜訊值偏低,表示資料設定是針對這種 好比人類「在人群中隱藏」。也就是說, 值區內含的事件數量足以確保 保護個別使用者的隱私權
此陳述式適用於平均百分比錯誤 (APE) 和 RMSRE_T (根均方平方相對誤差,含門檻)。
APE (平均百分比錯誤)
APE 是信號本身雜訊的比例,也就是真實摘要值。p> APE 值越低,表示訊號雜訊比越好。
公式
針對特定摘要報表,APE 的計算方式如下:
True 是真實的摘要值。APE 是個別雜訊的平均值 真實摘要值,摘要報表中所有項目的平均值。 在 Noise Lab 中,這個值會乘以 100 即可算出百分比。
優缺點
大小較小的值區會對 APE 的最終值產生不成比例的影響。這可能會在評估雜訊時造成誤導。因此,我們加入了另一個指標 RMSRE_T,目的是減輕 APE 的這項限制。詳情請參閱範例。
程式碼
查看原始碼 的數字
RMSRE_T (根數與平方差相對誤差,含門檻)
RMSRE_T (根平均正方形相對誤差具有門檻) 是另一種計算雜訊的指標。
如何解讀 RMSRE_T
RMSRE_T 值越低,表示訊號雜訊比越好。
舉例來說,如果您的使用情況可以使用 20%,而 RMSRE_T 為 0.2,表示雜訊等級落在可接受的範圍內。
公式
針對特定摘要報告,RMSRE_T 的計算方式如下:
優缺點
相較於 APE,RMSRE_T 的清除功能較為複雜。不過,這有以下幾項優點,因此比 APE 更適合分析摘要報表中的雜訊:
- RMSRE_T 較為穩定。「T」為閾值「T」用於在計算 RMSRE_T 時將權重分配給轉換較少的值區,由於範圍較小,因此對雜訊而言更加敏感。如果使用 T,指標在轉換次數不多的值區中不會達到高峰。如果 T 等於 5,在轉換次數為 0 的值區中,雜訊值小如 1 會顯示為高於 1。而是 0.2,相當於 1/5,因為 T 等於 5。這個指標會降低對較雜訊較敏感的較小值區所設的權重,因此指標較為穩定,可讓您更輕鬆地比較兩項模擬。
- RMSRE_T 能讓您輕鬆匯總。知道多個值區的 RMSRE_T 及其真正計數後,您就可以計算總和的 RMSRE_T。此外,也可讓您針對這些合併值最佳化 RMSRE_T。
雖然 APE 可以使用匯總功能,但這個公式相當複雜,因為涉及 Laplace 雜訊的絕對值。這使得 APE 難以進行最佳化。
程式碼
查看原始碼進行 RMSRE_T 計算。
範例
包含三個值區的摘要報表:
- bucket_1 = 雜訊:10,trueSummaryValue:100
- bucket_2 = 雜訊:20,trueSummaryValue: 100
- bucket_3 = 雜訊:20,trueSummaryValue: 200
APE = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
包含三個值區的摘要報表:
- bucket_1 = 雜訊:10,trueSummaryValue:100
- bucket_2 = 雜訊:20,trueSummaryValue: 100
- bucket_3 = 雜訊:20,trueSummaryValue: 20
APE = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
包含三個值區的摘要報表:
- bucket_1 = 雜訊:10,trueSummaryValue:100
- bucket_2 = 雜訊:20,trueSummaryValue: 100
- bucket_3 = 雜訊:20,trueSummaryValue: 0
APE = (0.1 + 0.2 + Infinity) / 3 = Infinity
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
進階金鑰管理
需求端平台或廣告評估公司可能會在全球刊登數千則廣告 客戶,橫跨多個產業、貨幣和購買價格 潛力無窮也就是說,您可以建立並管理一個匯總鍵 很不切實際此外, 很難選取可匯總值的上限,以及匯總預算 限制全球數千位廣告主的噪音成效。 讓我們來看看以下情境:
重點策略 A
廣告技術供應商決定針對自家所有供應商決定建立及管理單一鍵 廣告客戶在所有廣告主和所有幣別中, 購買量主要來自低流量、高流量或高流量 購買。這會產生以下鍵:
金鑰 (多種貨幣) | |
---|---|
可匯總值上限 | 5,000,000 |
購物價值範圍 | [120 - 5000000] |
重點策略 B
廣告技術供應商決定建立及管理自家機構的兩個鍵 廣告客戶因此決定依貨幣區分鍵。全部 廣告客戶和所有貨幣購買時,購買的數量往往來自於低流量 鎖定高量、低階的買氣請根據貨幣 他們會建立 2 個金鑰:
鍵 1 (美元) | 金鑰 2 (¥) | |
---|---|---|
可匯總值上限 | $40,000 美元 | 日幣 |
購物價值範圍 | [120 至 40,000 個] | [15,000 至 5,000,000 個] |
和重點策略 A 相比,關鍵策略 B 結果的雜訊較少,因為 貨幣金額不會統一分配 (跨貨幣)。例如: 思考一下,「¥」(石) 和 USD 會變更基礎資料,並產生雜訊輸出。
關鍵策略 C
廣告技術供應商決定建立及管理四個鍵, 按貨幣 x 廣告客戶區隔 產業:
索引鍵 1 (美元 x 高級珠寶廣告主) |
索引鍵 2 (¥ x 高級珠寶廣告客戶) |
按鍵 3 (美元 x 服飾零售商廣告主) |
按鍵 4 (¥ x 服飾零售商廣告主) |
|
---|---|---|---|---|
可匯總值上限 | $40,000 美元 | 日幣 | $500 美元 | ¥65,000 日圓 |
購物價值範圍 | [10,000 至 40,000 個] | [1,250,000 至 5,000,000 個] | [120 - 500] | [15,000 至 65,000] |
策略 C 的結果會比主要策略 B 少,因為 廣告客戶購物價值不會統一分配至所有廣告客戶。適用對象 例如,想想如何選購並搭配其他商品購買高級珠寶 ,這就會改變基礎資料並產生雜訊輸出。
考慮建立共同的匯總值上限和共同的資源調度係數 找出多個廣告客戶的共通點,以減少 輸出內容例如,您可以嘗試不同的策略,以獲得翻譯成效。 您的廣告客戶:
- 一項以貨幣 (美元、¥、加幣等) 劃分的策略
- 依廣告主產業區分的策略 (保險、汽車、 零售等)
- 一種以購物價值範圍 ([100]、 [1000]、[10000] 等)
就廣告客戶共通性、重點和 較容易管理,且信號雜訊比 更高。測試不同的廣告客戶策略 能發掘提升雜訊影響 (相較於程式碼) 的連貫性 以自動化做法管理成本
進階離群值管理
我們來看看兩位廣告主的情境:
- 廣告客戶 A:
- 廣告客戶 A 網站上所有產品的購買價格 可能介於 [$120 - $1,000] 之間,介於 $880 美元之間。
- 購買價格平均分配於 $880 美元的金額範圍內 不含與購買價格中位數相差兩個標準差額以外的異常值。
- 廣告客戶 B:
- 廣告客戶 B 網站上所有產品的購買價格 可能介於 [$120 - $1,000] 之間,介於 $880 美元之間。
- 購買價格非常偏向 $120 - $500 美元, 其中只有 5% 的消費都發生在 $500 - $1,000 美元之間
由於 捐款預算規定 以及根據結果套用雜訊的方法,廣告主 B 在預設情況下提供的輸出內容比 因為廣告客戶 B 對離群較有影響 基本計算
您可以透過特定的金鑰設定緩解這個問題。測試主要策略 協助管理離群資料,以及更平均地分配購物價值 而是在鍵的購買範圍內
針對廣告客戶 B,您可以建立兩個不同的鍵來擷取兩個不同的鍵 購物價值範圍在這個範例中,廣告技術指出異常值 高於 $500 美元的購物價值請嘗試實作兩個不同的 此廣告主:
- 主要結構 1:只能擷取 介於 $120 - $500 美元之間 (涵蓋總購買量約 95%)。
- 主要結構 2:只能擷取超過 $500 美元的消費次數 (涵蓋總購買量的 5% 左右)。
執行這項關鍵策略應該能妥善管理廣告客戶 B 和廣告客戶 B 的干擾 以充分利用摘要報表的實用性。有新的 範圍、鍵 A 和鍵 B 現在應採用更統一的資料分佈情形 分別用於先前的單一鍵。這會產生 在每個索引鍵的輸出內容中,對前一個索引鍵的雜訊影響較小。