本頁面由 Cloud Translation API 翻譯而成。

雜訊插入

查詢資料庫時，雜訊插入技術可保護使用者隱私，運作方式是在查詢的 SELECT 匯總子句中加入隨機雜訊。在保護使用者隱私之餘，這個雜訊能還能提供合理準確的結果，為您省去進行差異檢查的麻煩，並降低取得結果所需達到的匯總門檻。目前大多數的查詢都能在雜訊模式下執行，但有一些限制。

瞭解使用雜訊插入功能的優點

無須進行差異檢查：如果在執行查詢時使用雜訊插入功能，廣告資料中心就不會因為與先前的結果集類似，而篩除資料列。換句話說，在保護使用者隱私的同時，資料仍能一覽無遺。

簡化疑難排解：系統只會基於匯總要求而略過資料列，疑難排解和調整查詢也將更輕鬆。

無須學習新的語法：您不必學習任何新的查詢語法，也不必精通隱私權概念，就能使用雜訊來取代差異檢查。

回報結果準確度：成功執行工作後，您會看到可能受到雜訊影響的資料所占的總百分比。

瞭解雜訊對隱私權規定的影響

差異檢查：插入雜訊時，不必進行廣告資料中心現有的差異檢查，這類檢查會停用。

匯總要求：雜訊插入功能會輸出曝光資料 (以大約至少 20 位不重複使用者做為代表)，以及點擊或轉換資料 (以大約至少 10 位不重複使用者做為代表)。

靜態檢查：沒有任何影響。

預算和查詢限制：使用雜訊功能執行的查詢，會與差異檢查共用資料存取預算。與差異檢查一樣，如果對同一個資料集執行多次相同查詢，可能會失去查詢資料集中常用日期的權限。執行滑動區間查詢，或是多次發出同一項要求時，可能就會發生上述情況。

在查詢中或跨查詢重新計算相同的匯總結果時，雜訊模式會施加更嚴格的額外限制。與資料存取預算一樣，您可能會失去查詢資料集中常用日期的權限；但是重新計算相同的匯總結果而產生的限制，只會限制雜訊模式中的查詢，不會限制差異檢查模式中的查詢。詳情請參閱「重複結果」一節。

如要進一步瞭解隱私權檢查，請參閱本文。

瞭解雜訊插入功能對結果的影響

廣告資料中心會插入雜訊來降低資料外洩的風險，防止他人取得個別使用者的相關資訊，在保護隱私和實用之間取得平衡。

廣告資料中心的雜訊插入功能會轉換查詢結果，方法如下：

對離群使用者在匯總結果中所占的資料量限制取值範圍，亦即加總每位使用者在每項匯總作業中所占的資料量，然後為每位使用者所占的資料量設定取值範圍的上下限。
匯總已限制取值範圍的每位使用者所占資料量。
在每筆匯總結果 (每個資料列中每次匯總函式呼叫的結果) 中加入雜訊。這個隨機雜訊的規模，與限制取值範圍的上下限成比例。
計算每個資料列套用雜訊的使用者人數，刪除使用者過少的資料列。這類似於差異檢查模式中的 k-anonymity，但在相同資料集中執行的作業，可能會因為雜訊而刪除不同的資料列。此外，雜訊模式的匯總要求較低 (大約 20 列，而不是整整 50 列)，因此刪除的資料列較少。

最終結果是一個資料集，其中每個資料列的匯總結果都套用雜訊，且刪除人數較少的群體，個別使用者對傳回結果的影響就不會顯現出來。

關於匯總取值範圍限制

廣告資料中心的雜訊插入功能，會採用隱性或顯性匯總取值範圍限制，藉此限制離群使用者所占的資料量。您可以根據自身的使用情況，選擇要採用哪一種取值範圍限制。

隱性取值範圍限制

您不必使用任何特別的 SQL 語法，就能套用隱性取值範圍限制，因為系統預設會套用這項限制。隱含界限是從資料本身衍生而來，且會為每個匯總決定。如果某些匯總的值範圍大於其他匯總，隱性取值範圍限制可視情況為不同匯總推斷不同的上下限。這樣通常可以減少錯誤。請注意，COUNT(DISTINCT user_id) 會自動使用顯性取值範圍限制，上限為 1。

顯性取值範圍限制

顯性取值範圍限制會將每位使用者所占的總資料量限制在指定範圍內。顯性上下限會一致套用到所有匯總，而且必須為常值。如果大致知道範圍，顯性鉗制可能會提供較好的結果。舉例來說，將年齡限制在 0 到 100 歲之間，反映的是公開資訊，因為大多數人的年齡通常都在這個範圍內。

廣告資料中心提供補充的ADH.ANON匯總函式，用於明確的箝制。如要使用顯性取值範圍限制，請為每個支援的匯總函式設定上下限，並分別加入整數來代表下限和上限。例如：

SELECT
campaign_name,
-- Set lower and upper bounds to 0 and 1, respectively
ADH.ANON_COUNT(*, contribution_bounds_per_group => (0,1))
FROM data
GROUP BY 1

使用雜訊插入功能執行查詢

開啟報表。
按一下「隱私權雜訊設定」切換鈕，撥到「使用雜訊」的位置。
執行查詢。
查看加入雜訊的影響。
選用步驟：調整查詢，減少雜訊造成的影響。

查看雜訊造成的影響

工作成功完成後，廣告資料中心會在隱私權摘要中顯示結果的可靠性。可靠性是根據輸出內容中可能受到雜訊高度影響的儲存格百分比計算。如果加入的雜訊量超過儲存格內所顯示結果的 5%，就表示結果資料表中的值受到影響。

對於受影響的輸出資料集，隱私權摘要會按照影響程度由高到低的順序，列出雜訊最多的前 10 個資料欄，以及這些資料欄相對於雜訊的影響。以下詳細列出噪音影響標籤。

受影響結果的百分比	指標顏色	具影響力
不到 5%	綠色	影響程度低
5% 至 15%	黃色	影響程度普通
15% 至 25%	Orange	影響程度高
>25%	紅色	影響程度非常高

您也可以在「首頁」頁面預覽近期報表工作的隱私權摘要。如要預覽特定工作的隱私權設定，請將指標懸停在「近期活動」下方工作資訊卡中的隱私權提示圖示 privacy_tip 上。

調整查詢

如果對匯總結果產生影響的使用者人數不多，結果會更有可能含有雜訊。如果匯總資料是根據少量使用者計算，或是部分使用者不會影響結果 (例如使用 COUNTIF 函式時)，可能就會發生上述情況。建議您根據雜訊報表調整查詢，減少受影響的結果所占的百分比。

一般準則如下：

擴大日期範圍。
改寫查詢來降低資料精細程度，例如減少做為分組依據的參數，或是使用 COUNT 取代 COUNTIF。
移除套用雜訊的資料欄。
如果可以選擇合理的界限，請嘗試顯性取值範圍限制。

支援的匯總函式

系統支援搭配雜訊使用下列匯總函式：

SUM(...)
COUNT(*)
COUNT(...)
COUNTIF(...)
COUNT(DISTINCT user_id)
APPROX_COUNT_DISTINCT(user_id)
AVG(...)

DISTINCT 關鍵字的使用條件有兩個，一是必須搭配 COUNT 函式，二是直接參照廣告資料中心資料表的 user_id 資料欄，或是會傳回 user_id 或 NULL 的運算式，例如 COUNT(DISTINCT IF(..., user_id, NULL))。

請注意，這些限制只會套用至含有雜訊的匯總作業，也就是第一層的跨使用者匯總作業。使用者層級匯總和注入雜訊後的匯總資料不受限制。

補充匯總函式

除了支援一般匯總函式，廣告資料中心還推出補充的 ADH.ANON 匯總函式，支援明確的箝制。這些匯總函式與 BigQuery 差異隱私匯總函式共用語法，但不需要 WITH DIFFERENTIAL_PRIVACY 子句：

ADH.ANON_SUM( ..., [ contribution_bounds_per_group => (lower_bound, upper_bound) ] )
ADH.ANON_COUNT( *, [ contribution_bounds_per_group => (lower_bound, upper_bound) ] )
ADH.ANON_COUNT( ..., [ contribution_bounds_per_group => (lower_bound, upper_bound) ] )
ADH.ANON_AVG( ..., [ contribution_bounds_per_group => (lower_bound, upper_bound) ] )
ADH.ANON_PERCENTILE_CONT( ..., percentile, contribution_bounds_per_row => (lower_bound, upper_bound) )

ADH.ANON_SUM、ADH.ANON_COUNT 和 ADH.ANON_AVG 參數：

contribution_bounds_per_group：系統會針對 GROUP BY 鍵定義的每個分區，限制每位使用者所占資料量的取值範圍。上限和下限會套用至每個群組的值，前提是這些值已按使用者匯總。
lower_bound：代表要納入匯總的最小值之數值常值。
upper_bound：代表要納入匯總的最大值的數值常值。

ADH.ANON_PERCENTILE_CONT 參數：

percentile：要計算的百分位數，範圍為 [0, 1] 的常值。
contribution_bounds_per_row：系統會根據每列 (每筆記錄) 限制每位使用者所占資料量。請注意，百分位數需要明確的箝制界限，因此僅支援做為補充函式。
lower_bound：代表要納入匯總的最小值之數值常值。
upper_bound：代表要納入匯總的最大值的數值常值。

計算 MIN 和 MAX

雜訊匯總作業不直接支援 MIN 和 MAX 函式，但通常有其他方法可計算這些結果。

如果您有可做為分組鍵的值 (例如事件日期) 的 MIN 或 MAX，可以先依該值分組，然後再計算 MIN/MAX。這會傳回通過匯總門檻的最小值或最大值。

範例：

WITH campaign_date_ranges AS (
  SELECT campaign_id, MIN(event_date) AS min_date, MAX(event_date) AS max_date
  FROM (
    # Aggregation thresholding will be applied here
    SELECT DISTINCT
      campaign_id,
      DATE(query_id.time_usec, @time_zone) AS event_date
    FROM adh.google_ads_impressions
  )
)
SELECT campaign_id, num_impressions, min_date, max_date
FROM (
  # Noise and aggregation thresholding will be applied here
  SELECT campaign_id, COUNT(*) AS num_impressions
  FROM adh.google_ads_impressions
)
JOIN campaign_date_ranges USING(campaign_id)

或者，如果細微值的 MIN 或 MAX 具有已知界限，您可以使用 PERCENTILE_CONT 和明確界限來取得近似結果。

範例：

SELECT
  campaign_id,
  COUNT(*) AS num_impressions,
  ADH.ANON_PERCENTILE_CONT(
    query_id.time_usec, 0,
    contribution_bounds_per_row => (@min_timestamp, @max_timestamp))
    AS min_timestamp,
  ADH.ANON_PERCENTILE_CONT(
    query_id.time_usec, 1,
    contribution_bounds_per_row => (@min_timestamp, @max_timestamp))
    AS max_timestamp
FROM adh.google_ads_impressions

關於整數結果

雖然廣告資料中心會自動為這些匯總函式插入雜訊，但函式簽章不會改變。INT64 的 COUNT 或 SUM 等函式會傳回 INT64，因此結果插入雜訊後，所有小數部分都會四捨五入。相對於結果和雜訊的規模，這種捨去通常可以忽略不計。

如要查看結果中精細的小數部分，請避免撰寫會傳回 INT64 的函式，例如使用 SUM 並將輸出結果轉換為 FLOAT64。

關於負面結果

原則上，即使查詢在語意上不可能出現負數，值很小的雜訊仍可能導致負數。為維持預期行為，所有形式的 COUNT 和 COUNTIF 都會自動箝制為零，因此絕不會產生負值結果。如要讓其他函式 (例如 SUM) 也有這種行為，可以使用 GREATEST(0, SUM(...)) 手動限制結果。

這項變更通常可以忽略不計，但會對整體結果造成些微正向偏差。

公開群組

使用 GROUP BY 子句時，系統會匯總查詢的匿名結果。系統會套用匯總門檻，確保群組中有足夠的使用者人數，以保護個別使用者資料。決定可發布哪些群組的程序稱為「分割區選取」。

在許多情況下，群組可能是公開資訊。舉例來說，如果事先知道分組鍵值，依瀏覽器版本、星期幾或地理區域分組就不會用到使用者資料。在此情況下，可以省略分割區選取作業，因為輸出內容中是否有群組，不會提供任何新的使用者資訊。

廣告資料中心會找出符合公開群組資格的查詢，並不會對這些查詢套用匯總門檻。這表示不會篩除任何輸出資料列。請注意，如果使用者人數不多，雜訊可能會大幅影響計算結果。

如要使用公開群組，查詢必須經過適當的結構化，確保所有分組鍵都事先已知。分組欄必須符合下列條件：

這些資料來自公開資料表 (不含廣告資料中心使用者資料的資料表或 SELECT 子句)。
並套用 SELECT DISTINCT 來強制執行不重複值。
系統會使用 OUTER JOIN 將這些條件加入查詢中，套用至所有個別資料欄。

公開群組查詢範例：

SELECT age_group_id, COUNT(*) FROM adh.google_ads_impressions
RIGHT OUTER JOIN (SELECT DISTINCT age_group_id FROM adh.age_group)
ON demographics.age_group = age_group_id
GROUP BY age_group_id

SELECT age_group_id, COUNT(*) FROM adh.google_ads_impressions
RIGHT OUTER JOIN (SELECT DISTINCT * FROM UNNEST([1, 2, 3]) AS age_group_id)
ON demographics.age_group = age_group_id
GROUP BY age_group_id

在第一個範例中，受保護的 adh.google_ads_impressions table 會與 adh.age_group 資料表聯結，該資料表在 age_group_id 欄中不含使用者資料。相同的公開資料表 age_group_id 資料欄會顯示在 GROUP BY 子句中。

同樣地，在第二個範例中，受保護的 adh.google_ads_impressions 資料表會與公開資料表聯結，而公開資料表會明確提供為 UNNEST([1, 2, 3])。請注意，在這兩個範例中，分組鍵 age_group_id 都是來自公開資料表。

您也可以提供多個分組項目，例如：

SELECT campaign_id, COUNT(*) FROM adh.google_ads_impressions
RIGHT OUTER JOIN (SELECT DISTINCT campaign_id, customer_id FROM adh.google_ads_campaign)
USING (campaign_id, customer_id)
GROUP BY campaign_id, customer_id

SELECT p.campaign_id, p.browser, COUNT(*) FROM adh.google_ads_impressions AS i
RIGHT OUTER JOIN (
 SELECT DISTINCT * FROM UNNEST([1, 2]) AS campaign_id
 CROSS JOIN UNNEST(['Chrome', 'Other']) AS browser
) AS p
 ON i.campaign_id = p.campaign_id AND i.browser = p.browser
GROUP BY campaign_id, browser;

如果查詢是定期執行，公開群組查詢中沒有篩選條件會很有幫助，因為輸出內容一律會針對相同的固定分組鍵值傳回。舉例來說，這項功能特別適合用來建構週期性資訊主頁。

但請注意，如果公開表格提供大量分組鍵值，您可能會取得許多資料量很少或沒有資料的資料列，而這些資料列都會回報為具有高干擾影響。在這種情況下，建議您明確提供較小的索引鍵清單，只包含您感興趣的值。

支援的查詢模式

重要事項：廣告資料中心提供的大部分標準最佳做法，仍適用於插入雜訊的查詢。我們尤其建議您查看有關重複查詢相同資料的指南。

本節說明使用雜訊插入功能執行查詢時支援的查詢模式。

使用者層級匯總

不受限使用者層級匯總受到的支援，與差異檢查模式下受到的支援相同。匯總在合併多位使用者的資料時，才會插入雜訊。明確按 user_id 分組的匯總作業 (亦即按 user_id 區分的分析函式) 不會收到任何雜訊，且可以使用任何函式。未明確按 user_id 分組的使用者層級匯總作業 (例如 GROUP BY impression_id)，則會視為跨使用者進行匯總，因此會加入雜訊。

按 external_cookie 分組還不夠。雖然 external_cookie 可用於彙整 *_match 資料表和客戶擁有的資料表，但任何單一使用者匯總作業都應明確按 user_id 欄分組，而不僅僅是按 external_cookie 欄分組。

匯總函式範例：

WITH user_paths AS (
  # Grouping by user_id, no noise needed, all functions allowed
  SELECT user_id, STRING_AGG(campaign_id, ">" ORDER BY query_id.time_usec) AS path
  FROM adh.google_ads_impressions
  GROUP BY 1
)
# Noise applied here to num_users
SELECT path, COUNT(*) AS num_users
FROM user_paths
GROUP BY 1;

分析函式範例：

WITH events AS (
  # Partitioning by user_id, no noise needed, all functions allowed
  SELECT
    campaign_id,
    ROW_NUMBER() OVER(PARTITION BY user_id ORDER BY query_id.time_usec) AS index
  FROM adh.google_ads_impressions
)
# Noise applied here to first_impressions
SELECT campaign_id, COUNT(*) AS first_impressions
FROM events
WHERE index = 1
GROUP BY 1;

平行匯總

每項跨使用者匯總作業各自會套用雜訊。一個陳述式可以進行多項此類匯總，並使用 JOIN 或 UNION 將結果併入一份資料表。

範例：

WITH result_1 AS (
  # Noise applied here to num_impressions
  SELECT campaign_id, COUNT(*) AS num_impressions
  FROM adh.google_ads_impressions
  GROUP BY 1
), result_2 AS (
  # Noise applied here to num_clicks
  SELECT campaign_id, COUNT(*) AS num_clicks
  FROM adh.google_ads_creative_conversions
  GROUP BY 1
)
SELECT * FROM result_1 JOIN result_2 USING(campaign_id)

請注意，雖然可以這樣做，但在差異檢查模式下建議避免。這種做法在雜訊方面不構成問題，因為每項平行匯總作業會各自套用雜訊並進行篩選。

經過匯總的資料與未經匯總的資料彙整

廣告資料中心僅支援按 user_id 劃分的分析區間，因此常見的處理方法是先個別匯總這些結果並自行進行彙整，然後再匯總一次。這類查詢可在雜訊模式下進行，且隱私權規定的問題已先解決，因此成效通常也會比在差異檢查模式下進行時更好。

範例：

WITH campaign_totals AS (
  # Noise applied here to campaign_imps
  SELECT campaign_id, COUNT(*) AS campaign_imps
  FROM adh.google_ads_impressions
  GROUP BY 1
)
# Noise applied here to imps
SELECT campaign_id, demographics, campaign_imps, COUNT(*) AS imps
FROM adh.google_ads_impressions JOIN campaign_totals USING(campaign_id)
GROUP BY 1,2,3

雜訊模式不建議對匯總結果進行重新匯總，例如 AVG(campaign_imps)。

不支援的查詢模式

本節說明使用雜訊插入功能執行查詢時不支援的查詢模式。

包含今日在內的查詢

雜訊模式查詢不支援查詢當日資料 (不建議在差異檢查模式中採取這種做法)。如果查詢時使用雜訊插入功能，就無法選取當日。

重複結果

在雜訊模式下，廣告資料中心會限制可重複進行同一項匯總的頻率。如果達到這些限制，雜訊模式查詢會失去查詢資料集中常用日期的權限。以下是發生這種情形的其中幾個原因。

查詢重複是指以相同或類似參數多次執行相同查詢，例如日期範圍重疊。如要避免這個問題發生，您可以使用已匯出至 BigQuery 專案的資料。

請注意，如果兩項工作查詢的日期範圍重疊，那麼在對相同使用者進行相同的運算時，可能就會造成重複。舉例來說，如果對重疊的日期範圍執行下列查詢，由於是以日期做為劃分依據，因此會造成重複：

SELECT DATE(TIMESTAMP_MICROS(event.event_time)) AS date,
COUNT(*) AS cnt
FROM adh.cm_dt_clicks
GROUP BY 1

在這種情況下，建議您對沒有交集的日期範圍執行查詢。

在另一種造成重複的情況中，資料不受日期的影響。對重疊的日期執行下列查詢時，會造成重複，因為兩項工作都涵蓋廣告活動的整個生命週期：

SELECT campaign_id, COUNT(*) AS cnt
FROM adh.google_ads_impressions
GROUP BY 1

在這種情況下，建議您只執行一次這項查詢，因為結果不變。

匯總重複是指一項查詢多次進行相同的匯總：

SELECT COUNT(*) AS cnt1, COUNT(*) AS cnt2
FROM table

在這種情況下，建議您移除其中一項重複的匯總作業。

請注意，即使匯總作業在語法上不同，但只要計算的是同一個值，同樣也可能會視為重複。換句話說，如果值為 key 的所有使用者的 condition1 和 condition2 值都相同，下列查詢可能會造成重複：

SELECT key, COUNTIF(condition1) AS cnt1, COUNTIF(condition2) AS cnt2
FROM table
GROUP BY key

如果您為某幾組使用者設定的條件非常類似，不妨將查詢改寫為只有一個 COUNT。

資料列重複是指廣告資料中心資料表與 BigQuery 資料表彙整，使得前者的每個資料列都與後者的多個資料列一致。舉例來說，如果 bq_table 中有多個資料列的廣告活動 ID 都相同，下列查詢就會造成重複：

SELECT r.campaign_id, COUNT(*) AS cnt
FROM adh_table
INNER JOIN bq_table ON l.campaign_id = r.campaign_id

在這種情況下，建議您調整查詢的結構，讓 bq_table 的每個彙整鍵值 (這裡是指 campaign_id) 只有一列。

請注意，如果解除廣告資料中心資料表中陣列的巢狀結構，而大多數使用者具有相同的值陣列，可能也會產生相同的影響。

SELECT in_market_id, COUNT(*)
FROM adh.dv360_youtube_impressions,
UNNEST(in_market) AS in_market_id
GROUP BY 1

如要進一步瞭解其他查詢最佳做法，請參閱本文。

關於回溯期

有些查詢模式會產生一段時間的報表，並定期重新產生報表，納入新結果。這些查詢可能需要調整，才能在雜訊模式下運作，因為如果重新計算先前的結果，系統會封鎖查詢。每個工作都只應產生新結果，然後將新結果與先前工作的結果合併，產生完整報表。

舉例來說，如果您要建立每日更新的按日期指標報表：

SELECT
  campaign_id,
  DATE(TIMESTAMP_MICROS(query_id.time_usec), @time_zone) AS event_date,
  COUNT(*) AS impressions
FROM adh.google_ads_impressions
GROUP BY 1,2

請勿使用較大的日期範圍執行這項作業，因為這樣會重新計算前幾天的結果。您應該只在有新資料的最新一天執行每項工作，然後與先前工作中的結果合併。

如果需要重新整理先前的結果 (例如，考量到延遲抵達的資料)，請避免重新計算單一結果超過 1 或 2 次。否則，重複嘗試查詢可能會導致錯誤。

直接重新匯總

查詢中的第一層跨使用者匯總作業會套用雜訊。有多層匯總作業的查詢會合併套用雜訊的結果，因此最終的匯總作業可能包含更多雜訊。這些查詢在驗證時會收到警告：

WITH layer_1 AS (
  # Noise applied here to partial_result
  SELECT campaign_id, demographics, location, COUNT(*) AS partial_result
  FROM adh.google_ads_impressions
  GROUP BY 1,2,3
  HAVING partial_result > 5
)
# Reaggregation of partial_result with no user-level data, will be rejected
SELECT campaign_id, SUM(partial_result) AS final_result
FROM layer_1
GROUP BY 1

如果希望雜訊帶來最準確的結果，請計算單次匯總中的所有跨使用者作業。舉例來說，請對事件進行 SUM，而不要對中繼計數進行 SUM。

如果無法避免多層匯總，您可以改為直接從第一層匯出結果，解決警告問題。如果只想在一項工作內執行上述操作，但希望指令碼結果維持不變，請以 OPTIONS(privacy_checked_export=true) 語法建立臨時資料表 (或匯出至 BigQuery 專案的資料表)：例如：

CREATE TEMP TABLE layer_1 OPTIONS(privacy_checked_export=true) AS (
  # Noise applied here to partial_result
  SELECT campaign_id, demographics, location, COUNT(*) AS partial_result
  FROM adh.google_ads_impressions
  GROUP BY 1,2,3
  HAVING partial_result > 5
);
# Reaggregation of privacy checked data, no noise needed
SELECT campaign_id, SUM(partial_result) AS final_result
FROM layer_1
GROUP BY 1

如要進一步瞭解臨時資料表，請參閱本文。

如果第一層匯總作業太過精細，而無法執行隱私權檢查，不妨運用使用者層級匯總改寫查詢：如果不可行，就表示雜訊模式不支援這項查詢。

未經彙整的使用者 ID

在雜訊模式下執行查詢時，不得將個別使用者的資料併入一個資料列，除非是執行套用雜訊的匯總。因此，如要明確對 user_id 資料欄進行彙整，就必須先彙整未經匯總的廣告資料中心資料。

這項查詢並未明確對 user_id 資料欄進行彙整，造成驗證警告：

SELECT …
FROM adh.google_ads_impressions
JOIN adh.google_ads_creative_conversions USING(impression_id)

這類聯結可能無法如預期運作，因為只有具有相同 user_id 值的資料列才會相符。如要修正這項錯誤，您可以調整 USING 子句來明確包含 user_id，例如 USING(impression_id, user_id)。

請注意，這項限制僅適用於彙整廣告資料中心資料表 (維度資料表除外)，不適用於客戶擁有的資料表。舉例來說，我們允許：

SELECT …
FROM adh.google_ads_impressions
JOIN bigquery_project.dataset.table USING(any_column)

正確彙整廣告資料中心與 BigQuery

如果與客戶擁有的資料進行外部彙整，可能會導致資料列缺少使用者 ID，使得雜訊無法正常運作。

這兩項查詢都允許廣告資料中心端有缺少使用者 ID 的不一致資料列，因此會產生驗證警告：

SELECT …
FROM adh.google_ads_impressions
RIGHT JOIN bigquery_project.dataset.table USING(column)

SELECT …
FROM bigquery_project.dataset.table
LEFT JOIN adh.google_ads_impressions USING(column)

請注意，如果將資料表的順序反轉過來，就能進行任一彙整。直接在 device_id_md5 上聯結的 RDID 資料表也適用這項例外狀況。舉例來說，下列查詢可正常運作，不會出現警告：

SELECT …
FROM bigquery_project.dataset.table
LEFT JOIN adh.google_ads_impressions_rdid USING(device_id_md5)

篩除資料列摘要

雜訊模式不支援篩除資料列摘要規格。如果已經套用雜訊，這項功能通常最沒有使用的必要，因為篩選率較低，而且差異檢查不會進行篩選。

如果您在套用雜訊的結果中發現大量資料經過篩選，請增加匯總資料。您可以對整個資料集進行平行匯總，來比較總計的預估值，例如：

SELECT campaign_name, COUNT(*)
FROM data
GROUP BY 1
UNION ALL
SELECT 'Total', COUNT(*)
FROM data
GROUP BY 1

請注意，總數會獨立套用雜訊，而總值可能不會累加，但總數通常比套用雜訊的資料列總和更準確。

跨模式建立的資料表

廣告資料中心內未匯出的資料表，只能搭配建立時採用的隱私權模式使用。您無法在一般的匯總模式下，建立資料表並用於雜訊模式，反之亦然 (除非先將該資料表匯出至 BigQuery)。