Quy trình kiểm tra quyền riêng tư trong Trung tâm dữ liệu quảng cáo

Quyền riêng tư của người dùng cuối là yếu tố cốt lõi trong mọi hoạt động của Ads Data Hub; đó là nền tảng mà nền tảng của chúng tôi được xây dựng. Để giúp duy trì quyền riêng tư đó và giúp khách hàng tuân thủ quy định, chúng tôi áp dụng một số biện pháp kiểm tra và hạn chế nhất định, nhằm ngăn chặn việc truyền dữ liệu về từng người dùng1 trong dữ liệu mà bạn nhận được từ nền tảng.

Dưới đây là thông tin tổng quan về các tính năng bảo vệ quyền riêng tư của Ads Data Hub, kèm theo thông tin chi tiết hơn trong các phần sau:

  • Kiểm tra tĩnh kiểm tra các câu lệnh trong truy vấn để tìm các vấn đề về quyền riêng tư rõ ràng và cấp thiết.
  • Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định.
  • Tính năng kiểm tra tổng hợp đảm bảo rằng mỗi hàng chứa đủ số lượng người dùng để bảo vệ quyền riêng tư của người dùng cuối.
  • Tính năng kiểm tra sự khác biệt (hoặc "kiểm tra sự khác biệt") so sánh các tập hợp kết quả để giúp bạn không thu thập thông tin về từng người dùng bằng cách so sánh dữ liệu từ nhiều tập hợp người dùng.
  • Chèn nhiễu là một giải pháp thay thế cho việc kiểm tra chênh lệch. Chế độ nhiễu chỉ có trong phiên bản Ads Data Hub dành cho nhà tiếp thị. Để tìm hiểu về tính năng chèn nhiễu, hãy xem trang này trên trang web Ads Data Hub dành cho nhà tiếp thị.

Khi một kết quả không vượt qua quy trình kiểm tra quyền riêng tư, Ads Data Hub sẽ hiển thị hoặc trả về thông báo về quyền riêng tư để thông báo cho bạn rằng một hàng đã bị lọc. Đây có thể là bất kỳ giá trị nào từ một hàng đến toàn bộ tập hợp kết quả. Để đảm bảo tổng số liệu báo cáo của bạn luôn chính xác, hãy sử dụng bản tóm tắt hàng đã lọc để tính dữ liệu từ các hàng đã xoá2.

Kiểm tra tĩnh

Quy trình kiểm tra tĩnh sẽ kiểm tra các câu lệnh trong truy vấn của bạn để tìm các vấn đề về quyền riêng tư rõ ràng và cấp thiết, chẳng hạn như xuất giá trị nhận dạng người dùng, bất kỳ hàm nào của giá trị nhận dạng người dùng hoặc sử dụng các hàm không được phép trên các trường chứa dữ liệu cấp người dùng. Để tránh lỗi truy vấn từ các bước kiểm tra tĩnh, hãy xem lại các phương pháp hay nhất và tìm hiểu những hàm nào được phép.

Hạn mức truy cập dữ liệu

Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định. Người dùng sắp hết ngân sách sẽ nhận được thông báo tin nhắn về quyền riêng tư có loại DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED. Bạn có thể theo dõi hạn mức bằng cách sử dụng điểm truy cập hạn mức truy cập dữ liệu hoặc bằng cách quan sát thông báo về hạn mức trong giao diện người dùng.

Yêu cầu về dữ liệu tổng hợp

Cốt lõi của các quy trình kiểm tra quyền riêng tư của Ads Data Hub là ngưỡng tổng hợp người dùng. Đối với hầu hết các truy vấn, bạn chỉ có thể nhận dữ liệu báo cáo về 50 người dùng trở lên. Tuy nhiên, bạn có thể sử dụng các cụm từ tìm kiếm chỉ truy cập vào lượt nhấp và lượt chuyển đổi để báo cáo về 10 người dùng trở lên.

  • Các sự kiện có mã nhận dạng người dùng bằng 0 được tính là một người dùng đối với ngưỡng tổng hợp, bất kể có bao nhiêu người dùng thực tế đã tạo sự kiện.
  • Những người dùng có mã nhận dạng rỗng sẽ không được tính vào ngưỡng tổng hợp.

Phương pháp hay nhất: Định cấu hình tóm tắt hàng đã lọc để báo cáo về dữ liệu đã bị bỏ qua. Điều này giúp duy trì đường cơ sở nhất quán trong báo cáo.

Trong ví dụ sau, hàng chứa chiến dịch 125 sẽ bị lọc ra khỏi kết quả cuối cùng vì hàng này tổng hợp kết quả của 48 người dùng, thấp hơn số người dùng tối thiểu là 50.

Mã chiến dịch Người dùng Số lượt hiển thị
123 314 928
124 2718 5772
125 48 353

Kiểm tra sự khác biệt

Tính năng kiểm tra sự khác biệt giúp đảm bảo rằng người dùng không thể được xác định thông qua việc so sánh nhiều kết quả được tổng hợp đầy đủ theo các cách sau:

  • Các chỉ số này so sánh kết quả của công việc bạn đang chạy với kết quả trước đó.
  • Hàm này so sánh các hàng trong cùng một tập hợp kết quả.

Các lỗi vi phạm quy trình kiểm tra sự khác biệt có thể được kích hoạt do các thay đổi đối với dữ liệu cơ bản giữa hai công việc. Khi so sánh kết quả của một công việc với kết quả trước đó, Ads Data Hub sẽ tìm kiếm lỗ hổng ở cấp người dùng cá nhân. Do đó, ngay cả kết quả của các chiến dịch khác nhau hoặc kết quả báo cáo cùng một số người dùng, cũng có thể được lọc nếu có một số lượng lớn người dùng trùng lặp.

Mặt khác, hai tập hợp kết quả tổng hợp có thể có cùng số người dùng (xem giống hệt nhau) nhưng không chia sẻ người dùng riêng lẻ, do đó đảm bảo quyền riêng tư. Trong trường hợp này, các tập hợp kết quả này sẽ không bị lọc.

Trung tâm dữ liệu quảng cáo sử dụng dữ liệu từ các kết quả trước đây của bạn khi xem xét mức độ dễ bị tấn công của một kết quả mới. Điều này có nghĩa là việc chạy cùng một truy vấn nhiều lần sẽ tạo ra nhiều dữ liệu hơn để sử dụng khi kiểm tra sự khác biệt khi xem xét lỗ hổng của kết quả mới. Ngoài ra, dữ liệu cơ bản có thể thay đổi, dẫn đến các lỗi vi phạm quy trình kiểm tra quyền riêng tư đối với các truy vấn được cho là ổn định.

Khi kết quả ở cấp công việc khác nhau đáng kể, nhưng một hàng riêng lẻ lại tương tự như một hàng trong công việc trước đó, thì Trung tâm dữ liệu quảng cáo sẽ lọc ra hàng tương tự. Trong ví dụ này, hàng chứa chiến dịch 123 trong kết quả của công việc thứ hai sẽ được lọc, vì hàng này khác với kết quả trước đó của một người dùng.

Công việc 1
Mã chiến dịch Người dùng
123 400
124 569
Công việc 2
Mã chiến dịch Người dùng
123 401
224 1325

Nếu tổng số người dùng trong tất cả các hàng của một tập hợp kết quả tương tự như tổng số người dùng trong một công việc trước đó, thì Trung tâm dữ liệu quảng cáo sẽ lọc toàn bộ tập hợp kết quả. Trong ví dụ này, tất cả kết quả từ công việc thứ hai sẽ được lọc.

Công việc 1
Mã chiến dịch Người dùng
123 400
124 1367
Công việc 2
Mã chiến dịch Người dùng
123 402
124 1367

Nội dung tóm tắt về hàng đã lọc

Tóm tắt hàng đã lọc tính tổng dữ liệu đã được lọc do các quy trình kiểm tra quyền riêng tư. Dữ liệu từ các hàng đã lọc được tổng hợp và thêm vào một hàng tổng hợp. Mặc dù không thể phân tích thêm dữ liệu đã lọc, nhưng dữ liệu này cung cấp thông tin tóm tắt về lượng dữ liệu đã được lọc ra khỏi kết quả.

Lọc nội dung phản cảm để bảo vệ quyền riêng tư

Trong trường hợp cần chia nhỏ truy vấn nhưng muốn kết hợp các kết quả tổng hợp, bạn có thể áp dụng rõ ràng các bước kiểm tra quyền riêng tư cho một số truy vấn nhỏ hơn, sau đó tổng hợp các kết quả đó với nhau theo cách an toàn về quyền riêng tư.

Ví dụ về trường hợp sử dụng:

  • Bạn là một nhà quảng cáo đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết, bao gồm cả dữ liệu ở Khu vực kinh tế Châu Âu (EEA).
  • Bạn là một đối tác đo lường đang tìm kiếm tất cả lượt chuyển đổi theo loại sự kiện phân bổ trong tài khoản Google Ads được liên kết.

Để biết tổng số lượt chuyển đổi cho tài khoản Google Ads, bạn có thể viết lại truy vấn bằng mệnh đề OPTIONS(privacy_checked_export=TRUE) để áp dụng các bước kiểm tra quyền riêng tư cho từng dịch vụ của Google.

Ví dụ viết lại trong phần này thực hiện những việc sau:

  1. Công cụ này truy vấn từng dịch vụ của Google riêng lẻ, áp dụng rõ ràng các bước kiểm tra quyền riêng tư cho từng tập hợp kết quả trung gian.
  2. Công cụ này sẽ tạo một bảng tạm riêng cho kết quả đã kiểm tra quyền riêng tư của từng dịch vụ của Google: YouTube, Gmail và Mạng.
  3. Hàm này tổng hợp và tính tổng số lượt chuyển đổi đã kiểm tra quyền riêng tư từ các bảng tạm thời.
CREATE TEMP TABLE youtube_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_youtube
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE network_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_network
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

CREATE TEMP TABLE gmail_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
 impression_data.campaign_id,
 attribution_event_type,
 COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_gmail
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
 AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;

SELECT
 campaign_id,
 attribution_event_type,
 SUM(num_convs) AS num_convs
FROM (
 SELECT * FROM youtube_agg
 UNION ALL
 SELECT * FROM network_agg
 UNION ALL
 SELECT * FROM gmail_agg
)
GROUP BY campaign_id, attribution_event_type

Xin lưu ý rằng truy vấn này không sử dụng JOIN để kết hợp trực tiếp dữ liệu giữa các bảng, mà trước tiên sẽ thực hiện truy vấn cho từng bảng, áp dụng các bước kiểm tra quyền riêng tư cho từng bảng trung gian, sau đó sử dụng UNION để tổng hợp các giá trị đã kiểm tra quyền riêng tư.

Cố vấn truy vấn

Nếu SQL của bạn hợp lệ nhưng có thể kích hoạt quá trình lọc, thì trình tư vấn truy vấn sẽ hiển thị lời khuyên hữu ích trong quá trình phát triển truy vấn để giúp bạn tránh kết quả không mong muốn.

Trình kích hoạt bao gồm các mẫu sau:

Cách sử dụng trình tư vấn truy vấn:

  • Giao diện người dùng. Các đề xuất sẽ xuất hiện trong trình chỉnh sửa truy vấn, phía trên văn bản truy vấn.
  • API. Sử dụng phương thức customers.analysisQueries.validate.

  1. Ngoài dữ liệu mà họ đã đồng ý chia sẻ, chẳng hạn như trong trường hợp của các thành viên trong hội đồng. 

  2. Trừ khi bị các quy định hạn chế về quyền riêng tư ngăn cản, chẳng hạn như khi người dùng trong thông tin tóm tắt về hàng đã lọc không đáp ứng các yêu cầu về tổng hợp.