Kiểm tra quyền riêng tư trong Ads Data Hub

Quyền riêng tư của người dùng cuối là trọng tâm trong mọi hoạt động mà Ads Data Hub làm; đó là nền tảng để xây dựng nền tảng của chúng tôi. Để giúp duy trì quyền riêng tư đó và giúp khách hàng của chúng tôi tuân thủ quy định, chúng tôi áp dụng một số quy trình kiểm tra và hạn chế nhằm giúp ngăn chặn hành vi truyền dữ liệu về người dùng cá nhân1 trong dữ liệu mà bạn đưa ra khỏi nền tảng.

Dưới đây là thông tin tổng quan về các tính năng về quyền riêng tư của Ads Data Hub, kèm theo thông tin chi tiết trong các phần sau:

  • Kiểm tra tĩnh kiểm tra các câu lệnh trong truy vấn của bạn để tìm các mối lo ngại rõ ràng và tức thì về quyền riêng tư.
  • Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định.
  • Quy trình kiểm tra tổng hợp giúp đảm bảo rằng mỗi hàng chứa một số lượng lớn người dùng để bảo vệ quyền riêng tư của người dùng cuối.
  • Công cụ kiểm tra sự khác biệt (hay "kiểm tra sự khác biệt") so sánh các nhóm kết quả để giúp bạn không thu thập được thông tin về từng người dùng bằng cách so sánh dữ liệu của nhiều nhóm người dùng.
  • Chèn tiếng ồn là một giải pháp thay thế cho quy trình kiểm tra sự khác biệt. Việc thêm độ nhiễu ngẫu nhiên vào mệnh đề SELECT tổng hợp của một truy vấn sẽ giúp bảo vệ quyền riêng tư của người dùng, đồng thời cung cấp kết quả chính xác hợp lý, giúp bạn không cần kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho kết quả đầu ra.

Khi kết quả không vượt qua bước kiểm tra để đảm bảo quyền riêng tư, Ads Data Hub sẽ hiển thị hoặc trả về thông báo về quyền riêng tư cho bạn biết rằng một hàng đã được lọc. Đây có thể là bất kỳ giá trị nào từ một hàng cho đến toàn bộ tập hợp kết quả. Để đảm bảo tổng số báo cáo vẫn chính xác, hãy sử dụng thông tin tóm tắt về hàng đã lọc để tính dữ liệu từ các hàng bị bỏ ngang2.

Kiểm tra tĩnh

Quy trình kiểm tra tĩnh kiểm tra các câu lệnh trong truy vấn của bạn để tìm các mối lo ngại rõ ràng và tức thì về quyền riêng tư, chẳng hạn như xuất giá trị nhận dạng người dùng, bất kỳ chức năng nào của giá trị nhận dạng người dùng hoặc sử dụng các hàm không được phép trên các trường chứa dữ liệu cấp người dùng. Để tránh lỗi truy vấn trong quy trình kiểm tra tĩnh, hãy xem lại các phương pháp hay nhất và tìm hiểu những hàm được cho phép.

Hạn mức truy cập dữ liệu

Ngân sách truy cập dữ liệu giới hạn tổng số lần bạn có thể truy cập vào một phần dữ liệu nhất định. Người dùng sắp hết ngân sách sẽ nhận được thông báo bằng thông báo về quyền riêng tư thuộc loại DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED. Bạn có thể theo dõi ngân sách bằng cách sử dụng điểm truy cập ngân sách truy cập dữ liệu hoặc bằng cách theo dõi thông báo về ngân sách trong giao diện người dùng.

Yêu cầu về tổng hợp

Trọng tâm trong các hoạt động kiểm tra quyền riêng tư của Ads Data Hub là ngưỡng tổng hợp người dùng. Đối với hầu hết các truy vấn, bạn chỉ có thể nhận dữ liệu báo cáo cho 50 người dùng trở lên. Tuy nhiên, bạn có thể sử dụng các truy vấn chỉ truy cập vào các lượt nhấp và lượt chuyển đổi để báo cáo về 10 người dùng trở lên.

Phương pháp hay nhất: Định cấu hình bản tóm tắt hàng được lọc để báo cáo về dữ liệu bị bỏ qua. Điều này giúp bạn duy trì đường cơ sở nhất quán trong các báo cáo.

Trong ví dụ sau, hàng chứa chiến dịch 125 sẽ được lọc từ kết quả cuối cùng, vì hàng này tổng hợp kết quả từ 48 người dùng, thấp hơn mức tối thiểu là 50 người dùng.

Mã chiến dịch Số người dùng Số lượt hiển thị
123 314 928
124 2718 5772
125 48 353

Chế độ riêng tư

Ads Data Hub cung cấp 2 chế độ bảo mật – kiểm tra khác biệtchèn tiếng ồn. Các phần sau đây mô tả và so sánh các chế độ này.

Sử dụng quy trình kiểm tra sự khác biệt

Quy trình kiểm tra sự khác biệt giúp đảm bảo không xác định được người dùng thông qua việc so sánh nhiều kết quả tổng hợp đầy đủ theo những cách sau:

  • Chúng so sánh kết quả từ công việc mà bạn đang thực hiện với kết quả trước đó.
  • Công cụ này so sánh các hàng trong cùng một nhóm kết quả.

Lỗi vi phạm kiểm tra sự khác biệt có thể được kích hoạt do những thay đổi đối với dữ liệu cơ bản giữa hai công việc. Khi so sánh kết quả của một công việc với kết quả trước đó, Ads Data Hub sẽ tìm các lỗ hổng bảo mật ở cấp độ người dùng cá nhân. Do đó, ngay cả kết quả của các chiến dịch hoặc kết quả báo cáo cùng một số lượng người dùng cũng có thể được lọc nếu chúng có số lượng lớn người dùng trùng lặp.

Mặt khác, hai tập hợp kết quả tổng hợp có thể có cùng số người dùng — trông giống hệt nhau — nhưng không dùng chung người dùng cá nhân, nên sẽ đảm bảo quyền riêng tư. Trong trường hợp đó, chúng sẽ không bị lọc.

Ads Data Hub sử dụng dữ liệu từ kết quả trước đây của bạn khi xem xét lỗ hổng bảo mật của một kết quả mới. Điều này có nghĩa là việc chạy nhiều lần cùng một truy vấn sẽ tạo ra nhiều dữ liệu hơn cho các bước kiểm tra khác biệt khi xem xét lỗ hổng bảo mật của kết quả mới. Ngoài ra, dữ liệu cơ bản có thể thay đổi, dẫn đến lỗi vi phạm quy trình kiểm tra quyền riêng tư đối với những truy vấn được cho là ổn định.

Khi kết quả cấp công việc của bạn khác nhau đầy đủ, nhưng một hàng riêng lẻ tương tự như một hàng trong công việc trước đó, Ads Data Hub sẽ lọc hàng tương tự. Trong ví dụ này, hàng chứa chiến dịch 123 trong kết quả của công việc thứ hai sẽ được lọc, vì hàng đó khác với kết quả trước đó của một người dùng.

Công việc 1
Mã chiến dịch Số người dùng
123 400
124 569
Công việc 2
Mã chiến dịch Số người dùng
123 401
224 1325

Nếu tổng số người dùng trong tất cả các hàng trong tập hợp kết quả tương tự như tổng số người dùng trong công việc trước đó, thì Ads Data Hub sẽ lọc toàn bộ tập hợp kết quả. Trong ví dụ này, tất cả các kết quả từ công việc thứ hai sẽ được lọc.

Công việc 1
Mã chiến dịch Số người dùng
123 400
124 1367
Công việc 2
Mã chiến dịch Số người dùng
123 402
124 1367

Sử dụng tính năng thêm nhiễu

Chèn nhiễu là một kỹ thuật dùng để bảo vệ quyền riêng tư của người dùng khi truy vấn một cơ sở dữ liệu. Công cụ này hoạt động bằng cách thêm độ nhiễu ngẫu nhiên vào mệnh đề SELECT tổng hợp của một truy vấn. Độ nhiễu này giúp bảo vệ quyền riêng tư của người dùng, đồng thời cung cấp kết quả có độ chính xác hợp lý, giúp bạn không cần kiểm tra sự khác biệt và giảm ngưỡng tổng hợp bắt buộc cho dữ liệu đầu ra. Bạn có thể thực thi hầu hết các truy vấn hiện có ở chế độ nhiễu với một số hạn chế. Để tìm hiểu thêm về chế độ nhiễu và cách tính năng chèn tiếng ồn ảnh hưởng đến các yêu cầu về quyền riêng tư, hãy xem nội dung Chèn tiếng ồn.

So sánh các bước kiểm tra sự khác biệt với tính năng chèn tiếng ồn

Dữ liệu thực tế
Mã chiến dịch Số lượt hiển thị
101 35
102 63
201 142
202 21
301 56
302 99
Kết quả sử dụng phương pháp kiểm tra sự khác biệt
Mã chiến dịch Số lượt hiển thị
101 35
102 63
201 142
202 21
301 56
302 99
Kết quả sử dụng tính năng chèn tiếng ồn
Mã chiến dịch Số lượt hiển thị
101 37,8373
102 60,9104
201 182,0955
202 26,2332
301 58,0871
302 97,5018
Ví dụ về Chiến dịch 101 ở chế độ nhiễu
Mã chiến dịch Số lượt hiển thị thực tế Đã thêm tiếng ồn Số lượt hiển thị được trả về (ANON_COUNT)
101 35 2,8373 37,8373

Nội dung tóm tắt về hàng đã lọc

Dữ liệu kiểm đếm tóm tắt hàng đã lọc đã được lọc do kiểm tra quyền riêng tư. Dữ liệu từ các hàng đã lọc được tính tổng và thêm vào một hàng nhận toàn bộ. Mặc dù không thể phân tích thêm dữ liệu đã lọc, nhưng dữ liệu này cung cấp thông tin tóm tắt về lượng dữ liệu đã được lọc khỏi kết quả.

Cố vấn truy vấn

Nếu SQL của bạn hợp lệ nhưng có thể kích hoạt quá trình lọc quá mức, thì trình tư vấn truy vấn sẽ đưa ra lời khuyên hữu ích trong quá trình phát triển truy vấn để giúp bạn tránh các kết quả không mong muốn.

Trình kích hoạt có các mẫu sau đây:

Cách sử dụng cố vấn truy vấn:

  • Giao diện người dùng. Các đề xuất sẽ hiển thị trong trình chỉnh sửa truy vấn, phía trên văn bản truy vấn.
  • API. Sử dụng phương thức customers.analysisQueries.validate.

  1. Ngoài dữ liệu mà họ đã đồng ý chia sẻ, chẳng hạn như trường hợp tham luận viên. 

  2. Trừ phi bị các quy định hạn chế về quyền riêng tư ngăn chặn, chẳng hạn như khi người dùng trong bản tóm tắt hàng được lọc không đáp ứng các yêu cầu tổng hợp.