Tìm hiểu về nhiễu trong báo cáo tóm tắt

Tìm hiểu ý nghĩa của nhiễu, vị trí thêm nhiễu và mức độ ảnh hưởng của nhiễu đến hoạt động đo lường.

Báo cáo tóm tắt là kết quả của quá trình tổng hợp báo cáo tổng hợp. Khi trình thu thập báo cáo tổng hợp theo lô và dịch vụ tổng hợp xử lý, nhiễu (một lượng dữ liệu ngẫu nhiên) sẽ được thêm vào báo cáo tóm tắt thu được. Chúng tôi thêm âm thanh để bảo vệ quyền riêng tư của người dùng. Mục tiêu của cơ chế này là tạo ra một khung có thể hỗ trợ hoạt động đo lường sự riêng tư biệt lập.

Độ nhiễu được thêm vào báo cáo tóm tắt cuối cùng.

Giới thiệu về tiếng ồn trong báo cáo tóm tắt

Mặc dù việc thêm nhiễu thường không phải là một phần của hoạt động đo lường quảng cáo hiện nay, nhưng trong nhiều trường hợp, nhiễu được thêm vào sẽ không làm thay đổi đáng kể cách bạn diễn giải kết quả.

Bạn có thể suy nghĩ về vấn đề này theo cách sau: Bạn có tự tin đưa ra quyết định dựa trên một phần dữ liệu nhất định nếu dữ liệu đó không bị nhiễu không?

Ví dụ: Nhà quảng cáo có thể tự tin thay đổi chiến lược hoặc ngân sách của chiến dịch dựa trên thực tế là Chiến dịch A có 15 lượt chuyển đổi và Chiến dịch B có 16 lượt chuyển đổi không?

Nếu câu trả lời là không, thì tiếng ồn không liên quan.

Bạn nên định cấu hình cách sử dụng API sao cho:

  1. Câu trả lời cho câu hỏi trên là có.
  2. Độ nhiễu được quản lý theo cách không ảnh hưởng đáng kể đến khả năng đưa ra quyết định dựa trên một số dữ liệu nhất định. Bạn có thể giải quyết vấn đề này như sau: đối với số lượt chuyển đổi tối thiểu dự kiến, bạn muốn giữ cho độ nhiễu trong chỉ số được thu thập thấp hơn một tỷ lệ phần trăm nhất định.

Trong phần này và các phần sau, chúng tôi sẽ trình bày các chiến lược để đạt được mục tiêu 2.

Các khái niệm cốt lõi

Dịch vụ tổng hợp thêm nhiễu một lần vào mỗi giá trị tóm tắt (tức là một lần cho mỗi khoá) mỗi khi có yêu cầu báo cáo tóm tắt.

Các giá trị nhiễu này được lấy ngẫu nhiên từ một phân phối xác suất cụ thể, được thảo luận bên dưới.

Tất cả các yếu tố ảnh hưởng đến độ nhiễu đều dựa trên hai khái niệm chính.

  1. Phân phối nhiễu (chi tiết bên dưới) giống nhau bất kể giá trị tóm tắt là thấp hay cao. Do đó, giá trị tóm tắt càng cao thì càng ít có khả năng bị nhiễu so với giá trị này.

    Ví dụ: giả sử cả tổng giá trị giao dịch mua là 20.000 đô la và tổng giá trị giao dịch mua là 200 đô la đều chịu ảnh hưởng của nhiễu được chọn từ cùng một phân phối.

    Giả sử độ nhiễu từ quá trình phân phối này thay đổi trong khoảng từ -100 đến +100.

    • Đối với giá trị mua hàng tóm tắt là 20.000 đô la Mỹ, độ nhiễu dao động từ 0 đến 100/20.000=0,5%.
    • Đối với giá trị mua hàng tóm tắt là 200 đô la, độ nhiễu dao động từ 0 đến 100/200=50%.

    Do đó, độ nhiễu có thể tác động ít hơn đến giá trị giao dịch mua gộp là 20.000 đô la so với giá trị là 200 đô la. Tương đối mà nói, $20.000 có thể ít nhiễu hơn, tức là có thể có tỷ lệ tín hiệu trên tạp âm cao hơn.

    Các giá trị tổng hợp cao hơn có tác động tương đối thấp hơn đối với độ nhiễu.

    Điều này có một vài tác động thực tế quan trọng được nêu trong phần tiếp theo. Cơ chế này là một phần của thiết kế API và có tác động thực tế lâu dài. Các cookie này sẽ tiếp tục đóng vai trò quan trọng khi các công nghệ quảng cáo thiết kế và đánh giá nhiều chiến lược tổng hợp.

  2. Mặc dù nhiễu được lấy từ cùng một phân phối bất kể giá trị tóm tắt, nhưng phân phối đó phụ thuộc vào một số thông số. Một trong những thông số này, epsilon, có thể được các công nghệ quảng cáo thay đổi trong quá trình thử nghiệm theo nguyên gốc đã kết thúc để đánh giá nhiều mức điều chỉnh về quyền riêng tư/tiện ích. Tuy nhiên, hãy cân nhắc việc điều chỉnh epsilon tạm thời. Chúng tôi rất mong nhận được ý kiến phản hồi của bạn về các trường hợp sử dụng và giá trị epsilon hoạt động hiệu quả.

Mặc dù không kiểm soát trực tiếp cách thức tạo ra nhiễu, nhưng công ty công nghệ quảng cáo có thể tác động đến mức độ ảnh hưởng của nhiễu đối với dữ liệu đo lường. Trong các phần tiếp theo, chúng ta sẽ tìm hiểu sâu về cách tiếng ồn có thể ảnh hưởng trong thực tế.

Trước khi làm như vậy, hãy cùng tìm hiểu kỹ hơn về cách áp dụng nhiễu.

Phóng to: cách áp dụng tiếng ồn

Một phân phối tiếng ồn

Độ nhiễu được lấy từ phân phối Laplace, với các tham số sau:

  • Trung bình (μ) bằng 0. Điều này có nghĩa là giá trị nhiễu có nhiều khả năng nhất là 0 (không thêm nhiễu) và giá trị nhiễu có thể nhỏ hơn hoặc lớn hơn giá trị ban đầu (đôi khi được gọi là không thiên vị).
  • Thông số tỷ lệ củab = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET được xác định trong trình duyệt.
    • epsilon được dùng trong Dịch vụ tổng hợp.

Sơ đồ sau đây cho thấy hàm mật độ xác suất của một phân phối Laplace với μ=0, b = 20:

Hàm mật độ xác suất cho một phân phối Laplace với μ=0, b = 20

Giá trị nhiễu ngẫu nhiên, một phân phối nhiễu

Giả sử một công nghệ quảng cáo yêu cầu báo cáo tóm tắt cho hai khoá tổng hợp là khoá1 và khoá2.

Dịch vụ tổng hợp chọn hai giá trị nhiễu x1 và x2, tuân theo cùng một phân phối nhiễu. x1 được thêm vào giá trị tóm tắt cho khoá1 và x2 được thêm vào giá trị tóm tắt cho khoá2.

Trong các sơ đồ, chúng ta sẽ biểu thị các giá trị nhiễu giống nhau. Đây là cách đơn giản hoá; trong thực tế, các giá trị nhiễu sẽ khác nhau vì chúng được lấy ngẫu nhiên từ quá trình phân phối.

Điều này minh hoạ rằng các giá trị nhiễu đều đến từ cùng một phân phối và độc lập với giá trị tóm tắt mà chúng được áp dụng.

Các thuộc tính khác của tiếng ồn

Độ nhiễu được áp dụng cho mọi giá trị tóm tắt, bao gồm cả giá trị trống (0).

Ngay cả các giá trị tóm tắt trống cũng có thể bị nhiễu.

Ví dụ: ngay cả khi giá trị tóm tắt thực sự cho một khoá nhất định là 0, thì giá trị tóm tắt bị nhiễu mà bạn sẽ thấy trong báo cáo tóm tắt cho khoá này (rất có thể) sẽ không phải là 0.

Độ nhiễu có thể là số dương hoặc số âm.

Ví dụ về nhiễu dương và âm.

Ví dụ: đối với số tiền mua trước khi có nhiễu là 327.000, nhiễu có thể là +6.000 hoặc -6.000 (đây là các giá trị ví dụ tuỳ ý).

Đánh giá tiếng ồn

Tính toán độ lệch chuẩn của nhiễu

Độ lệch chuẩn của nhiễu là:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Ví dụ:

Với epsilon = 10, độ lệch chuẩn của nhiễu là:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Đánh giá thời điểm sự khác biệt về kết quả đo lường là đáng kể

Vì bạn sẽ biết độ lệch chuẩn của nhiễu được thêm vào mỗi giá trị đầu ra do dịch vụ tổng hợp cung cấp, nên bạn có thể xác định ngưỡng thích hợp để so sánh nhằm xác định xem sự khác biệt được quan sát có thể là do nhiễu hay không.

Ví dụ: nếu độ nhiễu được thêm vào một giá trị là khoảng +/- 10 (có tính đến việc điều chỉnh theo tỷ lệ) và chênh lệch về giá trị giữa hai chiến dịch là hơn 100, thì có thể kết luận rằng chênh lệch về giá trị được đo lường giữa mỗi chiến dịch không chỉ do độ nhiễu.

Thu hút và chia sẻ ý kiến phản hồi

Bạn có thể tham gia và thử nghiệm với API này.

Các bước tiếp theo