Tổng quan về Dịch vụ tổng hợp

Triển khai và quản lý dịch vụ này để tạo báo cáo tóm tắt cho API Báo cáo phân bổ hoặc API tổng hợp riêng tư.

Triển khai và quản lý Dịch vụ tổng hợp để xử lý các báo cáo tổng hợp trong API Báo cáo phân bổ hoặc API Tổng hợp riêng tư để tạo báo cáo tóm tắt.

Trạng thái triển khai

Phần giải thích này nêu các thuật ngữ chính, giúp bạn hiểu được Dịch vụ tổng hợp.

Phạm vi cung cấp

建议 状态
Attribution Reporting API 和 Private Aggregation API 为 Amazon Web Services (AWS) 提供的汇总服务支持
说明
可用
Attribution Reporting API 和 Private Aggregation API 为 Google Cloud 提供的汇总服务支持
说明
推出 Beta 版
注册汇总服务网站以及将网站映射到云账号(AWS 或 GCP)
GitHub 上的常见问题解答
可用
汇总服务的 epsilon 值将保持在 64 这一范围内,以便于针对不同参数进行实验和提供反馈。
提交 ARA epsilon 反馈
提交 PAA epsilon 反馈
可用。在 epsilon 范围值更新之前,我们会提前向生态系统发出通知。
针对汇总服务查询更灵活的贡献过滤
说明
预计 2024 年第 2 季度
灾难恢复后的预算恢复流程(错误、配置错误等)
GitHub 问题
预计 2024 年第 2 季度
Accenture 是 AWS 的协调员之一
开发者博客
可用
担任 Google Cloud 协调员之一的独立方
开发者博客
预计 2024 年第 3 季度

Xử lý dữ liệu một cách an toàn

Dịch vụ tổng hợp giải mã và kết hợp dữ liệu đã thu thập từ các báo cáo tổng hợp, thêm độ nhiễu rồi trả về báo cáo tóm tắt cuối cùng. Dịch vụ này chạy trong môi trường thực thi đáng tin cậy (TEE), được triển khai trên một dịch vụ đám mây nhằm hỗ trợ các biện pháp bảo mật cần thiết để bảo vệ dữ liệu này.

Mã của TEE là nơi duy nhất trong Dịch vụ tổng hợp có quyền truy cập vào các báo cáo thô. Mã này sẽ được các nhà nghiên cứu bảo mật, người ủng hộ quyền riêng tư và công nghệ quảng cáo kiểm tra. Để xác nhận rằng TEE đang chạy đúng phần mềm đã được phê duyệt và dữ liệu vẫn được bảo mật, một điều phối viên sẽ tiến hành chứng thực.

Báo cáo tổng hợp được thu thập, phân theo lô và gửi cho TEE để chuyển đổi thành báo cáo tóm tắt cuối cùng.
Báo cáo tổng hợp được thu thập, phân theo lô và gửi đến Dịch vụ tổng hợp, chạy trên TEE. Môi trường Dịch vụ tổng hợp thuộc quyền sở hữu và vận hành của cùng một bên thu thập dữ liệu.

Chứng thực của điều phối viên của TEE

Điều phối viên là một thực thể chịu trách nhiệm quản lý khoá và kế toán báo cáo tổng hợp.

Điều phối viên có một số trách nhiệm:

  • Duy trì danh sách hình ảnh nhị phân được uỷ quyền. Những hình ảnh này là hàm băm mật mã của các bản dựng phần mềm Dịch vụ tổng hợp mà Google sẽ phát hành định kỳ. Quy trình này có thể tái tạo để bất kỳ bên nào cũng có thể xác minh rằng hình ảnh giống hệt với các bản dựng Dịch vụ tổng hợp.
  • Vận hành hệ thống quản lý chính. Chrome cần có các khoá mã hoá trên thiết bị của người dùng để mã hoá báo cáo tổng hợp. Bạn cần có khoá giải mã để chứng minh mã Dịch vụ tổng hợp khớp với các hình ảnh nhị phân.
  • Theo dõi các báo cáo tổng hợp để ngăn việc sử dụng lại trong dữ liệu tổng hợp cho báo cáo tóm tắt, vì việc sử dụng lại có thể làm lộ thông tin nhận dạng cá nhân (PII).

Quy tắc "Không có mục trùng lặp"

Để thu thập thông tin chi tiết về nội dung của một báo cáo tổng hợp cụ thể, kẻ tấn công có thể tạo nhiều bản sao của báo cáo và đưa các bản sao đó vào một hoặc nhiều lô. Do đó, Dịch vụ tổng hợp thực thi quy tắc "không có trùng lặp":

  • Theo lô: Báo cáo tổng hợp chỉ có thể xuất hiện một lần trong một lô.
  • Giữa các lô: Báo cáo tổng hợp không được xuất hiện trong nhiều lô hoặc đóng góp vào nhiều báo cáo tóm tắt.

Để làm việc này, trình duyệt sẽ chỉ định một mã nhận dạng chung cho mỗi báo cáo tổng hợp. Trình duyệt tạo mã nhận dạng chung từ một số điểm dữ liệu, bao gồm: phiên bản API, nguồn gốc báo cáo, trang web đích, thời gian đăng ký nguồn và thời gian báo cáo theo lịch. Dữ liệu này được lấy từ trường shared_info trong báo cáo.

Dịch vụ tổng hợp xác nhận rằng tất cả các báo cáo tổng hợp có cùng mã nhận dạng dùng chung đều nằm trong cùng một lô và các báo cáo cho điều phối viên mà mã nhận dạng dùng chung đã được xử lý. Nếu nhiều lô được tạo bằng cùng một mã nhận dạng, thì chỉ một lô được chấp nhận để tổng hợp và các lô khác sẽ bị từ chối.

Khi bạn chạy gỡ lỗi, quy tắc "không có bản sao" sẽ không được thực thi trên các lô. Nói cách khác, báo cáo từ các lô trước đó có thể xuất hiện trong một lần chạy gỡ lỗi. Tuy nhiên, quy tắc này vẫn được thực thi trong một lô. Nhờ đó, bạn có thể thử nghiệm dịch vụ và nhiều chiến lược tạo lô mà không làm giới hạn quá trình xử lý sau này trong môi trường sản xuất.

Hiện tượng nhiễu và điều chỉnh theo tỷ lệ

Để bảo vệ quyền riêng tư của người dùng, Dịch vụ tổng hợp áp dụng cơ chế bổ sung nhiễu cho dữ liệu thô từ báo cáo tổng hợp. Điều này có nghĩa là một lượng nhiễu thống kê nhất định sẽ được thêm vào từng giá trị tổng hợp trước khi giá trị đó được phát hành trong báo cáo tóm tắt.

Mặc dù không thể trực tiếp kiểm soát cách thêm độ nhiễu, nhưng bạn có thể tác động đến tác động của độ nhiễu đối với dữ liệu đo lường.

Độ nhiễu không đổi, bất kể giá trị tổng hợp là gì.

Giá trị độ nhiễu được vẽ ngẫu nhiên từ phân phối xác suất Laplace và mức phân phối là như nhau bất kể lượng dữ liệu được thu thập trong các báo cáo tổng hợp. Bạn càng thu thập nhiều dữ liệu thì độ nhiễu càng ít ảnh hưởng đến kết quả báo cáo tóm tắt. Bạn có thể nhân dữ liệu báo cáo tổng hợp với một hệ số tỷ lệ để giảm ảnh hưởng của độ nhiễu.

Để tìm hiểu cách tăng độ nhiễu, các chế độ kiểm soát và tác động đến báo cáo của bạn, hãy tham khảo Ngân sách đóng gópTăng lên ngân sách đóng góp trong bài viết Xử lý độ nhiễu.

Tạo báo cáo tóm tắt

Việc tạo báo cáo tóm tắt phụ thuộc vào mức sử dụng API của bạn. Tìm hiểu thêm về cách tạo báo cáo tóm tắt cho API tổng hợp riêng tưAPI Báo cáo phân bổ.

Kiểm thử Dịch vụ tổng hợp

Bạn nên đọc hướng dẫn tương ứng cho từng API mà bạn đang kiểm thử:

Để kiểm thử Dịch vụ tổng hợp trên AWS, hãy xem các hướng dẫn này.

Bạn cũng có thể dùng công cụ kiểm tra cục bộ để xử lý các báo cáo tổng hợp cho Báo cáo phân bổ và API Tổng hợp riêng tư.

Khung kiểm thử tải dịch vụ tổng hợp cung cấp một khung kiểm thử đề xuất.

Thu hút và chia sẻ ý kiến phản hồi

Dịch vụ tổng hợp là một phần chính của các API đo lường Hộp cát về quyền riêng tư. Giống như các API khác của Hộp cát về quyền riêng tư, API này được ghi lại và thảo luận công khai trên GitHub.