ภาพรวมของบริการรวบรวมข้อมูล

ใช้งานและจัดการบริการนี้เพื่อสร้างรายงานสรุปสำหรับ Attribution Reporting API หรือ Private Aggregation API

ติดตั้งใช้งานและจัดการบริการการรวมเพื่อประมวลผลรายงานที่รวบรวมได้จาก Attribution Reporting API หรือ Private Aggregation API เพื่อสร้างรายงานสรุป

สถานะการใช้งาน

คำอธิบายจะอธิบายคำสำคัญ ซึ่งมีประโยชน์ต่อการทำความเข้าใจบริการรวบรวมข้อมูล

ความพร้อมใช้งาน

ข้อเสนอ สถานะ
การรองรับ Aggregation Service สำหรับ Amazon Web Services (AWS) ใน Attribution Reporting API, Private Aggregation API
Explainer
ใช้ได้
การรองรับบริการรวบรวมข้อมูลสำหรับ Google Cloud ใน Attribution Reporting API,
คำอธิบายของ Private Aggregation API
พร้อมใช้งานในรุ่นเบต้า
การลงทะเบียนเว็บไซต์บริการรวบรวมข้อมูลและการแมปเว็บไซต์กับบัญชีระบบคลาวด์ (AWS หรือ GCP)
คำถามที่พบบ่อยเกี่ยวกับ GitHub
ใช้ได้
ค่า epsilon ของบริการรวบรวมจะเก็บไว้เป็นช่วงสูงสุด 64 เพื่ออำนวยความสะดวกในการทดสอบและให้ข้อเสนอแนะเกี่ยวกับพารามิเตอร์ต่างๆ
ส่งความคิดเห็นของ ARA epsilon
ส่งความคิดเห็นของ PAA epsilon
มีให้บริการ เราจะแจ้งล่วงหน้าให้ระบบนิเวศทราบก่อนที่จะอัปเดตค่าช่วง epsilon
การกรองการมีส่วนร่วมที่ยืดหยุ่นมากขึ้นสำหรับการค้นหาบริการรวบรวมข้อมูล
คำอธิบาย
คาดว่าไตรมาส 2 ปี 2024
ขั้นตอนการกู้คืนงบประมาณหลังเกิดภัยพิบัติ (ข้อผิดพลาด การกำหนดค่าที่ไม่ถูกต้อง และอื่นๆ)
ปัญหาเกี่ยวกับ GitHub
คาดว่าไตรมาส 2 ปี 2024
Accenture ทำหน้าที่เป็นหนึ่งในผู้ประสานงานบน AWS
บล็อกสำหรับนักพัฒนาซอฟต์แวร์
ใช้ได้
ฝ่ายอิสระที่ดำเนินงานในฐานะหนึ่งในผู้ประสานงานของ Google Cloud
บล็อกของนักพัฒนาซอฟต์แวร์
คาดว่าไตรมาส 3 ปี 2024

การประมวลผลข้อมูลที่ปลอดภัย

บริการรวบรวมข้อมูลจะถอดรหัสและรวมข้อมูลที่เก็บรวบรวมจากรายงานที่รวบรวมได้ เพิ่มสัญญาณรบกวน และแสดงผลรายงานสรุปขั้นสุดท้าย บริการนี้ทำงานในสภาพแวดล้อมการดำเนินการที่เชื่อถือได้ (TEE) ซึ่งติดตั้งใช้งานในบริการระบบคลาวด์ที่รองรับมาตรการรักษาความปลอดภัยที่จำเป็นเพื่อปกป้องข้อมูลนี้

โค้ดของ TEE คือจุดเดียวใน Aggregation Service ที่มีสิทธิ์เข้าถึงรายงานข้อมูลดิบ โดยนักวิจัยด้านความปลอดภัย ผู้สนับสนุนด้านความเป็นส่วนตัว และเทคโนโลยีโฆษณาจะตรวจสอบโค้ดนี้ได้ ผู้ประสานงานจะรับรองความถูกต้องเพื่อยืนยันว่า TEE ใช้งานซอฟต์แวร์ที่ได้รับอนุมัติจริงๆ และข้อมูลดังกล่าวยังปลอดภัยอยู่

รายงานที่รวบรวมได้จะได้รับการรวบรวม จัดเป็นกลุ่ม และส่งไปยัง TEE เพื่อเปลี่ยนรูปแบบเป็นรายงานสรุปขั้นสุดท้าย
ระบบจะรวบรวม จัดกลุ่ม และส่งรายงานรวบรวมข้อมูลได้ไปยังบริการรวบรวมข้อมูลโดยทำงานบน TEE สภาพแวดล้อมของบริการรวบรวมข้อมูลมีเจ้าของและดำเนินการเองจากฝ่ายเดียวกันที่รวบรวมข้อมูล

เอกสารรับรองของผู้ประสานงานของ TEE

ผู้ประสานงานคือบุคคลที่รับผิดชอบการจัดการคีย์และการบัญชีรายงานที่รวบรวมได้

ผู้ประสานงานมีหน้าที่รับผิดชอบหลายประการดังนี้

  • เก็บรักษารายการรูปภาพไบนารีที่ได้รับอนุญาต รูปภาพเหล่านี้เป็นแฮชแบบเข้ารหัสของซอฟต์แวร์ Aggregation Service ที่สร้างขึ้น ซึ่ง Google จะเผยแพร่ข้อมูลเป็นระยะๆ การดำเนินการนี้จะเกิดซ้ำได้เพื่อให้ทุกฝ่ายยืนยันได้ว่ารูปภาพเหมือนกับบิลด์ของบริการรวบรวมข้อมูล
  • ใช้ระบบการจัดการคีย์ ต้องมีคีย์การเข้ารหัสสำหรับ Chrome ในอุปกรณ์ของผู้ใช้เพื่อเข้ารหัสรายงานที่รวบรวมข้อมูลได้ คีย์การถอดรหัสเป็นสิ่งจำเป็นในการพิสูจน์ว่ารหัสบริการรวบรวมข้อมูลตรงกับรูปภาพไบนารี
  • ติดตามรายงานที่รวบรวมได้เพื่อป้องกันการใช้ซ้ำในการรวมสำหรับรายงานสรุป เนื่องจากการใช้ซ้ำอาจเปิดเผยข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII)

กฎ "ไม่มีรายการที่ซ้ำกัน"

ผู้โจมตีอาจทำสำเนารายงานหลายสำเนาและรวมสำเนาเหล่านั้นไว้ในกลุ่มเดียวหรือหลายชุด เพื่อรับข้อมูลเชิงลึกเกี่ยวกับเนื้อหาของรายงานที่รวบรวมได้ที่เฉพาะเจาะจง ด้วยเหตุนี้ บริการรวบรวมข้อมูลจึงบังคับใช้กฎ "ไม่มีรายการที่ซ้ำกัน" ดังนี้

  • ในกลุ่ม: รายงานที่รวบรวมได้จะปรากฏเพียงครั้งเดียวภายในกลุ่ม
  • ข้ามกลุ่ม: รายงานที่รวบรวมได้จะปรากฏในกลุ่มมากกว่า 1 กลุ่ม หรือปรากฏในรายงานสรุปมากกว่า 1 ฉบับ

เพื่อให้สามารถระบุรหัสที่ใช้ร่วมกันได้ เบราว์เซอร์จึงกำหนดรหัสที่ใช้ร่วมกันให้กับรายงานที่รวบรวมได้แต่ละรายการ เบราว์เซอร์จะสร้างรหัสที่ใช้ร่วมกันจากจุดข้อมูลหลายจุด ได้แก่ เวอร์ชัน API, ต้นทางการรายงาน, เว็บไซต์ปลายทาง, เวลาที่ลงทะเบียนของแหล่งที่มา และเวลารายงานที่ตั้งเวลาไว้ ข้อมูลนี้มาจากช่อง shared_info ในรายงาน

บริการรวบรวมข้อมูลจะยืนยันว่ารายงานที่รวบรวมได้ทั้งหมดที่มีรหัสที่แชร์เดียวกันอยู่ในกลุ่มเดียวกันและรายงานจากผู้ประสานงานว่าได้รับการประมวลผลรหัสที่แชร์แล้ว หากสร้างหลายกลุ่มด้วยรหัสเดียวกัน เราจะยอมรับกลุ่มเดียวสำหรับการรวมได้เพียงกลุ่มเดียว และจะปฏิเสธกลุ่มอื่นๆ

เมื่อคุณเรียกใช้การแก้ไขข้อบกพร่อง ระบบจะไม่บังคับใช้กฎ "ไม่มีรายการที่ซ้ำกัน" ในกลุ่ม กล่าวคือ รายงานจากกลุ่มก่อนหน้าอาจปรากฏในการเรียกใช้การแก้ไขข้อบกพร่อง แต่กฎจะยังคงบังคับใช้ ภายในกลุ่มอยู่ ซึ่งจะช่วยให้คุณทดสอบบริการและกลยุทธ์การทำงานเป็นแบตช์แบบต่างๆ ได้โดยไม่จำกัดการประมวลผลในอนาคตในสภาพแวดล้อมการใช้งานจริง

เสียงรบกวนและการปรับขนาด

เพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ บริการรวบรวมข้อมูลจะใช้กลไกการเพิ่มสัญญาณรบกวนกับข้อมูลดิบจากรายงานที่รวบรวมได้ ซึ่งหมายความว่าจะมีการเพิ่มสัญญาณรบกวนเชิงสถิติจำนวนหนึ่งลงในค่ารวมแต่ละค่าก่อนเผยแพร่ในรายงานสรุป

แม้ว่าคุณจะไม่สามารถควบคุมวิธีเพิ่มสัญญาณรบกวนได้โดยตรง แต่ก็อาจมีผลต่อข้อมูลการวัดของสัญญาณรบกวนได้

สัญญาณรบกวนเป็นค่าคงที่ โดยไม่คำนึงถึงค่ารวม

ค่าสัญญาณรบกวนจะสุ่มมาจากการกระจายความน่าจะเป็นของ Laplace และการกระจายจะเหมือนกันโดยไม่คำนึงถึงจำนวนข้อมูลที่เก็บรวบรวมในรายงานที่รวบรวมได้ ยิ่งรวบรวมข้อมูลได้มาก ก็ยิ่งมีผลกระทบต่อผลลัพธ์ในรายงานสรุปน้อยลงเท่านั้น คุณคูณข้อมูลรายงานรวมได้กับปัจจัยการปรับขนาดเพื่อลดผลกระทบจากสัญญาณรบกวน

หากต้องการทําความเข้าใจวิธีเพิ่มข้อมูลรบกวน การควบคุม และผลกระทบต่อรายงาน โปรดดูงบประมาณการมีส่วนร่วมและเพิ่มงบประมาณตามงบประมาณการสนับสนุนในหัวข้อการทำงานกับสัญญาณรบกวน

สร้างรายงานสรุป

การสร้างรายงานสรุปจะขึ้นอยู่กับการใช้งาน API ของคุณ ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างรายงานสรุปสำหรับ Private Aggregation API และ Attribution Reporting API

ทดสอบบริการรวบรวมข้อมูล

เราขอแนะนำให้อ่านคู่มือที่เกี่ยวข้องสำหรับ API แต่ละรายการที่คุณกำลังทดสอบ ดังนี้

หากต้องการทดสอบ Aggregation Service ใน AWS โปรดดูวิธีการเหล่านี้

คุณสามารถใช้เครื่องมือทดสอบในพื้นที่เพื่อประมวลผลรายงานที่รวบรวมได้สำหรับ Attribution Reporting และ Private Aggregation API

เฟรมเวิร์กการทดสอบการโหลดของบริการรวบรวมมีเฟรมเวิร์กการทดสอบที่แนะนำ

มีส่วนร่วมและแชร์ความคิดเห็น

บริการรวบรวมข้อมูลเป็นส่วนสําคัญของ Privacy Sandbox Measurement API โดยจะมีการบันทึกและอภิปรายแบบสาธารณะใน GitHub เช่นเดียวกับ Privacy Sandbox API อื่นๆ