บริการรวบรวมข้อมูล

บริการรวบรวมข้อมูลจะสร้างรายงานสรุปของข้อมูล Conversion แบบละเอียดและการวัดการเข้าถึงจากรายงานดิบแบบรวมได้ เทคโนโลยีโฆษณามีจุดแรกเข้ารวม 2 จุดหลักในฝั่งไคลเอ็นต์เพื่อสร้างรายงานไปยังบริการรวมข้อมูล ไม่ว่าจะผ่าน Attribution Reporting API หรือ Private Aggregation API

สถานะการติดตั้งใช้งาน

ความพร้อมใช้งาน

ข้อเสนอ สถานะ
การรองรับบริการรวบรวมข้อมูลสําหรับ Amazon Web Services (AWS) ใน Attribution Reporting API, Private Aggregation API
คําอธิบาย
ใช้งานได้
การรองรับบริการรวบรวมข้อมูลสําหรับ Google Cloud ใน Attribution Reporting API, Private Aggregation API
คําอธิบาย
ใช้งานได้
การลงทะเบียนเว็บไซต์บริการรวมข้อมูลและการรวมหลายต้นทาง การลงทะเบียนเว็บไซต์รวมถึงการแมปเว็บไซต์กับบัญชีระบบคลาวด์ (AWS หรือ GCP) หากต้องการรวมหลายต้นทาง แหล่งที่มาเหล่านั้นต้องอยู่ในเว็บไซต์เดียวกัน
คำถามที่พบบ่อยเกี่ยวกับ GitHub
เอกสารประกอบของ Site Aggregation API
ใช้งานได้
ค่า epsilon ของบริการรวมจะเก็บเป็นช่วงสูงสุด 64 เพื่ออำนวยความสะดวกในการทดสอบและแสดงความคิดเห็นเกี่ยวกับพารามิเตอร์ต่างๆ
ส่งความคิดเห็นเกี่ยวกับ ARA epsilon
ส่งความคิดเห็นเกี่ยวกับ Epsilon ของ PAA
มีให้บริการ เราจะประกาศแจ้งล่วงหน้าให้ระบบนิเวศทราบก่อนที่จะอัปเดตค่าช่วงของ Epsilon
การกรองข้อมูลที่ส่งเข้ามามีความยืดหยุ่นมากขึ้นสําหรับการค้นหาบริการรวมข้อมูล
คําอธิบาย
ใช้งานได้
กระบวนการสำหรับการกู้คืนงบประมาณหลังเกิดภัยพิบัติ (ข้อผิดพลาด การกำหนดค่าที่ไม่ถูกต้อง และอื่นๆ)
คำอธิบาย
พร้อมใช้งาน
กลไกในการตรวจสอบเปอร์เซ็นต์ของรหัสที่แชร์ซึ่งเทคโนโลยีโฆษณากู้คืนโดยใช้การกู้คืนงบประมาณและระงับการกู้คืนในอนาคตสำหรับการกู้คืนที่มากเกินไปซึ่งวางแผนไว้สำหรับครึ่งปีแรก 2025
Accenture ดำเนินการในฐานะผู้ประสานงานบน AWS
บล็อกนักพัฒนาซอฟต์แวร์
ใช้งานได้
บุคคลภายนอกที่ทำงานเป็นผู้ประสานงานใน Google Cloud
บล็อกนักพัฒนาซอฟต์แวร์
ใช้งานได้
การสนับสนุนบริการรวมข้อมูลสำหรับการรายงานการแก้ไขข้อบกพร่องรวมบน Attribution Reporting API
คำอธิบาย
ใช้งานได้

คำสำคัญและแนวคิด

หากคุณกำลังพิจารณาใช้บริการรวบรวมข้อมูลในเวิร์กโฟลว์เทคโนโลยีโฆษณา คำและแนวคิดต่อไปนี้น่าจะให้ข้อมูลเชิงลึกเพิ่มเติมว่ากระบวนการรวบรวมข้อมูลแบบใหม่นี้จะให้ข้อมูลอะไรแก่ทีมของคุณได้บ้าง

Term Description
Aggregation Service An ad tech-operated service that processes aggregatable reports to create a summary report.
Aggregatable Reports

可汇总报告是从各个用户设备发送的加密报告。这些报告包含有关跨网站用户行为和转化的数据。转化(有时称为归因触发器事件)和关联的指标由广告主或广告技术平台定义。每个报告都会加密,以防止多方访问基础数据。

Learn more about aggregatable reports.
Aggregatable Report Accounting A distributed ledger located in both coordinators that tracks allocated privacy budget and enforces the 'No Duplicates' rule. This is the privacy preserving mechanism, located and run within coordinators, that ensures that no report passes through Aggregation Service beyond the allocated privacy budget. Read more on batching strategies on how it relates to aggregatable reports.
Aggregatable Report Accounting Budget References to the budget that ensures reports are not processed more than once.
Trusted Execution Environment (TEE)

可信执行环境是计算机硬件和软件的一种特殊配置, 验证计算机上运行的软件的确切版本。TEEs 允许外部各方验证软件是否完全按照 软件制造商声称可以,不多或少。

如需详细了解用于 Privacy Sandbox 提案的 TEE,请参阅 Protected Audience API 服务说明文档 以及汇总服务说明

Coordinators

ผู้ประสานงานคือหน่วยงานที่รับผิดชอบด้านการจัดการคีย์และการทําบัญชีรายงานสรุปได้ ผู้ประสานงานจะเก็บรักษารายการแฮชของการกำหนดค่าบริการรวบรวมข้อมูลที่ได้รับอนุมัติ และกำหนดค่าการเข้าถึงคีย์การถอดรหัส

Shared ID Computed value that consists of: shared_info, reporting_origin, destination_site (available for Attribution Reporting API only), source_registration-time (available for Attribution Reporting API only), scheduled_report_time, version. This means that multiple reports belong to the same shared ID should they share the same attributes of the shared_info field. This plays an important role within Aggregatable Report Accounting. Read more about Trusted Servers.
Summary Report

摘要报告是一种 Attribution Reporting API 和 Private Aggregation API 报告类型。摘要报告包含汇总的用户数据,并且可能包含添加了噪声的详细转化数据。摘要报告由汇总报告组成。与事件级报告相比,摘要报告具有更大的灵活性和数据模型,尤其是对于某些应用场景(例如转化价值)。

Reporting Origin

报告来源是接收可汇总报告的实体,也就是调用 Attribution Reporting API 的广告技术平台。可汇总报告的来源 将用户设备转到与报告关联的已知网址 来源。此报告来源应在注册期间指定。

Contribution Bonding Aggregatable reports may contain an arbitrary number of counter increments. For example, a report may contain a count of products that a user has viewed on an advertiser's site. The sum of increments in all aggregatable reports related to a single source event must not exceed a given limit, `L1=2^16`. Learn more in the aggregatable reports explainer.
Noise & Scaling A certain amount of statistical noise is added to summary reports as a part of the aggregation process that also functions to preserve privacy and ensure the final reports provide anonymized measurement information. Read more about additive noise mechanism, which is drawn from Laplace distribution.
Attestation

认证是一种用于对软件身份进行身份验证的机制,通常使用加密哈希或签名。对于汇总服务方案,证明会将广告技术平台运营的汇总服务中运行的代码与开放源代码进行匹配。

Read more about attestation.

อ่านเพิ่มเติมเกี่ยวกับ Backstory ของ Aggregation Service ในคำอธิบายและรายการข้อกำหนดทั้งหมด

Use Case การรวมข้อมูล

พิจารณาเส้นทางของนักพัฒนาซอฟต์แวร์ต่อไปนี้สําหรับการวัดโฆษณาและไลบรารีไคลเอ็นต์การวัดที่สอดคล้องกัน

กรณีการใช้งาน จุดแรกเข้า คำอธิบาย
การเพิ่มประสิทธิภาพการเสนอราคา Attribution Reporting API (Chrome และ Android) ใช้รายงานรวมเพื่อนําเข้าสัญญาณ Conversion เพื่อวัตถุประสงค์ในการเพิ่มประสิทธิภาพการเสนอราคา
การวัดผลข้ามแพลตฟอร์ม Attribution Reporting API (Chrome และ Android) ใช้ความสามารถในการวัดผลข้ามเว็บและแอปเพื่อให้เห็นประสิทธิภาพใน Chrome และ Android
การรายงาน Conversion Attribution Reporting API (Chrome และ Android) สร้างการรายงาน Conversion แบบรวมที่ปรับให้เหมาะกับความต้องการของแคมเปญของลูกค้า (รวมถึง CTC และ VTC)
การวัดการเข้าถึงของแคมเปญ Shared Storage API และ Private Aggregation API (Chrome) ใช้ตัวแปรการดูโฆษณาข้ามเว็บไซต์เพื่อวัดการเข้าถึงของแคมเปญ
การรายงานข้อมูลประชากร Shared Storage API และ Private Aggregation API (Chrome) ใช้การดูโฆษณาข้ามเว็บไซต์และข้อมูลประชากรเพื่อวัดการเข้าถึงตามข้อมูลประชากร
การวิเคราะห์เส้นทาง Conversion Shared Storage API และ Private Aggregation API (Chrome) จัดเก็บการแสดงโฆษณาข้ามเว็บไซต์และตัวแปร Conversion เพื่อทําการวิเคราะห์เส้นทาง Conversion แบบรวม
Brand Lift และ Conversion Lift Shared Storage API และ Private Aggregation API (Chrome) การรายงานเกี่ยวกับกลุ่มทดสอบ/กลุ่มควบคุมและข้อมูลการสำรวจเพื่อวัด Brand Lift และส่วนเพิ่ม
การแก้ไขข้อบกพร่องในการประมูล Protected Audience API และ Private Aggregation API (Chrome) ใช้รายงานรวมสำหรับการแก้ไขข้อบกพร่อง
การกระจายราคาเสนอ Protected Audience API และ Private Aggregation API (Chrome) ใช้รายงานแบบรวมเพื่อบันทึกการแจกแจงมูลค่าการเสนอราคาสำหรับการประมูล

ขั้นตอนจากต้นทางถึงปลายทาง

แผนภาพต่อไปนี้แสดงการทํางานของบริการรวบรวมข้อมูล เราจะมุ่งเน้นที่ขั้นตอนตั้งแต่ต้นจนจบ ตั้งแต่การรับรายงานจากเว็บและอุปกรณ์เคลื่อนที่ไปจนถึงการสร้างรายงานสรุปในบริการรวบรวมข้อมูล

ขั้นตอนบริการรวมข้อมูลจากต้นทางถึงปลายทาง

  1. ดึงข้อมูลคีย์สาธารณะเพื่อสร้างรายงานที่เข้ารหัส
  2. รายงานที่รวบรวมได้ซึ่งเข้ารหัสแล้วซึ่งส่งไปยังเซิร์ฟเวอร์เทคโนโลยีโฆษณาเพื่อรวบรวม เปลี่ยนรูปแบบ และจัดกลุ่ม
  3. เซิร์ฟเวอร์เทคโนโลยีโฆษณาจะจัดกลุ่มรายงาน (รูปแบบ avro) และส่งไปยังบริการรวบรวมข้อมูลที่ติดตั้งใช้งาน (ต้องดำเนินการโดยเทคโนโลยีโฆษณา)
  4. เรียกข้อมูลรายงานรวมเพื่อถอดรหัส
  5. เรียกข้อมูลคีย์การถอดรหัสจากผู้ประสานงาน
  6. บริการรวมข้อมูลจะถอดรหัสรายงานเพื่อรวบรวมข้อมูลและสร้างสัญญาณรบกวน
  7. บริการบัญชีของรายงานที่รวบรวมได้จะตรวจสอบว่ายังมีงบประมาณความเป็นส่วนตัวเหลืออยู่หรือไม่เพื่อสร้างรายงานสรุปสําหรับรายงานที่รวบรวมได้
  8. ส่งรายงานสรุปขั้นสุดท้าย

จากแผนภาพนี้ คุณจะเห็นความสัมพันธ์โดยรวมที่บริการรวบรวมข้อมูลมีกับ API การวัดผลไคลเอ็นต์หลักอย่าง Attribution Reporting API, Private Aggregation API และผู้ประสานงาน

ขั้นตอนเริ่มต้นด้วย Measurement API ต่างๆ เช่น Attribution Reporting API หรือ Private Aggregation API ที่สร้างรายงานจากอินสแตนซ์เบราว์เซอร์หลายรายการ Chrome จะนำคีย์สาธารณะจากบริการโฮสติ้งคีย์ใน Coordinator ไปเข้ารหัสรายงานก่อนที่จะส่งไปยังต้นทางการรายงานของเทคโนโลยีโฆษณา คีย์สาธารณะจะมีการหมุนเวียนทุก 7 วัน

เมื่อต้นทางการรายงานของเทคโนโลยีโฆษณาได้รับรายงานเหล่านี้แล้ว ควรกำหนดค่าต้นทางการรายงานเพื่อรวบรวมและแปลงรายงานเหล่านั้นเป็นรูปแบบ Avro และส่งไปยังอินสแตนซ์บริการรวบรวมข้อมูลที่ทำให้ใช้งานได้แล้ว ดูกลยุทธ์แบบกลุ่ม

เมื่อเทคโนโลยีโฆษณาพร้อมที่จะส่งเป็นกลุ่มแล้ว เทคโนโลยีโฆษณาจะสร้างคําขอเป็นกลุ่มไปยังบริการรวบรวมข้อมูล ซึ่งจะถอดรหัสรายงานโดยการดึงคีย์การถอดรหัสจากบริการโฮสติ้งคีย์ และรวบรวมข้อมูลและสร้างความสับสนเพื่อสร้างรายงานสรุป โปรดทราบว่าการดำเนินการนี้จะขึ้นอยู่กับว่ามีงบประมาณความเป็นส่วนตัวเพียงพอที่จะสร้างรายงานสรุปขั้นสุดท้ายหรือไม่

เทคโนโลยีโฆษณาปลายทางต้นทางการรายงานเทคโนโลยีโฆษณาที่รวบรวมรายงานนั้นโฮสต์โดยเทคโนโลยีโฆษณา และติดตั้งใช้งานบริการรวบรวมข้อมูลในระบบคลาวด์ของเทคโนโลยีโฆษณา

กลุ่มรายงานที่รวบรวมได้

ขั้นตอนการรายงานจะไม่สมบูรณ์หากไม่มีความช่วยเหลือจากเซิร์ฟเวอร์ต้นทางการรายงานที่กําหนด ซึ่งเป็นต้นทางที่เทคโนโลยีโฆษณาจะส่งเข้ามาในขั้นตอนการลงทะเบียน การดำเนินการหลักที่ต้นทางการรายงานเป็นผู้รับผิดชอบจะเป็นการรวบรวม เปลี่ยนรูปแบบ และจัดกลุ่มรายงานที่รวบรวมได้ และเตรียมส่งรายงานดังกล่าวไปยังบริการรวบรวมข้อมูลที่ติดตั้งใช้งานของเทคโนโลยีโฆษณาใน Google Cloud หรือ Amazon Web Services อ่านเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมได้

ตอนนี้คุณมีแนวคิดทั่วไปแล้ว มาดูรายละเอียดเกี่ยวกับคอมโพเนนต์ที่จะติดตั้งใช้งานในบริการรวบรวมข้อมูลกันก่อน

คอมโพเนนต์ระบบคลาวด์

บริการรวบรวมข้อมูลประกอบด้วยคอมโพเนนต์บริการระบบคลาวด์ต่างๆ การจัดสรรสคริปต์ Terraform ที่มีให้และกำหนดค่าองค์ประกอบบริการระบบคลาวด์ที่จำเป็นทั้งหมด

คอมโพเนนต์ระบบคลาวด์ของบริการรวมข้อมูล

บริการ Frontend

บริการระบบคลาวด์ที่มีการจัดการ: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)

บริการ Frontend เป็นเกตเวย์แบบ Serverless ที่ทำหน้าที่เป็นจุดแรกเข้าสำหรับการเรียก Aggregation API สำหรับการสร้างงานและการดึงข้อมูลสถานะงาน ซึ่งมีหน้ารับคำขอจากผู้ใช้บริการรวมข้อมูล ตรวจสอบพารามิเตอร์อินพุต และเริ่มขั้นตอนการกำหนดเวลางานการรวม

API 2 รายการที่พร้อมใช้งานในบริการฟรอนท์เอนด์ ได้แก่

ปลายทาง คำอธิบาย
createJob API นี้จะทริกเกอร์งานบริการรวมข้อมูล ต้องใช้ข้อมูลเพื่อทริกเกอร์งาน เช่น รหัสงาน รายละเอียดพื้นที่เก็บข้อมูลอินพุต รายละเอียดพื้นที่เก็บข้อมูลเอาต์พุต ที่มาของการรายงาน และอื่นๆ
getJob API นี้จะแสดงสถานะของงานสำหรับรหัสงานที่ระบุ บริการให้ข้อมูลเกี่ยวกับสถานะของงาน เช่น "ได้รับแล้ว" "กำลังดำเนินการ" หรือ "เสร็จแล้ว" นอกจากนี้ หากงานเสร็จสิ้นแล้ว ระบบจะแสดงผลลัพธ์ของงาน รวมถึงข้อความแสดงข้อผิดพลาดที่พบระหว่างการดำเนินการของงาน

ดูเอกสารประกอบของ Aggregation Service API

คิวงาน

บริการระบบคลาวด์ที่มีการจัดการ: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)

คิวงานคือคิวข้อความที่จัดเก็บคําของานสําหรับบริการรวบรวมข้อมูล บริการฟรอนท์เอนด์จะแทรกข้อความคำของานลงในคิว ซึ่ง ผู้ปฏิบัติงานการรวมจะใช้เพื่อประมวลผลคำของาน

Cloud Storage

บริการระบบคลาวด์ที่มีการจัดการ: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services) ใช้พื้นที่เก็บข้อมูลระบบคลาวด์เพื่อจัดเก็บไฟล์อินพุตและเอาต์พุตที่บริการรวบรวมข้อมูลใช้ (เช่น ไฟล์รายงานที่เข้ารหัส รายงานสรุปเอาต์พุต ฯลฯ)

ฐานข้อมูลข้อมูลเมตาของงาน

บริการระบบคลาวด์ที่มีการจัดการ: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)

ฐานข้อมูลข้อมูลเมตาของงานจะจัดเก็บและติดตามสถานะงานการรวม ฐานข้อมูลจะบันทึกข้อมูลเมตา เช่น เวลาสร้าง เวลาขอ เวลาอัปเดต และสถานะ (เช่น ได้รับ อยู่ระหว่างดำเนินการ เสร็จสิ้น ฯลฯ) Aggregation Worker จะอัปเดตฐานข้อมูลข้อมูลเมตาของงานเมื่องานดำเนินการ

ผู้ปฏิบัติงานการรวมข้อมูล

บริการระบบคลาวด์ที่มีการจัดการ: Compute Engine ที่มีพื้นที่ทำงานลับ (Google Cloud) / Amazon Web Services EC2 ที่มีเครือข่าย Nitro (Amazon Web Services)

ผู้ปฏิบัติงานการรวมจะประมวลผลคําของานซึ่งเริ่มต้นโดยคําของานในคิวงาน โดยถอดรหัสอินพุตที่เข้ารหัสโดยใช้คีย์ที่ดึงมาจากบริการสร้างและจัดจำหน่ายคีย์ (KGDS) ในผู้ประสานงาน เพื่อลดเวลาในการตอบสนองของการประมวลผลงาน ระบบจะแคชคีย์การถอดรหัสใน Aggregation Worker เป็นเวลา 8 ชั่วโมง ซึ่งใช้ได้ในงานที่อินสแตนซ์ของผู้ปฏิบัติงานดังกล่าวประมวลผล

เวิร์กเกอร์จะทํางานภายในอินสแตนซ์ Trusted Execution Environment (TEE) ผู้ปฏิบัติงานแต่ละคนจะจัดการงานได้ครั้งละ 1 งานเท่านั้น เทคโนโลยีโฆษณาสามารถกำหนดค่าผู้ปฏิบัติงานหลายคนให้ประมวลผลงานพร้อมกันได้โดยการตั้งค่าการกำหนดค่าการปรับขนาดอัตโนมัติ การปรับขนาดอัตโนมัติจะปรับจำนวนคนทำงานแบบไดนามิกตามจำนวนข้อความที่เหลืออยู่ในคิวงาน คุณสามารถกำหนดค่าจำนวนผู้ปฏิบัติงานขั้นต่ำและสูงสุดสำหรับการปรับขนาดอัตโนมัติผ่านไฟล์สภาพแวดล้อม Terraform ดูข้อมูลเพิ่มเติมเกี่ยวกับการปรับขนาดอัตโนมัติได้ในสคริปต์ terraform ต่อไปนี้ [Amazon Web Services / Google Cloud]

ผู้ปฏิบัติงานด้านการรวบรวมข้อมูลเรียกใช้บริการการบัญชีรายงานที่รวบรวมได้สำหรับการลงบัญชีรายงานที่รวบรวมได้ บริการบัญชีรายงานแบบรวมจะตรวจสอบว่าระบบจะเรียกใช้งานเฉพาะในกรณีที่ยังไม่ใช้งบประมาณความเป็นส่วนตัวเกินขีดจํากัดเท่านั้น (ดูกฎ "ไม่มีข้อมูลที่ซ้ำกัน") หากมีงบประมาณเพียงพอ ระบบจะสร้างรายงานสรุปโดยใช้การรวบรวมข้อมูลที่มีความผันผวน อ่านรายละเอียดเพิ่มเติมเกี่ยวกับการทำบัญชีแบบรายงานที่รวบรวมได้

Aggregation Worker จะอัปเดตข้อมูลเมตาของงานในฐานข้อมูลข้อมูลเมตาของงาน รวมถึงรหัสผลลัพธ์ของงานที่เหมาะสมและตัวนับข้อผิดพลาดของรายงานในกรณีที่รายงานบางส่วนไม่สำเร็จ ผู้ใช้จะดึงข้อมูลสถานะได้โดยใช้ API การดึงข้อมูลสถานะงาน (getJob)

ดูคำอธิบายโดยละเอียดของบริการรวบรวมข้อมูลได้ที่คำอธิบาย

ขั้นตอนถัดไป

ตอนนี้คุณได้รับไฮไลต์เกี่ยวกับบริการรวมข้อมูลแล้ว ก็ถึงเวลาทำให้อินสแตนซ์ของบริการรวบรวมข้อมูลใช้งานได้ผ่าน Google Cloud หรือ Amazon Web Services ดูส่วนการเริ่มต้นใช้งาน หรือหากต้องการข้อมูลเพิ่มเติมเกี่ยวกับวิธีดำเนินงานบริการรวบรวมข้อมูลที่ทำให้ใช้งานได้แล้ว โปรดไปที่ลิงก์นี้เพื่อดูข้อมูลเพิ่มเติมเกี่ยวกับบริการรวบรวมข้อมูลการดำเนินการ

การแก้ปัญหา

โปรดดูคำอธิบายเพิ่มเติมเกี่ยวกับข้อความแสดงข้อผิดพลาด สิ่งที่อาจเป็นสาเหตุของข้อผิดพลาดที่คุณพบ และขั้นตอนถัดไปในการบรรเทาปัญหาจากเอกสารรหัสข้อผิดพลาดที่พบบ่อยและการผ่อนปรนชั่วคราว

รับการสนับสนุนและแสดงความคิดเห็น

  • สำหรับปัญหาทางเทคนิค คำถามเกี่ยวกับผลิตภัณฑ์ ความคิดเห็น และคำขอฟีเจอร์ โปรดสร้างปัญหาในที่เก็บ GitHub
  • หากมีคำถามที่คุณต้องระบุข้อมูลที่ละเอียดอ่อนหรือเป็นกรรมสิทธิ์เพื่อแก้ปัญหา โปรดติดต่อ aggregation-service-support@google.com
  • ตรวจสอบปัญหาที่ทราบในหน้าแดชบอร์ดสถานะสาธารณะ