เรายินดีรับฟังความคิดเห็นของคุณเกี่ยวกับเอกสารนี้ขณะเตรียมความพร้อมเพื่อเพิ่มลงในที่เก็บคำแนะนำสาธารณะ
เราขอแนะนำให้เทคโนโลยีโฆษณาทดสอบโหลดกับการเข้าชมเวอร์ชันที่ใช้งานจริงทั้งหมด 100% ดังนี้
- เทคโนโลยีโฆษณาควรเข้าถึงการวัดผลการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
- เทคโนโลยีโฆษณาควรเป็นผู้ตัดสินใจด้านการออกแบบโดยลดเสียงรบกวน (ข้อมูลอ้างอิง: การจำลองการตัดสินใจด้านการออกแบบ)
- ขณะทดสอบ เทคโนโลยีโฆษณาควรติดตามจำนวนงานที่เรียกใช้ต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การกระจายปริมาณเหตุการณ์ Conversion โดยประมาณ และจำนวนคีย์รวมเป็นอินพุตต่องานการประมวลผล (ดูพารามิเตอร์งาน config_domain_blob_prefix ในเอกสารประกอบของ API การรวมบริการ) และเหตุการณ์ Conversion เฉลี่ยโดยประมาณต่อรายงานอินพุต
- สำหรับการทดสอบ เทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนำจากตารางคำแนะนำด้านขนาดตามขนาดงานที่คาดไว้ (เช่น ปริมาณรายงาน ขนาดโดเมน) และกำหนดขนาดของบริการรวมข้อมูลที่ทำให้ใช้งานได้ตามความเหมาะสม ข้อมูลอ้างอิง: คำแนะนำเกี่ยวกับขนาด สำหรับบริการรวมบน AWS
- เทคโนโลยีโฆษณาควรใช้งานการรวมสำหรับการทดสอบการโหลด
เป้าหมาย
คําแนะนํานี้มีไว้สำหรับการรวมการวัดการระบุแหล่งที่มาของ Conversion โดยเฉพาะ และจะมีวิธีการตั้งค่าและการกําหนดค่าที่สําคัญที่มีไว้เพื่อการใช้โดยเทคโนโลยีโฆษณาเพื่อวัตถุประสงค์ต่อไปนี้
- ประมาณความคาดหวังของโหลดสำหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม
- เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับประสิทธิภาพและสัญญาณรบกวนตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการแบ่งกลุ่มผู้ลงโฆษณา
วิชาบังคับก่อน
คู่มือนี้มีไว้สำหรับกลุ่มเป้าหมายเทคโนโลยีโฆษณา ก่อนทําตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการทำงานกับเสียงรบกวน สรุปผลการตัดสินใจออกแบบรายงาน และการทดลองกับ Bise Lab เพื่อให้ได้การกำหนดค่าที่เหมาะสมที่สุด
ขั้นตอน
1. กลยุทธ์การตั้งค่าคีย์การรวมเริ่มต้น
กำหนดจำนวนโครงสร้างหลักต่างๆ (เช่น ชุดมิติข้อมูล) ที่ต้องการโดยอิงตามประเภทธุรกิจและวัตถุประสงค์ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลดปัญหาในรายงานได้
จำนวนผู้ลงโฆษณาที่คุณมี
ตัวอย่างเช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย
ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
คุณควรประเมินความคล้ายคลึงกันโดยพิจารณาจากปริมาณ Conversion, มูลค่า Conversion ที่เกี่ยวข้อง และความครอบคลุมโดยทั่วไปของลักษณะเฉพาะของผู้ลงโฆษณา ยิ่งคุณสามารถจัดกลุ่มผลลัพธ์ที่คล้ายกันได้มากเท่าใด ผลลัพธ์ก็จะปรับแต่งอย่างละเอียดมากขึ้นเท่านั้น (เนื่องจากค่าความแปรปรวนของค่าเอาต์พุตน้อย) จึงช่วยลดผลกระทบของสัญญาณรบกวน โปรดดูรายละเอียดเพิ่มเติมที่การจัดการคีย์ขั้นสูง ตัวอย่างเช่น เทคโนโลยีโฆษณาสามารถแบ่งกลุ่มผู้ลงโฆษณาของตนตามอุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ดังนี้
- อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ การค้าปลีกเพื่อการเติบโต)
- ค่าใช้จ่าย (เช่น <$50,000/ไตรมาส, $50-$150,000/ไตรมาส, $150,000-$250,000/ไตรมาส)
- ปริมาณ Conversion (ต่ำ ปานกลาง สูง)
จำนวนโครงสร้างหลักแบบรวมที่จะสร้าง
เช่น
27 (3x3x3) : 3 อุตสาหกรรม, 3 ประเภทการใช้จ่าย และ 3 การจัดกลุ่มสำหรับมูลค่า Conversion
2. ระบุมิติข้อมูลคีย์การรวม
ต่อไป ให้ระบุมิติข้อมูลสำคัญที่คุณต้องการติดตามทั้งสำหรับการแสดงผลและ Conversion เพื่อประมาณจำนวนคีย์แหล่งที่มาและคีย์ด้านข้างของทริกเกอร์
สำหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลสำคัญที่คุณต้องติดตามการแสดงผลจะช่วยกำหนดจำนวนคีย์ด้านข้างของแหล่งที่มา มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณาจากอันดับที่ 1 ด้านบน (เช่น อุตสาหกรรม การใช้จ่าย Conversion) ตัวอย่างต่อไปนี้ช่วยอธิบายมิติข้อมูล
โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 50
ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 20 รายการ) ประเภทอุปกรณ์
(เช่น 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น ความเป็นไปได้ 50 รายการ)
- ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ค่านี้แสดงถึงจำนวนชุดค่าผสมมิติข้อมูลที่เป็นไปได้สำหรับคีย์ด้านข้างของโครงสร้างคีย์ 1
- ต้องจองแบบ 18 บิต (18 บิต = 262,144 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 50
ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 20 รายการ) ประเภทอุปกรณ์
(เช่น 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น ความเป็นไปได้ 50 รายการ)
โครงสร้างสำคัญ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 30
ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 80 รายการ) ประเภทโฆษณา (เช่น 3
ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
- ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ค่านี้แสดงถึงจำนวนชุดค่าผสมมิติข้อมูลที่เป็นไปได้หรือคีย์ด้านข้างแหล่งที่มาสำหรับโครงสร้างคีย์ 2
- ต้องจองแบบ 19 บิต (19 บิต) = 524,288 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 30
ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 80 รายการ) ประเภทโฆษณา (เช่น 3
ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
โครงสร้างหลัก 3: ทำซ้ำ (วางแผนคล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)
สำหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลสำคัญที่คุณต้องติดตามสำหรับ Conversion จะช่วยกำหนดคีย์ด้านข้างของทริกเกอร์ เช่น
โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: มิติข้อมูล 2 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100
รายการ), ประเภท Conversion (เช่น สาเหตุที่เป็นไปได้ 5 ประการ)
- ชุดค่าผสมของมิติข้อมูลที่เป็นไปได้ = 100 x 5 = 500
- ต้องจองแบบ 9 บิต (9 บิต = 512 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: มิติข้อมูล 2 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100
รายการ), ประเภท Conversion (เช่น สาเหตุที่เป็นไปได้ 5 ประการ)
โครงสร้างสำคัญ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: มิติข้อมูล 3 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
- ชุดค่าผสมของมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
- ต้องจองแบบ 11 บิต (11 บิต = 2,048 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: มิติข้อมูล 3 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
โครงสร้างหลัก 3: ทำซ้ำ (วางแผนคล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)
ค่าประมาณสำหรับคีย์รวม
- โครงสร้างหลัก 1: คีย์การแสดงผล 250,000 คีย์ x คีย์ Conversion 500 คีย์ = 125,000,000 คีย์
- โครงสร้างหลัก 2: คีย์การแสดงผล 360,000 คีย์ x คีย์ Conversion 1.5k = 540,000,000 คีย์
- โครงสร้างหลัก 3: (แผนที่คล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)
- ทำซ้ำสำหรับโครงสร้างหลักแต่ละรายการ
- คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07B)
ปริมาณ Conversion ที่คาดไว้
สำหรับโครงสร้างคีย์การรวมแต่ละรายการ ปริมาณที่คาดไว้สามารถอธิบายได้โดยใช้ตัวอย่างต่อไปนี้
- โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย =
น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: คาดว่าโครงสร้างหลัก 1 จะ มีค่าใช้จ่ายของผู้ลงโฆษณาประมาณ 15,000,000 บาทในไตรมาสถัดไปในราคา CPM เฉลี่ยที่ 240 บาท คาดการณ์ไว้ว่าการแสดงผลนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้ง
- คาดการณ์ว่าการแสดงผลเฉลี่ยต่ออัตรา Conversion ที่โครงสร้างหลัก 1 จะประกอบขึ้นในช่วงไตรมาสถัดไปคือ 0.08% ซึ่งส่งผลให้ต้องมี Conversion ที่มีการระบุแหล่งที่มา 50,000 รายการที่ต้องบันทึก สำหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจำนวนการซื้อ
- โครงสร้างหลัก 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย =
น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: คาดการณ์ไว้ว่าคีย์ 2 จะประกอบเป็นยอดใช้จ่าย ประมาณ 2,400,000 บาทในช่วงไตรมาสถัดไปในราคา CPM เฉลี่ยที่ 300 บาท ซึ่งคาดว่าจะทำให้มีการแสดงผล 80,000,000 ครั้งที่ต้องลงทะเบียน
- คาดการณ์ว่าการแสดงผลเฉลี่ยต่ออัตรา Conversion ที่คีย์ 2 จะประกอบขึ้นเป็นในไตรมาสถัดไปคือ 0.03125% ซึ่งส่งผลให้ต้องมี Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการ สำหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจำนวนการซื้อ
- ทำซ้ำสำหรับโครงสร้างหลักแต่ละรายการ
ความถี่ในการรายงานการแสดงโฆษณาและแบบกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**
สำหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณจะต้องส่งรายงาน Conversion เป็นประจำ เราขอแนะนำให้รวมเทคโนโลยีโฆษณาเป็นกลุ่มตามผู้ลงโฆษณา (เพื่อให้แยกข้อมูลต่อรายงานได้ง่ายดายยิ่งขึ้น) และใช้ช่อง shared_info.scheduled_report_time
ของรายงานในการจัดกลุ่ม
- A: รายชั่วโมง
- B: รายวัน
- C: รายสัปดาห์
Notes
- สำหรับการจัดกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
การรวมกลุ่มบ่อยขึ้นจะรวมสัญญาณรบกวนที่สูงกว่าต่อกลุ่ม (โปรดดู: คำตัดสิน: ความถี่แบบกลุ่ม)
ตรวจสอบว่ากลุ่มใช้ช่อง
scheduled_report_time
ไม่ใช่report arrival time
เพื่อหลีกเลี่ยงข้อผิดพลาดเนื่องจากการจัดกลุ่มที่ไม่ถูกต้อง ตัวอย่างเช่น หากคุณจัดกลุ่มทุกชั่วโมง กลุ่มเวลา 11:00 น. ควรรวมเฉพาะรายงานที่มีscheduled_report_time
ระหว่างเวลา 10:00 น. - 11:00 น. เท่านั้น โดยไม่รวมรายงานที่ได้รับระหว่างเวลา 10:00 น. ถึง 11:00 น. ที่มีscheduled_report_time
อื่น (เช่น 9:00 น.)
ค่าประมาณสำหรับปริมาณรายงาน
- โครงสร้างหลัก 1: Conversion ที่มีการระบุแหล่งที่มา 50,000 รายการ / 2,160 รายการ (การรายงานรายชั่วโมง จำนวนชั่วโมงในไตรมาส) = รายงานสรุป 24 รายการต่อชั่วโมงต่อผู้ลงโฆษณา 1 ราย (ผู้ลงโฆษณา 24 x 1,000 = รายงานสรุป 24,000 ราย)
- โครงสร้างหลัก 2: Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการ / 2,160 รายการ (การรายงานรายชั่วโมง จำนวนชั่วโมงในไตรมาส) = รายงานสรุป 12 รายการต่อชั่วโมงต่อผู้ลงโฆษณา 1 ราย (ผู้ลงโฆษณา 12 x 1,000 = รายงานสรุป 12,000 ราย)
- โครงสร้างหลัก 3: ทำซ้ำ
- จำนวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 รายการสำหรับโครงสร้างหลัก 1 + 12 รายงานสรุปสำหรับโครงสร้างหลัก 2 + ... = ... ต่อชั่วโมง ต่อผู้ลงโฆษณา
สรุปความคิดเห็น
การทำความเข้าใจค่าประมาณจากเทคโนโลยีโฆษณาต่อไปนี้จะช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับการปรับขนาดตามข้อกำหนดของเทคโนโลยีโฆษณาได้ เราขอแนะนำให้คุณ โปรดแชร์ข้อความต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้ที่คำแนะนำเกี่ยวกับการปรับขนาดสำหรับบริการ Aggregation Service บน AWS
- จำนวนคีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวม) ต่องานบริการการรวม
- ปริมาณสูงสุดของรายงานอินพุตต่องาน (Conversion ที่มีการระบุแหล่งที่มา)
- การมีส่วนร่วมโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
- การกระจายโดยประมาณของ Conversion ที่มีการระบุแหล่งที่มาต่องาน
- การกระจายคีย์โดเมนโดยประมาณในงาน
- จำนวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์