เฟรมเวิร์กการทดสอบโหลดของบริการรวม

เรายินดีรับฟังความคิดเห็นของคุณเกี่ยวกับเอกสารนี้ขณะเตรียมความพร้อมเพื่อเพิ่มลงในที่เก็บคำแนะนำสาธารณะ

เราขอแนะนำให้เทคโนโลยีโฆษณาทดสอบโหลดกับการเข้าชมเวอร์ชันที่ใช้งานจริงทั้งหมด 100% ดังนี้

  1. เทคโนโลยีโฆษณาควรเข้าถึงการวัดผลการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
  2. เทคโนโลยีโฆษณาควรเป็นผู้ตัดสินใจด้านการออกแบบโดยลดเสียงรบกวน (ข้อมูลอ้างอิง: การจำลองการตัดสินใจด้านการออกแบบ)
  3. ขณะทดสอบ เทคโนโลยีโฆษณาควรติดตามจำนวนงานที่เรียกใช้ต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การกระจายปริมาณเหตุการณ์ Conversion โดยประมาณ และจำนวนคีย์รวมเป็นอินพุตต่องานการประมวลผล (ดูพารามิเตอร์งาน config_domain_blob_prefix ในเอกสารประกอบของ API การรวมบริการ) และเหตุการณ์ Conversion เฉลี่ยโดยประมาณต่อรายงานอินพุต
  4. สำหรับการทดสอบ เทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนำจากตารางคำแนะนำด้านขนาดตามขนาดงานที่คาดไว้ (เช่น ปริมาณรายงาน ขนาดโดเมน) และกำหนดขนาดของบริการรวมข้อมูลที่ทำให้ใช้งานได้ตามความเหมาะสม ข้อมูลอ้างอิง: คำแนะนำเกี่ยวกับขนาด สำหรับบริการรวมบน AWS
  5. เทคโนโลยีโฆษณาควรใช้งานการรวมสำหรับการทดสอบการโหลด

เป้าหมาย

คําแนะนํานี้มีไว้สำหรับการรวมการวัดการระบุแหล่งที่มาของ Conversion โดยเฉพาะ และจะมีวิธีการตั้งค่าและการกําหนดค่าที่สําคัญที่มีไว้เพื่อการใช้โดยเทคโนโลยีโฆษณาเพื่อวัตถุประสงค์ต่อไปนี้

  • ประมาณความคาดหวังของโหลดสำหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม
  • เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับประสิทธิภาพและสัญญาณรบกวนตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการแบ่งกลุ่มผู้ลงโฆษณา

วิชาบังคับก่อน

คู่มือนี้มีไว้สำหรับกลุ่มเป้าหมายเทคโนโลยีโฆษณา ก่อนทําตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการทำงานกับเสียงรบกวน สรุปผลการตัดสินใจออกแบบรายงาน และการทดลองกับ Bise Lab เพื่อให้ได้การกำหนดค่าที่เหมาะสมที่สุด

ขั้นตอน

1. กลยุทธ์การตั้งค่าคีย์การรวมเริ่มต้น

กำหนดจำนวนโครงสร้างหลักต่างๆ (เช่น ชุดมิติข้อมูล) ที่ต้องการโดยอิงตามประเภทธุรกิจและวัตถุประสงค์ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลดปัญหาในรายงานได้

จำนวนผู้ลงโฆษณาที่คุณมี
ตัวอย่างเช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย

ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
คุณควรประเมินความคล้ายคลึงกันโดยพิจารณาจากปริมาณ Conversion, มูลค่า Conversion ที่เกี่ยวข้อง และความครอบคลุมโดยทั่วไปของลักษณะเฉพาะของผู้ลงโฆษณา ยิ่งคุณสามารถจัดกลุ่มผลลัพธ์ที่คล้ายกันได้มากเท่าใด ผลลัพธ์ก็จะปรับแต่งอย่างละเอียดมากขึ้นเท่านั้น (เนื่องจากค่าความแปรปรวนของค่าเอาต์พุตน้อย) จึงช่วยลดผลกระทบของสัญญาณรบกวน โปรดดูรายละเอียดเพิ่มเติมที่การจัดการคีย์ขั้นสูง ตัวอย่างเช่น เทคโนโลยีโฆษณาสามารถแบ่งกลุ่มผู้ลงโฆษณาของตนตามอุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ดังนี้

  • อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ การค้าปลีกเพื่อการเติบโต)
  • ค่าใช้จ่าย (เช่น <$50,000/ไตรมาส, $50-$150,000/ไตรมาส, $150,000-$250,000/ไตรมาส)
  • ปริมาณ Conversion (ต่ำ ปานกลาง สูง)

จำนวนโครงสร้างหลักแบบรวมที่จะสร้าง
เช่น 27 (3x3x3) : 3 อุตสาหกรรม, 3 ประเภทการใช้จ่าย และ 3 การจัดกลุ่มสำหรับมูลค่า Conversion

2. ระบุมิติข้อมูลคีย์การรวม

ต่อไป ให้ระบุมิติข้อมูลสำคัญที่คุณต้องการติดตามทั้งสำหรับการแสดงผลและ Conversion เพื่อประมาณจำนวนคีย์แหล่งที่มาและคีย์ด้านข้างของทริกเกอร์

สำหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลสำคัญที่คุณต้องติดตามการแสดงผลจะช่วยกำหนดจำนวนคีย์ด้านข้างของแหล่งที่มา มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณาจากอันดับที่ 1 ด้านบน (เช่น อุตสาหกรรม การใช้จ่าย Conversion) ตัวอย่างต่อไปนี้ช่วยอธิบายมิติข้อมูล

  • โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)

    • ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 50 ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 20 รายการ) ประเภทอุปกรณ์ (เช่น 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น ความเป็นไปได้ 50 รายการ)
      1. ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ค่านี้แสดงถึงจำนวนชุดค่าผสมมิติข้อมูลที่เป็นไปได้สำหรับคีย์ด้านข้างของโครงสร้างคีย์ 1
      2. ต้องจองแบบ 18 บิต (18 บิต = 262,144 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างสำคัญ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)

    • ตอบ: มิติข้อมูล 4 รายการ ได้แก่ แคมเปญ (เช่น 30 ความเป็นไปได้) กลุ่มโฆษณา (เช่น ความเป็นไปได้ 80 รายการ) ประเภทโฆษณา (เช่น 3 ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
      1. ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ค่านี้แสดงถึงจำนวนชุดค่าผสมมิติข้อมูลที่เป็นไปได้หรือคีย์ด้านข้างแหล่งที่มาสำหรับโครงสร้างคีย์ 2
      2. ต้องจองแบบ 19 บิต (19 บิต) = 524,288 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างหลัก 3: ทำซ้ำ (วางแผนคล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)

สำหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลสำคัญที่คุณต้องติดตามสำหรับ Conversion จะช่วยกำหนดคีย์ด้านข้างของทริกเกอร์ เช่น

  • โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)

    • ตอบ: มิติข้อมูล 2 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100 รายการ), ประเภท Conversion (เช่น สาเหตุที่เป็นไปได้ 5 ประการ)
      1. ชุดค่าผสมของมิติข้อมูลที่เป็นไปได้ = 100 x 5 = 500
      2. ต้องจองแบบ 9 บิต (9 บิต = 512 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างสำคัญ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)

    • ตอบ: มิติข้อมูล 3 รายการ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50 ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
      1. ชุดค่าผสมของมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
      2. ต้องจองแบบ 11 บิต (11 บิต = 2,048 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างหลัก 3: ทำซ้ำ (วางแผนคล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)

ค่าประมาณสำหรับคีย์รวม

  • โครงสร้างหลัก 1: คีย์การแสดงผล 250,000 คีย์ x คีย์ Conversion 500 คีย์ = 125,000,000 คีย์
  • โครงสร้างหลัก 2: คีย์การแสดงผล 360,000 คีย์ x คีย์ Conversion 1.5k = 540,000,000 คีย์
  • โครงสร้างหลัก 3: (แผนที่คล้ายกันสำหรับโครงสร้างหลักทั้งหมดที่คุณมี)
  • ทำซ้ำสำหรับโครงสร้างหลักแต่ละรายการ
  • คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07B)

ปริมาณ Conversion ที่คาดไว้

สำหรับโครงสร้างคีย์การรวมแต่ละรายการ ปริมาณที่คาดไว้สามารถอธิบายได้โดยใช้ตัวอย่างต่อไปนี้

  • โครงสร้างหลัก 1: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ต่ำ)
    • ตอบ: คาดว่าโครงสร้างหลัก 1 จะ มีค่าใช้จ่ายของผู้ลงโฆษณาประมาณ 15,000,000 บาทในไตรมาสถัดไปในราคา CPM เฉลี่ยที่ 240 บาท คาดการณ์ไว้ว่าการแสดงผลนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้ง
    • คาดการณ์ว่าการแสดงผลเฉลี่ยต่ออัตรา Conversion ที่โครงสร้างหลัก 1 จะประกอบขึ้นในช่วงไตรมาสถัดไปคือ 0.08% ซึ่งส่งผลให้ต้องมี Conversion ที่มีการระบุแหล่งที่มา 50,000 รายการที่ต้องบันทึก สำหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจำนวนการซื้อ
  • โครงสร้างหลัก 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = น้อยกว่า 50,000, ปริมาณ Conversion = ปานกลาง)
    • ตอบ: คาดการณ์ไว้ว่าคีย์ 2 จะประกอบเป็นยอดใช้จ่าย ประมาณ 2,400,000 บาทในช่วงไตรมาสถัดไปในราคา CPM เฉลี่ยที่ 300 บาท ซึ่งคาดว่าจะทำให้มีการแสดงผล 80,000,000 ครั้งที่ต้องลงทะเบียน
    • คาดการณ์ว่าการแสดงผลเฉลี่ยต่ออัตรา Conversion ที่คีย์ 2 จะประกอบขึ้นเป็นในไตรมาสถัดไปคือ 0.03125% ซึ่งส่งผลให้ต้องมี Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการ สำหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจำนวนการซื้อ
  • ทำซ้ำสำหรับโครงสร้างหลักแต่ละรายการ

ความถี่ในการรายงานการแสดงโฆษณาและแบบกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**

สำหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณจะต้องส่งรายงาน Conversion เป็นประจำ เราขอแนะนำให้รวมเทคโนโลยีโฆษณาเป็นกลุ่มตามผู้ลงโฆษณา (เพื่อให้แยกข้อมูลต่อรายงานได้ง่ายดายยิ่งขึ้น) และใช้ช่อง shared_info.scheduled_report_time ของรายงานในการจัดกลุ่ม

  • A: รายชั่วโมง
  • B: รายวัน
  • C: รายสัปดาห์

Notes

  • สำหรับการจัดกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
  • การรวมกลุ่มบ่อยขึ้นจะรวมสัญญาณรบกวนที่สูงกว่าต่อกลุ่ม (โปรดดู: คำตัดสิน: ความถี่แบบกลุ่ม)

  • ตรวจสอบว่ากลุ่มใช้ช่อง scheduled_report_time ไม่ใช่ report arrival time เพื่อหลีกเลี่ยงข้อผิดพลาดเนื่องจากการจัดกลุ่มที่ไม่ถูกต้อง ตัวอย่างเช่น หากคุณจัดกลุ่มทุกชั่วโมง กลุ่มเวลา 11:00 น. ควรรวมเฉพาะรายงานที่มี scheduled_report_time ระหว่างเวลา 10:00 น. - 11:00 น. เท่านั้น โดยไม่รวมรายงานที่ได้รับระหว่างเวลา 10:00 น. ถึง 11:00 น. ที่มี scheduled_report_time อื่น (เช่น 9:00 น.)

ค่าประมาณสำหรับปริมาณรายงาน

  • โครงสร้างหลัก 1: Conversion ที่มีการระบุแหล่งที่มา 50,000 รายการ / 2,160 รายการ (การรายงานรายชั่วโมง จำนวนชั่วโมงในไตรมาส) = รายงานสรุป 24 รายการต่อชั่วโมงต่อผู้ลงโฆษณา 1 ราย (ผู้ลงโฆษณา 24 x 1,000 = รายงานสรุป 24,000 ราย)
  • โครงสร้างหลัก 2: Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการ / 2,160 รายการ (การรายงานรายชั่วโมง จำนวนชั่วโมงในไตรมาส) = รายงานสรุป 12 รายการต่อชั่วโมงต่อผู้ลงโฆษณา 1 ราย (ผู้ลงโฆษณา 12 x 1,000 = รายงานสรุป 12,000 ราย)
  • โครงสร้างหลัก 3: ทำซ้ำ
  • จำนวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 รายการสำหรับโครงสร้างหลัก 1 + 12 รายงานสรุปสำหรับโครงสร้างหลัก 2 + ... = ... ต่อชั่วโมง ต่อผู้ลงโฆษณา

สรุปความคิดเห็น

การทำความเข้าใจค่าประมาณจากเทคโนโลยีโฆษณาต่อไปนี้จะช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับการปรับขนาดตามข้อกำหนดของเทคโนโลยีโฆษณาได้ เราขอแนะนำให้คุณ โปรดแชร์ข้อความต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้ที่คำแนะนำเกี่ยวกับการปรับขนาดสำหรับบริการ Aggregation Service บน AWS

  • จำนวนคีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวม) ต่องานบริการการรวม
  • ปริมาณสูงสุดของรายงานอินพุตต่องาน (Conversion ที่มีการระบุแหล่งที่มา)
  • การมีส่วนร่วมโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
  • การกระจายโดยประมาณของ Conversion ที่มีการระบุแหล่งที่มาต่องาน
  • การกระจายคีย์โดเมนโดยประมาณในงาน
  • จำนวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์