นอยซ์แล็บ

เกี่ยวกับเอกสารนี้

เมื่ออ่านบทความนี้ คุณจะทำสิ่งต่อไปนี้ได้

  • ทำความเข้าใจว่าควรสร้างกลยุทธ์ใดก่อนที่จะสร้างรายงานสรุป
  • ทำความรู้จักกับ Noise Lab ซึ่งเป็นเครื่องมือที่ช่วยทำความเข้าใจผลกระทบจากพารามิเตอร์ต่างๆ ของสัญญาณรบกวน รวมทั้งช่วยให้สำรวจและประเมินกลยุทธ์การจัดการเสียงรบกวนต่างๆ ได้อย่างรวดเร็ว
ภาพหน้าจอของ Noise Lab
Noise Lab

แชร์ความคิดเห็น

แม้ว่าเอกสารนี้จะสรุปหลักการ 2-3 ข้อในการใช้รายงานสรุป แต่ก็มีหลายวิธีในการจัดการเสียงรบกวนที่อาจไม่แสดงที่นี่ เรายินดีรับฟังคำแนะนำ ข้อมูลเพิ่มเติม และคำถามของคุณ

  • หากต้องการแสดงความคิดเห็นต่อสาธารณะเกี่ยวกับกลยุทธ์การจัดการเสียงรบกวน ประโยชน์หรือความเป็นส่วนตัวของ API (epsilon) และแชร์การสังเกตการณ์เมื่อจำลองกับ Noise Lab โปรดแสดงความคิดเห็นเกี่ยวกับปัญหานี้
  • หากต้องการแสดงความคิดเห็นเกี่ยวกับ Noise Lab ต่อสาธารณะ (ถามคำถาม รายงานข้อบกพร่อง ส่งคำขอฟีเจอร์) ให้ทำดังนี้ สร้างรายการใหม่ที่นี่
  • หากต้องการแสดงความคิดเห็นเกี่ยวกับ API ในแง่มุมอื่นของสาธารณชน ให้ทำดังนี้ สร้างปัญหาใหม่ที่นี่

ก่อนจะเริ่ม

  1. อ่านข้อมูลเบื้องต้นได้ที่การรายงานการระบุแหล่งที่มา: รายงานสรุป และภาพรวมของระบบการรายงานการระบุแหล่งที่มาฉบับเต็ม
  2. ดูหัวข้อทำความเข้าใจข้อผิดพลาดและทำความเข้าใจแป้นการรวมเพื่อใช้คู่มือนี้ให้เกิดประโยชน์สูงสุด

ตัดสินใจเกี่ยวกับการออกแบบ

หลักการออกแบบหลัก

มีความแตกต่างพื้นฐานระหว่างวิธีการทำงานของคุกกี้ของบุคคลที่สามและรายงานสรุป ความแตกต่างที่สําคัญประการหนึ่งคือเสียงรบกวนที่เพิ่มลงในข้อมูลการวัดผลในรายงานสรุป อีกวิธีหนึ่งคือวิธีตั้งเวลารายงาน

หากต้องการเข้าถึงข้อมูลการวัดผลในรายงานสรุปที่มีอัตราส่วนสัญญาณต่อเสียงรบกวนสูงกว่า แพลตฟอร์มฝั่งดีมานด์ (DSP) และผู้ให้บริการการวัดโฆษณาจะต้องทำงานร่วมกับผู้ลงโฆษณาเพื่อพัฒนากลยุทธ์การจัดการเสียงรบกวน ในการพัฒนากลยุทธ์เหล่านี้ DSP และผู้ให้บริการการวัดผลต้องเป็นผู้ตัดสินใจเกี่ยวกับการออกแบบ การตัดสินใจเหล่านี้เกี่ยวข้องกับแนวคิดสำคัญข้อเดียว ดังนี้

ที่จริงแล้ว ค่าสัญญาณรบกวนการกระจายจะดึงมาจากพารามิเตอร์ 2 ตัวเท่านั้น⏤epsilon และงบประมาณการสนับสนุน⏤คุณมีการควบคุมอื่นๆ อีกจำนวนหนึ่งซึ่งจะส่งผลต่ออัตราส่วนสัญญาณต่อสัญญาณรบกวนของข้อมูลการวัดเอาต์พุต

แม้ว่าเราจะคาดหวังให้กระบวนการทำซ้ำที่จะนำไปสู่การตัดสินใจที่ดีที่สุด แต่รูปแบบแต่ละรูปแบบในการตัดสินใจเหล่านี้จะนำไปสู่การติดตั้งที่แตกต่างกันเล็กน้อย ดังนั้น การตัดสินใจเหล่านี้จึงต้องก่อนที่จะเขียนโค้ดซ้ำๆ แต่ละครั้ง (และก่อนที่จะแสดงโฆษณา)

การตัดสินใจ: รายละเอียดของมิติข้อมูล

ลองใช้งานใน Noise Lab

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของ "พารามิเตอร์" ให้ค้นหาข้อมูล Conversion
  3. สังเกตพารามิเตอร์เริ่มต้น โดยค่าเริ่มต้น จำนวน Conversion ที่ระบุแหล่งที่มาได้รายวัน TOTAL รายการคือ 1, 000 ค่าเฉลี่ยนี้จะอยู่ที่ประมาณ 40 ต่อที่เก็บข้อมูลหากคุณใช้การตั้งค่าเริ่มต้น (มิติข้อมูลเริ่มต้น จำนวนค่าเริ่มต้นที่แตกต่างกันที่เป็นไปได้สำหรับแต่ละมิติข้อมูล กลยุทธ์คีย์ A) โปรดสังเกตว่าค่าคือ 40 ในอินพุต จำนวน Conversion รายวันที่ระบุแหล่งที่มาโดยเฉลี่ยได้ต่อที่เก็บข้อมูล
  4. คลิก "จำลอง" เพื่อเรียกใช้การจำลองด้วยพารามิเตอร์เริ่มต้น
  5. ในแผงด้านข้างของ "พารามิเตอร์" ให้มองหามิติข้อมูล เปลี่ยนชื่อภูมิศาสตร์เป็นเมือง และเปลี่ยนจำนวนค่าต่างๆ ที่เป็นไปได้ให้เป็น 50
  6. สังเกตว่าสิ่งนี้เปลี่ยนแปลงจำนวน Conversion รายวันโดยเฉลี่ยที่ระบุแหล่งที่มาได้ต่อที่เก็บข้อมูลอย่างไร ตอนนี้ลดน้อยลงมากแล้ว ทั้งนี้เนื่องจากหากคุณเพิ่มจำนวนค่าที่เป็นไปได้ภายในมิติข้อมูลนี้โดยไม่เปลี่ยนแปลงสิ่งอื่นใด จะเป็นการเพิ่มจำนวนที่เก็บข้อมูลทั้งหมดโดยไม่เปลี่ยนจำนวนเหตุการณ์ Conversion ที่จะอยู่ในแต่ละที่เก็บข้อมูล
  7. คลิก "จำลอง"
  8. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้: ขณะนี้อัตราส่วนสัญญาณรบกวนสูงกว่าในการจำลองก่อนหน้านี้แล้ว

หลักการออกแบบหลักทำให้ค่าสรุปขนาดเล็กมีแนวโน้มที่จะเยอะกว่าค่าสรุปขนาดใหญ่ ดังนั้น ตัวเลือกการกำหนดค่าของคุณจึงมีผลต่อจำนวนเหตุการณ์ Conversion ที่มีการระบุแหล่งที่มาซึ่งจะอยู่ในแต่ละที่เก็บข้อมูล (หรือที่เรียกว่าคีย์การรวม) และจำนวนดังกล่าวจะมีผลต่อข้อผิดพลาดในรายงานสรุปผลลัพธ์สุดท้าย

การตัดสินใจด้านการออกแบบอย่างหนึ่งซึ่งส่งผลต่อจำนวนเหตุการณ์ Conversion ที่มีการระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือรายละเอียดของมิติข้อมูล ลองดูตัวอย่างต่อไปนี้ ของคีย์การรวมและมิติข้อมูล

  • วิธีที่ 1: โครงสร้างคีย์ 1 โครงสร้างที่มีขนาดหยาบ ได้แก่ ประเทศ x แคมเปญโฆษณา (หรือที่เก็บข้อมูลแคมเปญที่ใหญ่ที่สุด) x ประเภทผลิตภัณฑ์ (จากประเภทผลิตภัณฑ์ที่เป็นไปได้ 10 ประเภท)
  • วิธีที่ 2: โครงสร้างหลัก 1 โครงสร้างที่มีขนาดแบบละเอียด: เมือง x รหัสโฆษณา x ผลิตภัณฑ์ (จากผลิตภัณฑ์ที่เป็นไปได้ 100 รายการ)

เมือง มีมิติข้อมูลที่ละเอียดกว่าประเทศ รหัสครีเอทีฟโฆษณามีความละเอียดกว่าแคมเปญ และผลิตภัณฑ์มีความละเอียดกว่าประเภทผลิตภัณฑ์ ดังนั้นวิธีที่ 2 จะมีจำนวนเหตุการณ์ (Conversion) ต่อที่เก็บข้อมูล (= ต่อคีย์) ในผลลัพธ์รายงานสรุปน้อยกว่าวิธีที่ 1 เนื่องจากสัญญาณรบกวนที่เพิ่มลงในเอาต์พุตนี้ไม่สัมพันธ์กับจำนวนเหตุการณ์ในที่เก็บข้อมูล ข้อมูลการวัดในรายงานสรุปจะมีเสียงดังมากขึ้นเมื่อทำตามวิธีที่ 2 สำหรับผู้ลงโฆษณาแต่ละราย ให้ทดสอบข้อดีและข้อเสียต่างๆ ในการออกแบบคีย์เพื่อให้ได้ประโยชน์มากที่สุดในผลลัพธ์

การตัดสินใจ: โครงสร้างหลัก

ลองใช้งานใน Noise Lab

ในโหมดแบบง่าย ระบบจะใช้โครงสร้างคีย์เริ่มต้น ในโหมดขั้นสูง คุณสามารถทดสอบโครงสร้างคีย์ต่างๆ ตัวอย่างมิติข้อมูลมีบางส่วนรวมอยู่ด้วย ซึ่งคุณจะแก้ไขได้ด้วย

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์คีย์ ให้สังเกตว่ากลยุทธ์เริ่มต้นชื่อ A ในเครื่องมือนี้ใช้โครงสร้างคีย์แบบละเอียด 1 รายการที่มีมิติข้อมูลทั้งหมด ได้แก่ ภูมิศาสตร์ x รหัสแคมเปญ x หมวดหมู่ผลิตภัณฑ์
  3. คลิก "จำลอง"
  4. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้
  5. เปลี่ยนกลยุทธ์หลักเป็น B วิธีนี้จะแสดงการควบคุมเพิ่มเติมให้คุณกําหนดค่าโครงสร้างคีย์
  6. กำหนดค่าโครงสร้างคีย์ดังนี้
    1. จำนวนโครงสร้างหลัก: 2
    2. โครงสร้างหลัก 1 = ภูมิศาสตร์ x หมวดหมู่ผลิตภัณฑ์
    3. โครงสร้างคีย์ 2 = รหัสแคมเปญ x หมวดหมู่ผลิตภัณฑ์
  7. คลิก "จำลอง"
  8. คุณจะเห็นว่าตอนนี้คุณได้รับรายงานสรุป 2 ฉบับต่อเป้าหมายการวัดผล 2 ประเภท (2 ฉบับสำหรับจำนวนการซื้อ 2 ฉบับสำหรับมูลค่าการซื้อ) เนื่องจากคุณกำลังใช้โครงสร้างหลัก 2 แบบที่แตกต่างกัน สังเกตอัตราส่วนสัญญาณรบกวน
  9. หรือคุณจะลองใช้มิติข้อมูลที่กำหนดเองนี้ก็ได้ โดยมองหาข้อมูลที่คุณต้องการติดตาม: มิติข้อมูล ลองนำมิติข้อมูลตัวอย่างออก แล้วสร้างมิติข้อมูลของคุณเองโดยใช้ปุ่ม "เพิ่ม/นำออก/รีเซ็ต" ใต้มิติข้อมูลสุดท้าย

การตัดสินใจด้านการออกแบบอีกอย่างที่จะส่งผลต่อจำนวนเหตุการณ์ Conversion ที่มีการระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือโครงสร้างหลักที่คุณเลือกใช้ ดูตัวอย่างคีย์การรวมข้อมูลต่อไปนี้

  • ในโครงสร้างหลักเดียวที่มีมิติข้อมูลทั้งหมด เรียกว่ากลยุทธ์หลัก A
  • โครงสร้างหลัก 2 รายการ แต่ละรายการมีชุดย่อยของมิติข้อมูล เราเรียกสิ่งนี้ว่ากลยุทธ์หลัก B
แผนภาพ:

กลยุทธ์ A จะง่ายกว่า แต่คุณอาจต้องรวม (รวม) ค่าสรุปที่มีเสียงดังรบกวนซึ่งรวมอยู่ในรายงานสรุปเพื่อเข้าถึงข้อมูลเชิงลึกบางอย่าง การสรุปค่าเหล่านี้จะเป็นการรวมสัญญาณรบกวนด้วย เมื่อใช้กลยุทธ์ B ค่าสรุปที่แสดงในรายงานสรุปอาจให้ข้อมูลที่คุณต้องการอยู่แล้ว ซึ่งหมายความว่ากลยุทธ์ B มีแนวโน้มที่จะทำให้เกิดอัตราส่วนสัญญาณต่อเสียงรบกวนได้ดีกว่ากลยุทธ์ A อย่างไรก็ตาม กลยุทธ์ ก อาจยอมรับเสียงรบกวนอยู่แล้ว คุณจึงอาจต้องเลือกว่ากลยุทธ์ ก. นั้นเรียบง่ายกว่า ดูข้อมูลเพิ่มเติมในตัวอย่างโดยละเอียดที่อธิบายกลยุทธ์ 2 รายการนี้

การจัดการคีย์เป็นหัวข้อที่ลึกซึ้ง เทคนิคที่ซับซ้อนมากมายอาจนำไปใช้ได้เพื่อปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน โดยจะมีคำอธิบายอยู่ในการจัดการคีย์ขั้นสูง

การตัดสินใจ: ความถี่ในการจัดกลุ่ม

ลองใช้งานใน Noise Lab

  1. ไปที่โหมดแบบง่าย (หรือโหมดขั้นสูง) ทั้ง 2 โหมดจะทำงานในลักษณะเดียวกันสำหรับความถี่ในการจัดกลุ่ม)
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวมของคุณ > ความถี่ในการจัดกลุ่ม หมายถึงความถี่การแยกกลุ่มของรายงานที่รวบรวมไว้ได้ซึ่งประมวลผลด้วยบริการรวบรวมข้อมูลในงานเดียว
  3. สังเกตความถี่การทำงานเป็นกลุ่มเริ่มต้น โดยค่าเริ่มต้นจะมีการจำลองความถี่ของการจัดกลุ่มรายวัน
  4. คลิก "จำลอง"
  5. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้
  6. เปลี่ยนความถี่ในการจัดกลุ่มเป็นรายสัปดาห์
  7. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้: ตอนนี้อัตราส่วนสัญญาณรบกวนจะต่ำกว่า (ดีกว่า) ในการจำลองก่อนหน้านี้

การตัดสินใจด้านการออกแบบอีกอย่างหนึ่งที่จะส่งผลต่อจำนวนเหตุการณ์ Conversion ที่มีการระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือความถี่ของการจัดกลุ่มโฆษณาที่คุณเลือกใช้ ความถี่ในการจัดกลุ่มคือความถี่ที่คุณประมวลผลรายงานที่รวบรวมได้

รายงานที่กำหนดเวลารวบรวมข้อมูลบ่อยกว่า (เช่น แต่ละชั่วโมง) จะมีเหตุการณ์ Conversion รวมอยู่น้อยกว่ารายงานเดียวกันโดยมีกำหนดการรวบรวมข้อมูลไม่บ่อยเท่า (เช่น แต่ละสัปดาห์) ด้วยเหตุนี้ รายงานรายชั่วโมงจะมีเสียงรบกวนมากขึ้น``` จะมีเหตุการณ์ Conversion รวมน้อยกว่ารายงานเดียวกันโดยมีกำหนดการรวมไม่บ่อยนัก (เช่น แต่ละสัปดาห์) ด้วยเหตุนี้ รายงานรายชั่วโมงจะมีอัตราส่วนสัญญาณต่อเสียงรบกวนต่ำกว่ารายงานรายสัปดาห์ หากปัจจัยอื่นทั้งหมดเหมือนกัน ทดสอบข้อกําหนดในการรายงานโดยใช้ความถี่ต่างๆ และประเมินอัตราส่วนสัญญาณต่อสัญญาณรบกวนของสัญญาณแต่ละแบบ

ดูข้อมูลเพิ่มเติมในการรวมกลุ่มและการรวมในช่วงเวลาที่นานขึ้น

การตัดสินใจ: ตัวแปรของแคมเปญที่ส่งผลต่อ Conversion ที่ระบุแหล่งที่มาได้

ลองใช้งานใน Noise Lab

แม้ว่าการดำเนินการนี้อาจคาดการณ์ได้ยากและอาจมีการเพิ่มความแตกต่างอย่างมากจากผลกระทบตามฤดูกาล แต่ให้พยายามประมาณจำนวน Conversion ที่ระบุแหล่งที่มาได้ด้วยช่องทางติดต่อเพียงครั้งเดียวต่อวันให้มีค่าใกล้เคียงที่สุด 10: 10, 100, 1,000 หรือ 10,000

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของ "พารามิเตอร์" ให้ค้นหาข้อมูล Conversion
  3. สังเกตพารามิเตอร์เริ่มต้น โดยค่าเริ่มต้น จำนวน Conversion ที่ระบุแหล่งที่มาได้รายวัน TOTAL รายการคือ 1, 000 ค่าเฉลี่ยนี้จะอยู่ที่ประมาณ 40 ต่อที่เก็บข้อมูลหากคุณใช้การตั้งค่าเริ่มต้น (มิติข้อมูลเริ่มต้น จำนวนค่าเริ่มต้นที่แตกต่างกันที่เป็นไปได้สำหรับแต่ละมิติข้อมูล กลยุทธ์คีย์ A) โปรดสังเกตว่าค่าคือ 40 ในอินพุต จำนวน Conversion รายวันที่ระบุแหล่งที่มาโดยเฉลี่ยได้ต่อที่เก็บข้อมูล
  4. คลิก "จำลอง" เพื่อเรียกใช้การจำลองด้วยพารามิเตอร์เริ่มต้น
  5. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้
  6. ต่อไปให้ตั้งค่าจำนวน Conversion ที่ระบุแหล่งที่มาได้รายวันทั้งหมดเป็น 100 โปรดทราบว่าวิธีนี้จะลดมูลค่าของจำนวน Conversion รายวันโดยเฉลี่ยที่ระบุแหล่งที่มาได้ต่อ BUCKET
  7. คลิก "จำลอง"
  8. โปรดสังเกตว่าตอนนี้อัตราส่วนสัญญาณรบกวนสูงขึ้น นั่นเป็นเพราะเมื่อคุณมี Conversion ต่อที่เก็บข้อมูลน้อยลง ระบบจะใช้สัญญาณรบกวนมากขึ้นเพื่อรักษาความเป็นส่วนตัว

ข้อแตกต่างที่สำคัญคือจำนวน Conversion ที่เป็นไปได้ทั้งหมดสำหรับผู้ลงโฆษณา เทียบกับจำนวน Conversion ทั้งหมดที่มีการระบุแหล่งที่มาที่เป็นไปได้ ข้อหลังคือสิ่งที่ส่งผลต่อสัญญาณรบกวนในรายงานสรุปในที่สุด Conversion ที่มีการระบุแหล่งที่มาเป็นชุดย่อยของ Conversion ทั้งหมดที่มีแนวโน้มว่าจะเกิดตัวแปรของแคมเปญ เช่น งบประมาณโฆษณาและการกำหนดเป้าหมายโฆษณา ตัวอย่างเช่น คุณอาจคาดหวังว่าจะได้รับ Conversion ที่มีการระบุแหล่งที่มามากกว่าสำหรับแคมเปญโฆษณามูลค่า 10 ล้านดอลลาร์สหรัฐ เมื่อเทียบกับแคมเปญโฆษณามูลค่า 1 หมื่นดอลลาร์สหรัฐ โดยที่ปัจจัยอื่นๆ ทั้งหมดก็เท่ากัน

สิ่งที่จะต้องพิจารณามีดังนี้

  • ประเมิน Conversion ที่มีการระบุแหล่งที่มาโดยใช้รูปแบบการระบุแหล่งที่มาของอุปกรณ์แบบแตะเดียว เนื่องจากอยู่ภายในขอบเขตของรายงานสรุปที่รวบรวมด้วย Attribution Reporting API
  • พิจารณาทั้งจำนวนกรณีที่แย่ที่สุดและจำนวนกรณีที่ดีที่สุดสำหรับ Conversion ที่มีการระบุแหล่งที่มา ตัวอย่างเช่น หากปัจจัยอื่นทั้งหมดเหมือนกัน ให้พิจารณางบประมาณแคมเปญขั้นต่ำและสูงสุดที่เป็นไปได้สำหรับผู้ลงโฆษณา แล้วคาดการณ์ Conversion ที่ระบุแหล่งที่มาได้สำหรับทั้ง 2 ผลลัพธ์เพื่อเป็นข้อมูลสำหรับการจำลองของคุณ
  • หากคุณกำลังพิจารณาใช้ Android Privacy Sandbox ให้พิจารณา Conversion ที่มีการระบุแหล่งที่มาข้ามแพลตฟอร์มในการคำนวณ

การตัดสินใจ: การใช้การปรับขนาด

ลองใช้งานใน Noise Lab

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวมของคุณ > การปรับขนาด โดยค่าเริ่มต้น จะมีการตั้งค่าเป็น "ใช่"
  3. หากต้องการทำความเข้าใจผลในเชิงบวกของการปรับขนาดต่ออัตราส่วนสัญญาณรบกวน ให้ตั้งค่าการปรับขนาดเป็น "ไม่" ก่อน
  4. คลิก "จำลอง"
  5. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้
  6. ตั้งค่าการปรับขนาดเป็น "ใช่" โปรดทราบว่า Noise Lab จะคำนวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติโดยกำหนดช่วง (ค่าเฉลี่ยและค่าสูงสุด) ของเป้าหมายการวัดสำหรับสถานการณ์ของคุณ ในการตั้งค่าการทดลองใช้ระบบจริงหรือจากต้นทาง คุณจะต้องใช้การคำนวณของคุณเองสำหรับปัจจัยการปรับขนาด
  7. คลิก "จำลอง"
  8. โปรดสังเกตว่าตอนนี้อัตราส่วนสัญญาณรบกวนต่ำลง (ดีขึ้น) ในการจำลองที่ 2 นี้ เนื่องจากคุณกำลังใช้การปรับขนาด

หลักการออกแบบหลักทำให้ตัวแปรที่เพิ่มเป็นฟังก์ชันของงบประมาณการสนับสนุน

ดังนั้น หากต้องการเพิ่มอัตราส่วนสัญญาณต่อเสียงรบกวน คุณตัดสินใจเปลี่ยนรูปแบบค่าที่รวบรวมระหว่างเหตุการณ์ Conversion ได้โดยปรับขนาดค่าเหล่านั้นเทียบกับงบประมาณการสนับสนุน (และยกเลิกการปรับขนาดหลังจากการรวม) ใช้การปรับขนาดเพื่อเพิ่มอัตราส่วนสัญญาณต่อเสียงรบกวน

การตัดสินใจ: จํานวนเป้าหมายการวัดผลและการแบ่งงบประมาณด้านความเป็นส่วนตัว

ซึ่งเกี่ยวข้องกับการปรับขนาด โปรดอ่านการใช้การปรับขนาด

ลองใช้งานใน Noise Lab

เป้าหมายการวัดคือจุดข้อมูลที่แตกต่างกันซึ่งรวบรวมในเหตุการณ์ Conversion

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของ "พารามิเตอร์" ให้มองหาข้อมูลที่คุณต้องการติดตาม ซึ่งได้แก่ เป้าหมายการวัดผล โดยค่าเริ่มต้น คุณมีเป้าหมายการวัดผล 2 อย่าง ได้แก่ มูลค่าการซื้อและจำนวนการซื้อ
  3. คลิก "จำลอง" เพื่อเรียกใช้การจำลองที่มีเป้าหมายเริ่มต้น
  4. คลิก "นำออก" ซึ่งจะนําเป้าหมายการวัดสุดท้ายออก (จํานวนการซื้อในกรณีนี้)
  5. คลิก "จำลอง"
  6. คุณจะเห็นว่าอัตราส่วนสัญญาณรบกวนสำหรับมูลค่าการซื้อลดลง (ดีกว่า) ในการจำลองครั้งที่ 2 นี้ เนื่องจากคุณมีเป้าหมายการวัดผลน้อยกว่า ดังนั้นตอนนี้เป้าหมายการวัดผลรายการเดียวจะได้รับงบประมาณการมีส่วนร่วมทั้งหมด
  7. คลิก "รีเซ็ต" ตอนนี้คุณมีเป้าหมายการวัดผล 2 รายการอีกครั้งแล้ว ได้แก่ มูลค่าการซื้อและจำนวนการซื้อ โปรดทราบว่า Noise Lab จะคำนวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติโดยกำหนดช่วง (ค่าเฉลี่ยและค่าสูงสุด) ของเป้าหมายการวัดสำหรับสถานการณ์ของคุณ โดยค่าเริ่มต้น Noise Lab จะแบ่งงบประมาณให้เท่ากับเป้าหมายการวัดผล
  8. คลิก "จำลอง"
  9. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้ จดบันทึกปัจจัยการปรับขนาดที่แสดงในการจำลอง
  10. ตอนนี้เรามาปรับแต่งการแบ่งงบประมาณความเป็นส่วนตัวเพื่อให้ได้อัตราส่วนสัญญาณต่อเสียงรบกวนที่ดียิ่งขึ้นกัน
  11. ปรับ % ของงบประมาณที่กำหนดไว้สําหรับเป้าหมายการวัดผลแต่ละรายการ เมื่อใช้พารามิเตอร์เริ่มต้น เป้าหมายการวัดที่ 1 (ซึ่งก็คือมูลค่าการซื้อ) มีช่วงที่กว้างขึ้น (ระหว่าง 0 ถึง 1,000) มากกว่าเป้าหมายการวัดที่ 2 ซึ่งได้แก่ จํานวนการซื้อ (ระหว่าง 1 ถึง 1 ซึ่งหมายความว่าจะเท่ากับ 1 เสมอ) ด้วยเหตุนี้ ระบบจึงต้องมี "พื้นที่ในการปรับขนาดมากขึ้น" คุณจึงควรกำหนดงบประมาณการมีส่วนร่วมให้กับเป้าหมายการวัดที่ 1 ให้มากกว่าเป้าหมายการวัดที่ 2 เพื่อให้สามารถปรับขนาดได้อย่างมีประสิทธิภาพมากขึ้น (ดูการปรับขนาด) และด้วยเหตุนี้
  12. กำหนดงบประมาณ 70% ให้กับเป้าหมายการวัดผล 1 กำหนด 30% ให้กับเป้าหมายการวัดผล 2.
  13. คลิก "จำลอง"
  14. สังเกตอัตราส่วนสัญญาณรบกวนของการจำลองที่ได้ สำหรับมูลค่าการซื้อ ตอนนี้อัตราส่วนสัญญาณรบกวนนั้นต่ำกว่า (ดีกว่า) ในการจำลองก่อนหน้านี้อย่างเห็นได้ชัด สำหรับจำนวนการซื้อ จะไม่มีการเปลี่ยนแปลงโดยประมาณ
  15. คอยปรับแต่งการแบ่งงบประมาณตามเมตริกต่างๆ สังเกตว่าสิ่งนี้ส่งผลต่อเสียงรบกวนอย่างไร

โปรดทราบว่าคุณสามารถกำหนดเป้าหมายการวัดที่กำหนดเองได้โดยใช้ปุ่มเพิ่ม/นำออก/รีเซ็ต


หากคุณวัดจุดข้อมูล 1 จุด (เป้าหมายการวัด) ในเหตุการณ์ Conversion เช่น จํานวน Conversion จุดข้อมูลนั้นจะได้รับงบประมาณการมีส่วนร่วมทั้งหมด (65536) หากคุณตั้งเป้าหมายการวัดผลไว้หลายรายการในเหตุการณ์ Conversion หนึ่งๆ เช่น จำนวน Conversion และมูลค่าการซื้อ จุดข้อมูลเหล่านั้นก็จะต้องแชร์งบประมาณการมีส่วนร่วม ซึ่งหมายความว่าคุณมีโอกาสในการเพิ่มคุณค่า น้อยลง

ดังนั้น ยิ่งคุณมีเป้าหมายในการวัดผลมากเท่าใด อัตราส่วนของสัญญาณต่อเสียงรบกวนก็จะยิ่งต่ำลงเท่านั้น (สัญญาณรบกวนสูง)

อีกสิ่งหนึ่งในการตัดสินใจเกี่ยวกับเป้าหมายการวัดผลคือการแบ่งงบประมาณ หากคุณแบ่งงบประมาณการมีส่วนร่วมในจุดข้อมูล 2 จุดเท่าๆ กัน แต่ละจุดข้อมูลจะได้รับงบประมาณ 65536/2 = 32768 วิธีนี้อาจมีประสิทธิภาพสูงสุดหรือไม่ก็ได้ ขึ้นอยู่กับค่าสูงสุดที่เป็นไปได้สำหรับแต่ละจุดข้อมูล เช่น หากคุณวัดจำนวนการซื้อที่มีค่าสูงสุดที่ 1 และมูลค่าการซื้อขั้นต่ำที่ 1 และสูงสุด 120 มูลค่าการซื้อจะได้รับการเพิ่มขนาด "พื้นที่มากขึ้น" กล่าวคือ ได้รับสัดส่วนงบประมาณการมีส่วนร่วมมากขึ้น คุณจะเห็นว่าควรให้ความสำคัญกับเป้าหมายการวัดผลบางรายการมากกว่าเป้าหมายอื่นๆ ที่เกี่ยวข้องกับผลกระทบของสัญญาณรบกวนหรือไม่

ตัดสินใจ: การจัดการค่าผิดปกติ

ลองใช้งานใน Noise Lab

เป้าหมายการวัดคือจุดข้อมูลที่แตกต่างกันซึ่งรวบรวมในเหตุการณ์ Conversion

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวมของคุณ > การปรับขนาด
  3. ตรวจสอบว่าได้ตั้งค่าการปรับขนาดเป็น "ใช่" โปรดทราบว่า Noise Lab จะคำนวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติ โดยอิงตามช่วง (ค่าเฉลี่ยและค่าสูงสุด) ที่คุณระบุสำหรับเป้าหมายการวัด
  4. สมมติว่าการซื้อที่ใหญ่ที่สุดเท่าที่เคยมีมาคือ 60,000 บาท แต่การซื้อส่วนใหญ่เกิดขึ้นในช่วง 300-3,600 บาท ก่อนอื่น เรามาดูกันว่าจะเกิดอะไรขึ้นหากเราใช้วิธีการปรับขนาดตามตัวอักษร (ไม่แนะนำ) ให้ป้อน $2, 000 เป็นมูลค่าสูงสุดของ purchaseValue
  5. คลิก "จำลอง"
  6. โปรดสังเกตว่าอัตราส่วนสัญญาณรบกวนอยู่ในระดับสูง เนื่องจากปัจจุบันปัจจัยการปรับขนาดของเราคำนวณจาก $2, 000 ซึ่งในความเป็นจริงแล้วมูลค่าการซื้อส่วนใหญ่ไม่ได้ต่ำกว่านั้นอย่างเห็นได้ชัด
  7. ตอนนี้ เราจะใช้วิธีการปรับขนาดในทางปฏิบัติมากขึ้น แล้วเปลี่ยนมูลค่าการซื้อสูงสุดเป็น $120
  8. คลิก "จำลอง"
  9. โปรดสังเกตว่าอัตราส่วนสัญญาณรบกวนต่ำลง (ดีกว่า) ในการจำลองที่ 2 นี้

หากต้องการใช้การปรับขนาด โดยทั่วไปคุณจะคำนวณปัจจัยการปรับขนาดตามค่าสูงสุดที่เป็นไปได้สำหรับเหตุการณ์ Conversion หนึ่งๆ (ดูข้อมูลเพิ่มเติมในตัวอย่างนี้)

อย่างไรก็ตาม โปรดหลีกเลี่ยงการใช้ค่าสูงสุดตามตัวอักษรเพื่อคำนวณปัจจัยการปรับขนาดนั้น เนื่องจากจะทำให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนแย่ลง แต่ให้นำค่าผิดปกติออกและใช้ ค่าสูงสุดเชิงปฏิบัติ

การจัดการ Outlier เป็นหัวข้อที่ลึกซึ้ง เทคนิคที่ซับซ้อนมากมายอาจนำไปใช้ได้เพื่อปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน โดยจะมีคำอธิบายอยู่ใน การจัดการค่าผิดปกติขั้นสูง

ขั้นตอนถัดไป

เมื่อได้ประเมินกลยุทธ์การจัดการสัญญาณรบกวนต่างๆ สำหรับกรณีการใช้งานแล้ว คุณก็พร้อมที่จะเริ่มทดลองใช้รายงานสรุปโดยรวบรวมข้อมูลการวัดจริงผ่านช่วงทดลองใช้จากต้นทาง ดูคำแนะนำและเคล็ดลับในการลองใช้ API

ภาคผนวก

ทัวร์ชมสั้นๆ เกี่ยวกับ Noise Lab

Noise Lab ช่วยให้คุณประเมิน และเปรียบเทียบกลยุทธ์การจัดการเสียงรบกวนได้อย่างรวดเร็ว ใช้เพื่อ

  • ทำความเข้าใจพารามิเตอร์หลักที่อาจส่งผลต่อสัญญาณรบกวนและผลกระทบที่มี
  • จำลองผลกระทบของนอยส์ที่มีต่อข้อมูลการวัดเอาต์พุตตามการตัดสินใจในการออกแบบที่แตกต่างกัน ปรับพารามิเตอร์การออกแบบจนกว่าจะได้อัตราส่วนสัญญาณต่อเสียงรบกวนที่เหมาะกับกรณีการใช้งานของคุณ
  • โปรดแชร์ความคิดเห็นเกี่ยวกับประโยชน์ของรายงานสรุป เช่น ค่าใดของ epsilon และพารามิเตอร์ Noise ที่ไม่เหมาะสำหรับคุณ และค่าใดไม่เหมาะกับคุณ จุดผันผวนอยู่ที่ไหน

ให้คิดเสมือนว่าเป็นขั้นตอนการเตรียมพร้อม Noise Lab จะสร้างข้อมูลการวัดเพื่อจำลองผลลัพธ์ของรายงานสรุปตามข้อมูลที่คุณป้อน โดยจะไม่มีการลบหรือแชร์ข้อมูลใดๆ

Noise Lab มี 2 โหมดที่แตกต่างกัน ดังนี้

  1. โหมดเรียบง่าย: ทำความเข้าใจพื้นฐานของการควบคุมที่คุณมีต่อสัญญาณรบกวน
  2. โหมดขั้นสูง: ทดสอบกลยุทธ์การจัดการสัญญาณรบกวนต่างๆ และประเมินว่ากลยุทธ์ใดทำให้เกิดอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดีที่สุดสำหรับกรณีการใช้งานของคุณ

คลิกปุ่มในเมนูด้านบนเพื่อสลับระหว่าง 2 โหมด (#1. ในภาพหน้าจอด้านล่าง)

โหมดง่าย
  • เมื่อใช้โหมดแบบง่าย คุณจะควบคุมพารามิเตอร์ต่างๆ (อยู่ทางด้านซ้ายหรือ #2. ในภาพหน้าจอด้านล่าง) เช่น Epsilon และดูว่าพารามิเตอร์เหล่านี้ส่งผลต่อสัญญาณรบกวนอย่างไร
  • พารามิเตอร์แต่ละรายการมีเคล็ดลับเครื่องมือ (ปุ่ม "?") คลิกรายการเหล่านี้เพื่อดูคำอธิบายของแต่ละพารามิเตอร์ (#3 ในภาพหน้าจอด้านล่าง)
  • หากต้องการเริ่มต้น ให้คลิกปุ่ม "จำลอง" และสังเกตดูว่าเอาต์พุตเป็นอย่างไร (#4. ในภาพหน้าจอด้านล่าง)
  • ในส่วน เอาต์พุต คุณจะเห็นรายละเอียดต่างๆ โดยองค์ประกอบบางอย่างจะมีเครื่องหมาย "?" อยู่ข้างๆ ใช้เวลาคลิก "?" แต่ละรายการเพื่อดูคำอธิบายของข้อมูลส่วนต่างๆ
  • ในส่วนเอาต์พุต ให้คลิกปุ่มสลับ "รายละเอียด" หากต้องการดูตารางเวอร์ชันขยาย (#5. ในภาพหน้าจอด้านล่าง)
  • ใต้ตารางข้อมูลแต่ละรายการในส่วนเอาต์พุตจะมีตัวเลือกให้ดาวน์โหลดตารางเพื่อใช้งานแบบออฟไลน์ นอกจากนี้ ที่มุมขวาล่าง ยังมีตัวเลือกในการดาวน์โหลดตารางข้อมูลทั้งหมด (#6. ในภาพหน้าจอด้านล่าง)
  • ทดสอบการตั้งค่าต่างๆ สำหรับพารามิเตอร์ในส่วนพารามิเตอร์ แล้วคลิก "จำลอง" เพื่อดูผลกระทบต่อผลลัพธ์ ดังนี้
    เสียงรบกวน
    อินเทอร์เฟซ Noise Lab สำหรับโหมดแบบง่าย
โหมดขั้นสูง
  • ในโหมดขั้นสูง คุณจะควบคุมพารามิเตอร์ได้มากขึ้น คุณสามารถเพิ่มเป้าหมายการวัดและมิติข้อมูลที่กำหนดเอง (#1 และ #2. ในภาพหน้าจอด้านล่าง)
  • เลื่อนลงในส่วนพารามิเตอร์แล้วดูตัวเลือกกลยุทธ์หลัก ซึ่งใช้เพื่อทดสอบโครงสร้างคีย์ต่างๆ ได้ (#3 ในภาพหน้าจอด้านล่าง)
    • หากต้องการทดสอบโครงสร้างหลักต่างๆ ให้เปลี่ยนกลยุทธ์หลักเป็น "B"
    • ป้อนจำนวนโครงสร้างคีย์ต่างๆ ที่ต้องการใช้ (ค่าเริ่มต้นคือ "2")
    • คลิก สร้างโครงสร้างหลัก
    • คุณจะเห็นตัวเลือกเพื่อระบุโครงสร้างคีย์โดยคลิกช่องทำเครื่องหมายข้างคีย์ที่ต้องการรวมไว้สำหรับโครงสร้างคีย์แต่ละโครงสร้าง
    • คลิก "จำลอง" เพื่อดูเอาต์พุต
      โหมดขั้นสูงมีการควบคุมเป้าหมายการวัดผลและมิติข้อมูลที่จะติดตาม โดยไฮไลต์ไว้ในแถบด้านข้าง
      อินเทอร์เฟซ Noise Lab สำหรับโหมดขั้นสูง
      โหมดขั้นสูงยังเป็นตัวเลือกกลยุทธ์หลักในส่วนพารามิเตอร์ของแถบด้านข้างด้วย
      อินเทอร์เฟซ Noise Lab สำหรับโหมดขั้นสูง

เมตริกเสียงรบกวน

แนวคิดหลัก

ระบบจะเพิ่มเสียงรบกวนเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้แต่ละราย

ค่าสัญญาณรบกวนสูงบ่งชี้ว่าที่เก็บข้อมูล/คีย์มีปริมาณน้อยและมีการมีส่วนร่วมจากเหตุการณ์ที่มีความละเอียดอ่อนจำนวนจำกัด Noise Lab ทำงานโดยอัตโนมัติเพื่อให้ผู้คนสามารถ "ซ่อนตัวในฝูงชน" หรือกล่าวอีกนัยหนึ่งคือ ปกป้องความเป็นส่วนตัวของผู้ใช้ที่จำกัดเหล่านี้ด้วยการใช้เสียงรบกวนที่มากขึ้น

ค่าสัญญาณรบกวนต่ำบ่งบอกว่าการตั้งค่าข้อมูลออกแบบมาในลักษณะที่เปิดโอกาสให้ผู้ใช้ "ซ่อนตัวในฝูงชน" ได้อยู่แล้ว ซึ่งหมายความว่าที่เก็บข้อมูลมีการมีส่วนร่วมจากเหตุการณ์ในจำนวนที่เพียงพอเพื่อให้แน่ใจว่าความเป็นส่วนตัวของผู้ใช้แต่ละรายจะได้รับการปกป้อง

คำสั่งนี้เป็นจริงสำหรับทั้งข้อผิดพลาดเปอร์เซ็นต์เฉลี่ย (APE) และ RMSRE_T (ข้อผิดพลาดสัมพัทธ์ของรากค่าเฉลี่ยกำลังสองที่มีเกณฑ์)

APE (เปอร์เซ็นต์ข้อผิดพลาดเฉลี่ย)

APE คืออัตราส่วนของสัญญาณรบกวนสัญญาณ ซึ่งหมายถึงค่าสรุปที่แท้จริงp> ค่า APE ที่ต่ำกว่าหมายถึงอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดีกว่า

สูตร

สําหรับรายงานสรุปหนึ่งๆ จะมีการคำนวณ APE ดังต่อไปนี้

สมการของ APE ต้องระบุค่าสัมบูรณ์ เนื่องจากสัญญาณรบกวนอาจเป็นลบได้

True คือค่าสรุปที่แท้จริง APE คือค่าเฉลี่ยของเสียงรบกวนจากค่าสรุปจริงแต่ละค่า ซึ่งเป็นค่าเฉลี่ยของข้อมูลทั้งหมดในรายงานสรุป ใน Noise Lab จะต้องคูณกับ 100 เพื่อหาเปอร์เซ็นต์

ข้อดีและข้อเสีย

ที่เก็บข้อมูลที่มีขนาดเล็กจะส่งผลกระทบกับค่าสุดท้ายของ APE ในสัดส่วนที่ไม่เหมาะสม ข้อมูลนั้นอาจทำให้เข้าใจผิดเมื่อประเมินสัญญาณรบกวน นี่จึงเป็นเหตุผลที่เราเพิ่มเมตริก RMSRE_T อีกรายการที่ออกแบบมาเพื่อลดข้อจำกัดของ APE นี้ ดูรายละเอียดในตัวอย่าง

รหัส

ตรวจสอบซอร์สโค้ด สำหรับการคำนวณ APE

RMSRE_T (ข้อผิดพลาดสัมพัทธ์ของรากค่าเฉลี่ยกำลังสองที่มีเกณฑ์)

RMSRE_T (ข้อผิดพลาดสัมพัทธ์รากของค่าเฉลี่ยกำลังสองที่มีเกณฑ์) เป็นอีกการวัดหนึ่งสำหรับสัญญาณรบกวน

วิธีตีความ RMSRE_T

ค่า RMSRE_T ที่ต่ำกว่าจะทำให้อัตราส่วนสัญญาณต่อเสียงรบกวนดีขึ้น
ตัวอย่างเช่น หากอัตราส่วนสัญญาณรบกวนที่ยอมรับได้สำหรับกรณีการใช้งานของคุณคือ 20% และ RMSRE_T เท่ากับ 0.2 คุณก็มั่นใจได้ว่าระดับเสียงรบกวนจะอยู่ในช่วงที่ยอมรับได้

สูตร

สำหรับรายงานสรุปที่ระบุ RMSRE_T จะคำนวณดังนี้

สูตร
สมการของ RMSRE_T ต้องระบุค่าสัมบูรณ์ เนื่องจากสัญญาณรบกวนอาจเป็นลบได้
ข้อดีและข้อเสีย

RMSRE_T เข้าใจยากกว่า APE เล็กน้อย อย่างไรก็ตาม วิธีนี้มีข้อได้เปรียบบางประการที่ทำให้เครื่องมือดังกล่าวเหมาะกับการวิเคราะห์สัญญาณรบกวนในรายงานสรุปในบางกรณีมากกว่า APE ดังนี้

  • RMSRE_T เสถียรกว่า "T" คือเกณฑ์ "T" ใช้เพื่อให้น้ำหนักในการคำนวณ RMSRE_T น้อยลงแก่ที่เก็บข้อมูลที่มี Conversion น้อยกว่า ดังนั้นจึงมีความไวต่อสัญญาณรบกวนมากกว่าเนื่องจากมีขนาดเล็ก เมื่อใช้ T เมตริกจะไม่เพิ่มขึ้นอย่างรวดเร็วในที่เก็บข้อมูลที่มี Conversion เพียงไม่กี่รายการ หาก T เท่ากับ 5 ระบบจะไม่แสดงค่าสัญญาณรบกวนที่มีเพียง 1 ในที่เก็บข้อมูลที่มี Conversion เป็น 0 ระบบจะไม่แสดงว่ามีค่ามากกว่า 1 แต่จะถูกจํากัดไว้ที่ 0.2 ซึ่งเท่ากับ 1/5 เนื่องจาก T เท่ากับ 5 เมตริกนี้มีความเสถียรมากขึ้น และทำให้เปรียบเทียบการจำลอง 2 รายการได้ง่ายขึ้นด้วยการให้น้ำหนักกับที่เก็บข้อมูลขนาดเล็กลงซึ่งทำให้ไวต่อสัญญาณรบกวนมากกว่า
  • RMSRE_T ช่วยให้สามารถรวบรวมข้อมูลได้ง่าย การทราบ RMSRE_T ของที่เก็บข้อมูลหลายรายการ รวมถึงจำนวนที่แท้จริงจะช่วยให้คุณคำนวณ RMSRE_T ของผลรวมได้ วิธีนี้ยังช่วยให้คุณสามารถเพิ่มประสิทธิภาพ RMSRE_T สำหรับค่ารวมเหล่านี้ได้ด้วย

แม้ว่าการรวมข้อมูลจะเป็นไปได้สำหรับ APE แต่สูตรนี้ค่อนข้างซับซ้อนเนื่องจากเกี่ยวข้องกับค่าสัมบูรณ์ของผลรวมของเสียงลาปลาซ ซึ่งทำให้เพิ่มประสิทธิภาพ APE ได้ยากขึ้น

รหัส

ตรวจสอบซอร์สโค้ดสำหรับการคำนวณ RMSRE_T

ตัวอย่าง

รายงานสรุปที่มีที่เก็บข้อมูล 3 ส่วน ได้แก่

  • ที่เก็บข้อมูล_1 = สัญญาณรบกวน: 10, trueSummaryValue: 100
  • ที่เก็บข้อมูล_2 = สัญญาณรบกวน: 20, trueSummaryValue: 100
  • ที่เก็บข้อมูล_3 = สัญญาณรบกวน: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

รายงานสรุปที่มีที่เก็บข้อมูล 3 ส่วน ได้แก่

  • ที่เก็บข้อมูล_1 = สัญญาณรบกวน: 10, trueSummaryValue: 100
  • ที่เก็บข้อมูล_2 = สัญญาณรบกวน: 20, trueSummaryValue: 100
  • ที่เก็บข้อมูล_3 = สัญญาณรบกวน: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

รายงานสรุปที่มีที่เก็บข้อมูล 3 ส่วน ได้แก่

  • ที่เก็บข้อมูล_1 = สัญญาณรบกวน: 10, trueSummaryValue: 100
  • ที่เก็บข้อมูล_2 = สัญญาณรบกวน: 20, trueSummaryValue: 100
  • ที่เก็บข้อมูล_3 = สัญญาณรบกวน: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + อนันต์) / 3 = อนันต์

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

การจัดการคีย์ขั้นสูง

DSP หรือบริษัทวัดผลโฆษณาอาจมีลูกค้าการโฆษณาทั่วโลกหลายพันราย ครอบคลุมหลายอุตสาหกรรม สกุลเงิน และศักยภาพด้านราคาซื้อ ซึ่งหมายความว่าการสร้างและจัดการคีย์การรวม 1 คีย์ต่อผู้ลงโฆษณา 1 รายจะไม่เป็นไปในทางปฏิบัติอย่างมาก นอกจากนี้ การเลือกค่าแบบรวมสูงสุดและงบประมาณสำหรับการรวมที่จะจำกัดผลกระทบของข้อผิดพลาดต่อผู้ลงโฆษณาทั่วโลกหลายพันรายเหล่านี้จะเป็นเรื่องท้าทาย ลองพิจารณาสถานการณ์ต่อไปนี้แทน

กลยุทธ์หลัก ก

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจสร้างและจัดการคีย์เดียวสำหรับลูกค้าโฆษณาทุกราย ในกลุ่มผู้ลงโฆษณาทั้งหมดและสกุลเงินทั้งหมด ช่วงการซื้อจะแตกต่างกันไป ตั้งแต่การซื้อในปริมาณต่ำ การซื้อระดับไฮเอนด์ ไปจนถึงการซื้อปริมาณมากและการซื้อต่ำ ซึ่งทำให้เกิดคีย์ต่อไปนี้

คีย์ (หลายสกุลเงิน)
ค่าสูงสุดที่รวบรวมได้ 5,000,000 คน
ช่วงมูลค่าการซื้อ [120 - 5000000]
กลยุทธ์สำคัญ ข

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจสร้างและจัดการคีย์ 2 คีย์สำหรับลูกค้าโฆษณาทุกราย โดยตัดสินใจแยกคีย์ตามสกุลเงิน ในผู้ลงโฆษณาทั้งหมดและสกุลเงินทั้งหมด ช่วงการซื้อจะแตกต่างกันไป ตั้งแต่การซื้อในปริมาณต่ำ การซื้อระดับไฮเอนด์ ไปจนถึงการซื้อระดับสูงต่ำ การแยกคีย์ตามสกุลเงิน ทำให้ผู้ใช้สร้างคีย์ 2 คีย์ ได้แก่

คีย์ 1 (USD) คีย์ 2 (¥)
ค่าสูงสุดที่รวบรวมได้ 1,200,000 บาท ¥5,000,000
ช่วงมูลค่าการซื้อ [120 - 40,000] [15,000 - 5,000,000]

กลยุทธ์หลัก B จะได้ผลลัพธ์น้อยกว่ากลยุทธ์หลัก A เนื่องจากค่าสกุลเงินจะกระจายให้กับสกุลเงินต่างๆ ไม่เท่ากัน ตัวอย่างเช่น ลองพิจารณาว่าการซื้อที่ใช้สกุลเงิน ¥ ร่วมกับการซื้อในสกุลเงิน USD จะเปลี่ยนแปลงข้อมูลที่สำคัญอย่างไร ซึ่งส่งผลให้เกิดเสียงที่ดังรบกวน

กลยุทธ์หลัก C

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจสร้างและจัดการคีย์ 4 คีย์สำหรับลูกค้าโฆษณาทั้งหมด และแยกคีย์เหล่านี้ตาม Currency x ผู้ลงโฆษณาในอุตสาหกรรม

คีย์ 1
(USD x ผู้ลงโฆษณาเครื่องประดับระดับไฮเอนด์)
คีย์ 2
(¥ x ผู้ลงโฆษณาเครื่องประดับระดับไฮเอนด์)
คีย์ 3
(ผู้ลงโฆษณาผู้ค้าปลีกเสื้อผ้า x USD)
คีย์ 4
(¥ x ผู้ลงโฆษณาผู้ค้าปลีกเสื้อผ้า)
ค่าสูงสุดที่รวบรวมได้ 1,200,000 บาท ¥5,000,000 $500 ¥65,000
ช่วงมูลค่าการซื้อ [10,000 - 40,000 คน] [1,250,000 - 5,000,000] [120 - 500] [15,000 - 65,000]

กลยุทธ์หลัก C จะมีผลลัพธ์รบกวนน้อยกว่ากลยุทธ์หลัก B เนื่องจากมูลค่าการซื้อของผู้ลงโฆษณาจะไม่กระจายไปยังผู้ลงโฆษณาอย่างเท่าเทียมกัน ตัวอย่างเช่น ลองพิจารณาว่าการซื้อเครื่องประดับระดับไฮเอนด์ร่วมกับการซื้อหมวกเบสบอลจะเปลี่ยนแปลงข้อมูลเบื้องหลังและส่งผลให้เสียงออกมาดังได้อย่างไร

ลองสร้างมูลค่ารวมสูงสุดที่แชร์และปัจจัยการปรับขนาดที่ใช้ร่วมกันสำหรับความแพร่หลายในกลุ่มผู้ลงโฆษณาหลายๆ รายเพื่อลดข้อผิดพลาดในผลลัพธ์ ตัวอย่างเช่น คุณอาจทดสอบด้วยกลยุทธ์ต่างๆ ด้านล่างสำหรับผู้ลงโฆษณา

  • กลยุทธ์ 1 รายการแยกตามสกุลเงิน (USD, ¥, CAD ฯลฯ)
  • หนึ่งกลยุทธ์ที่แยกตามอุตสาหกรรมของผู้ลงโฆษณา (ประกันภัย รถยนต์ ค้าปลีก ฯลฯ)
  • กลยุทธ์ 1 รายการคั่นด้วยช่วงมูลค่าการซื้อที่คล้ายกัน ([100], [1000], [10000] ฯลฯ)

คีย์และโค้ดที่สอดคล้องกันจะช่วยให้จัดการได้ง่ายขึ้นและอัตราส่วนสัญญาณต่อสัญญาณรบกวนก็จะสูงขึ้นตามไปด้วย ทดลองใช้กลยุทธ์ต่างๆ กับกลุ่มผู้ชมทั่วไปที่แตกต่างกัน เพื่อค้นหาจุดที่มีการผันแปรเพื่อเพิ่มผลกระทบด้านสัญญาณรบกวนให้สูงสุดเมื่อเทียบกับการจัดการโค้ด


การจัดการข้อมูลผิดปกติขั้นสูง

ลองนึกถึงสถานการณ์ของผู้ลงโฆษณา 2 ราย

  • ผู้ลงโฆษณา ก:
    • สำหรับผลิตภัณฑ์ทั้งหมดในเว็บไซต์ของผู้ลงโฆษณา A ราคาซื้อ ที่เป็นไปได้จะอยู่ระหว่าง [$120 - $1,000] สำหรับช่วง $880
    • ราคาซื้อจะกระจายอย่างเท่าๆ กันในช่วง $880 โดยไม่มีค่าเบี่ยงเบนมาตรฐาน 2 ค่าจากค่ามัธยฐานของราคาซื้อ
  • ผู้ลงโฆษณา ข:
    • สำหรับผลิตภัณฑ์ทั้งหมดในเว็บไซต์ของผู้ลงโฆษณา ข ราคาซื้อ ที่เป็นไปได้จะอยู่ระหว่าง [$120 - $1,000] สำหรับช่วง $880
    • ราคาซื้อมีแนวโน้มสูงที่ช่วง $120 - $500 โดยมีเพียง 5% ของการซื้อที่เกิดขึ้นในช่วง $500 - $1,000

เมื่อพิจารณาจากข้อกำหนดเกี่ยวกับงบประมาณการสนับสนุนและวิธีการที่[มีการใช้สัญญาณรบกวน](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied)กับผลลัพธ์สุดท้ายแล้ว ผู้ลงโฆษณา ข จึงจะได้ผลลัพธ์ที่มีเสียงดังกว่าผู้ลงโฆษณา ก โดยค่าเริ่มต้น เนื่องจากผู้ลงโฆษณา ข มีโอกาสมากกว่าที่ค่าผิดปกติจะส่งผลต่อการคำนวณที่แสดง

คุณลดปัญหานี้ได้ด้วยการตั้งค่าคีย์ที่เฉพาะเจาะจง ทดสอบกลยุทธ์หลักที่ช่วยจัดการข้อมูลค่าผิดปกติ และเพื่อกระจายมูลค่าการซื้อให้เท่าๆ กันมากขึ้นตลอดช่วงการซื้อของคีย์นั้นๆ

สำหรับผู้ลงโฆษณา ข คุณสามารถสร้างคีย์ 2 คีย์แยกกันเพื่อบันทึกช่วงมูลค่าการซื้อที่ต่างกัน 2 ช่วงได้ ในตัวอย่างนี้ เทคโนโลยีโฆษณาได้ระบุว่าค่าผิดปกติแสดงสูงกว่ามูลค่าการซื้อ 15, 000 บาท ลองใช้คีย์ 2 คีย์แยกกันสำหรับ ผู้ลงโฆษณารายนี้

  • โครงสร้างหลัก 1 : คีย์ที่รวบรวมการซื้อเฉพาะช่วงราคา $120- $500 (ครอบคลุมประมาณ 95% ของปริมาณการซื้อทั้งหมด)
  • โครงสร้างหลัก 2: คีย์ที่ครอบคลุมเฉพาะการซื้อที่เกิน $500 (ครอบคลุมประมาณ 5% ของปริมาณการซื้อทั้งหมด)

การนำกลยุทธ์หลักนี้ไปใช้ควรจัดการกับสัญญาณรบกวนของผู้ลงโฆษณา B ได้ดีขึ้น และช่วยเพิ่มประโยชน์ใช้สอยสูงสุดให้แก่ผู้ลงโฆษณาจากรายงานสรุป จากช่วงที่เล็กลงมาใหม่ คีย์ A และคีย์ B จึงควรมีการกระจายที่สม่ำเสมอมากขึ้นของข้อมูลในแต่ละคีย์ที่เกี่ยวข้อง ซึ่งเป็นคีย์สำหรับคีย์เดียวก่อนหน้านี้ ซึ่งจะส่งผลให้มีผลกระทบน้อยลงในเอาต์พุตของแต่ละคีย์สำหรับคีย์เดี่ยวก่อนหน้า