ทดสอบความเข้าใจ
ในรูปภาพด้านบน หากคุณต้องการให้ b
คล้ายกับ a
มากกว่า c
คุณควรเลือกการวัดผลใด
ระยะทางแบบยุคลิด
ระยะทาง b c → น้อยกว่า a b → จึงทำให้b
อยู่ใกล้กับ c
มากกว่า a
โคไซน์
โคไซน์ขึ้นอยู่กับมุมระหว่างเวกเตอร์เท่านั้น และมุมที่เล็กกว่า θ b c จะทำให้ cos ( θ b c ) มีค่ามากกว่า cos ( θ a b )
ผลคูณจุด
ถูกต้อง ผลคูณจุดจะแปรผันตามทั้งโคไซน์และความยาวของเวกเตอร์ ดังนั้นแม้ว่าค่าโคไซน์ของมุมที่เกิดจาก b
และ c
จะมากกว่าค่าโคไซน์ของมุมที่เกิดจาก b
และ a
แต่ความยาวเวกเตอร์ของ a
ที่มากกว่าทำให้ผลคูณจุดของ a
และ b
มากกว่าผลคูณจุดของ b
และ c
คุณกำลังคำนวณความคล้ายคลึงสำหรับมิวสิกวิดีโอ ความยาวของเวกเตอร์การฝังของมิวสิกวิดีโอจะสัมพันธ์กับความนิยมของมิวสิกวิดีโอ คุณเปลี่ยนจากโคไซน์เป็นผลคูณจุดเพื่อคํานวณความคล้ายคลึงได้ ความคล้ายคลึงกันระหว่างมิวสิกวิดีโอมีการเปลี่ยนแปลงอย่างไร
วิดีโอยอดนิยมจะคล้ายกับ วิดีโอทั้งหมดมากขึ้นโดยทั่วไป
เนื่องจากผลคูณจุดจะได้รับผลกระทบจากความยาวของเวกเตอร์ทั้ง 2 รายการ วิดีโอยอดนิยมที่มีเวกเตอร์ยาวจึงจะคล้ายกับวิดีโอทั้งหมดมากขึ้น
วิดีโอยอดนิยมจะคล้ายกันมากขึ้น กับวิดีโอยอดนิยมอื่นๆ เท่านั้น
โปรดทราบว่าผลคูณแบบดอทคำนวณเป็น | a | | b | cos ( θ )
สมมติว่า a
เป็นมิวสิกวิดีโอยอดนิยม เราจะทราบความยาวของวิดีโอที่ฝัง | a | ว่ามากกว่าวิดีโอที่ไม่ได้รับความนิยม
ความยาวที่มากขึ้นจะเพิ่มผลคูณจุดโดยไม่คำนึงถึงค่าของ | b | ด้วยเหตุนี้ วิดีโอยอดนิยมจึงมีความคล้ายคลึงกับวิดีโออื่นๆ ทั้งหมดมากขึ้น ไม่ใช่แค่วิดีโอยอดนิยมอื่นๆ
ไม่มีการเปลี่ยนแปลง
ผลคูณจุดจะได้รับผลกระทบจากความยาวเวกเตอร์ ความยาวเวกเตอร์ที่สูงของวิดีโอยอดนิยมจะเปลี่ยนการวัดความคล้ายคลึง (ก่อนหน้านี้คือโคไซน์)
วิดีโอยอดนิยมจะมีความคล้ายคลึงกันน้อยลง เมื่อเทียบกับวิดีโอที่ไม่ค่อยได้รับความนิยม
เนื่องจากผลคูณจุดจะเพิ่มขึ้นตามความยาวเวกเตอร์ และวิดีโอยอดนิยมมีความยาวเวกเตอร์สูง ค่าการวัดความคล้ายคลึงจึงจะเพิ่มขึ้น ไม่ใช่ลดลง
จากการตั้งค่าเดียวกับคำถามก่อนหน้า สมมติว่าคุณเปลี่ยนกลับไปใช้ cosine จากผลคูณจุด ความคล้ายคลึงกันระหว่างมิวสิกวิดีโอมีการเปลี่ยนแปลงอย่างไร
ไม่มีการเปลี่ยนแปลง
เนื่องจากโคไซน์ไม่ได้รับผลกระทบจากความยาวเวกเตอร์ แต่ผลคูณจุดได้รับผลกระทบ ดังนั้นการเปลี่ยนจากผลคูณจุดเป็นโคไซน์จะเปลี่ยนความคล้ายคลึง
วิดีโอยอดนิยมจะมีความคล้ายคลึงน้อยลง กับวิดีโอทั้งหมด
เนื่องจากโคไซน์ไม่ได้รับผลกระทบจากความยาวเวกเตอร์ ความยาวเวกเตอร์ที่ยาวมากของวิดีโอที่ฝังยอดนิยมจึงไม่มีผลกระทบต่อความคล้ายคลึง
ดังนั้น การเปลี่ยนจากผลคูณจุดเป็นโคไซน์จึงช่วยลดความคล้ายคลึงระหว่างวิดีโอยอดนิยมกับวิดีโออื่นๆ ทั้งหมด
วิดีโอยอดนิยมจะคล้ายกับ วิดีโอทั้งหมดมากขึ้น
โคไซน์ไม่ได้รับผลกระทบจากความยาวเวกเตอร์ ดังนั้นการเปลี่ยนจากจุดผลิตภัณฑ์จะทำให้ความคล้ายคลึงของวิดีโอยอดนิยมทั้งหมดลดลง
วิดีโอยอดนิยมจะคล้ายกันมากขึ้น เฉพาะกับวิดีโออื่นๆ ที่เป็นที่นิยมเท่านั้น
โคไซน์ไม่ได้รับผลกระทบจากความยาวเวกเตอร์ ดังนั้นการเปลี่ยนจากจุดผลิตภัณฑ์จะทำให้ความคล้ายคลึงของวิดีโอยอดนิยมทั้งหมดลดลง
เนื้อหาของหน้าเว็บนี้ได้รับอนุญาตภายใต้ใบอนุญาตที่ต้องระบุที่มาของครีเอทีฟคอมมอนส์ 4.0 และตัวอย่างโค้ดได้รับอนุญาตภายใต้ใบอนุญาต Apache 2.0 เว้นแต่จะระบุไว้เป็นอย่างอื่น โปรดดูรายละเอียดที่นโยบายเว็บไซต์ Google Developers Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
อัปเดตล่าสุด 2025-02-25 UTC
[null,null,["อัปเดตล่าสุด 2025-02-25 UTC"],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]