ข้อดีของการกรองการทำงานร่วมกัน & ข้อเสีย

ข้อดี

ไม่จำเป็นต้องมีความรู้เกี่ยวกับโดเมน

เราไม่จำเป็นต้องมีความรู้เกี่ยวกับโดเมนเพราะระบบจะเรียนรู้การฝังโดยอัตโนมัติ

การสมนาคุณ

โมเดลนี้ช่วยให้ผู้ใช้ค้นพบความสนใจใหม่ๆ หากแยกออกมาต่างหาก ระบบ ML ไม่ทราบว่าผู้ใช้สนใจสินค้านั้น แต่โมเดลอาจยังคง แนะนำเนื่องจากผู้ใช้ที่คล้ายกันสนใจรายการดังกล่าว

จุดเริ่มต้นที่ดีมาก

ระบบต้องการเพียงเมทริกซ์ความคิดเห็นเพื่อฝึกเมทริกซ์ในบางกรณี แบบแยกตัวประกอบ โดยเฉพาะอย่างยิ่ง ระบบไม่จำเป็นต้องใช้ฟีเจอร์ตามบริบท ในทางปฏิบัติ เมตริกนี้สามารถใช้เป็นหนึ่งในโปรแกรมสร้างผู้สมัครได้หลายราย

ข้อเสีย

จัดการรายการใหม่ไม่ได้

การคาดการณ์โมเดลสำหรับคู่ (ผู้ใช้ สินค้า) ที่ระบุคือจุด ของการฝังที่เกี่ยวข้อง ดังนั้น หากไม่พบรายการ ในระหว่างการฝึก ระบบจะไม่สามารถสร้าง การฝังข้อมูล และไม่สามารถ ค้นหาโมเดลด้วยรายการนี้ ปัญหานี้มักเรียกว่า ปัญหา Cold-start แต่เทคนิคต่อไปนี้สามารถ อย่างเช่น Cold Start

  • การฉายภาพใน WALS ได้รับไอเทมใหม่ \(i_0\) ที่ไม่เห็นในการฝึก หากระบบโต้ตอบกับผู้ใช้เป็นจำนวนน้อย ระบบจะสามารถ ประมวลผลการฝัง \(v_{i_0}\) สำหรับรายการนี้ได้ง่ายๆ โดยไม่ต้อง เพื่อฝึกโมเดลทั้งหมดอีกครั้ง ระบบจะต้องแก้โจทย์ต่อไปนี้ หรือแบบถ่วงน้ำหนัก

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    สมการก่อนหน้าสอดคล้องกับการทำซ้ำหนึ่งรายการใน WALS คือ การฝังของผู้ใช้จะได้รับการแก้ไข และระบบจะแก้ไขปัญหาสำหรับการฝัง ของรายการที่ \(i_0\)เช่นเดียวกันกับผู้ใช้ใหม่

  • วิธีการสร้างการฝังรายการใหม่ๆ หากระบบ ไม่มีการโต้ตอบ ระบบจะสามารถประมาณการฝังได้ ด้วยค่าเฉลี่ยการฝังรายการจากหมวดหมู่เดียวกันจาก ผู้อัปโหลดรายเดียวกัน (ใน YouTube) และอื่นๆ

ยากที่จะใส่ฟีเจอร์ด้านข้างสำหรับการค้นหา/รายการ

ฟีเจอร์ด้านข้างคือฟีเจอร์ที่อยู่นอกเหนือคำค้นหาหรือรหัสรายการ สำหรับภาพยนตร์ ฟีเจอร์ด้านข้างอาจรวมถึงประเทศหรืออายุ รวม ฟีเจอร์ด้านข้างที่ใช้ได้จะช่วยปรับปรุงคุณภาพของโมเดล แม้ว่า การใส่ฟีเจอร์ด้านข้างใน WALS อาจไม่ใช่เรื่องง่าย การทำให้ WALS เป็นแบบทั่วไปจะช่วยให้เข้าใจได้

หากต้องการทำให้ WALS เป็นแบบทั่วไป ให้เสริมเมทริกซ์อินพุตด้วยฟีเจอร์ต่างๆ โดยกำหนด บล็อกเมตริก \(\bar A\)โดยที่

  • บล็อก (0, 0) คือเมทริกซ์ความคิดเห็นดั้งเดิม \(A\)
  • Block (0, 1) คือการเข้ารหัสแบบมัลติฮอตของฟีเจอร์ผู้ใช้
  • Block (1, 0) คือการเข้ารหัสแบบมัลติฮอตของฟีเจอร์รายการ