ข้อได้เปรียบของการกรองสําหรับการทํางานร่วมกันและข้อเสีย

ข้อดี

ไม่จําเป็นต้องมีความรู้เกี่ยวกับโดเมน

เราไม่จําเป็นต้องมีความรู้เกี่ยวกับโดเมน เนื่องจากระบบจะฝังข้อมูลที่ฝังให้โดยอัตโนมัติ

สมนาคุณ

รูปแบบนี้ช่วยให้ผู้ใช้ค้นพบความสนใจใหม่ๆ ได้ การแยกระบบ ML อาจไม่รู้ว่าผู้ใช้สนใจสินค้าชิ้นใด แต่โมเดลอาจยังแนะนําสินค้าดังกล่าวเนื่องจากผู้ใช้ที่คล้ายกันสนใจสินค้าดังกล่าว

จุดเริ่มต้นที่ดี

ระบบต้องการเพียงเมทริกซ์ความคิดเห็นเพื่อฝึกโมเดลปัจจัยการแยกส่วนเมทริกซ์ โดยเฉพาะอย่างยิ่ง ระบบไม่จําเป็นต้องใช้ฟีเจอร์ตามบริบท ในทางปฏิบัติ ส่วนนี้จะใช้เป็นหนึ่งในเครื่องมือสร้างตัวเลือกที่หลากหลาย

ข้อเสีย

จัดการสินค้าใหม่ไม่ได้

การคาดการณ์โมเดลสําหรับคู่ (ผู้ใช้, รายการ) ที่ระบุคือผลิตภัณฑ์จุดของการฝังที่เกี่ยวข้อง ดังนั้นหากไม่เห็นรายการในระหว่างการฝึก ระบบจะสร้างการฝังไม่ได้และจะค้นหาโมเดลด้วยรายการนี้ไม่ได้ ปัญหานี้มักเรียกว่าปัญหา Cold-Start อย่างไรก็ตาม เทคนิคต่อไปนี้จะช่วยจัดการปัญหา Cold Start ได้ในบางกรณี

  • การคาดการณ์ใน WALS สมมติว่ามีรายการใหม่ \(i_0\) ซึ่งไม่พบระหว่างการฝึก หากระบบมีการโต้ตอบเพียงเล็กน้อยกับผู้ใช้ ระบบจะคํานวณการฝัง \(v_{i_0}\) ได้อย่างง่ายดายสําหรับรายการนี้โดยไม่ต้องฝึกทั้งโมเดลอีกครั้ง เพียงแก้ไขสมการหรือถ่วงน้ําหนักต่อไปนี้

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    สมการก่อนหน้านี้สอดคล้องกับการทําซ้ําแบบ WALS นั่นคือ การฝังที่ฝังผู้ใช้ไว้จะคงที่ และระบบจะแก้ไขปัญหาสําหรับการฝังรายการดังกล่าว \(i_0\)เช่นเดียวกัน ผู้ใช้ใหม่ก็สามารถทําได้เช่นกัน

  • การเรียนรู้ของระบบเพื่อฝังรายการใหม่ๆ หากระบบไม่มีการโต้ตอบ ระบบจะประมาณการฝังได้ โดยเฉลี่ยการฝังรายการจากหมวดหมู่เดียวกันจากผู้อัปโหลดรายเดียวกัน (ใน YouTube) เป็นต้น

ใส่ฟีเจอร์ด้านข้างสําหรับการค้นหา/สินค้าได้ยาก

ฟีเจอร์ด้านข้างเป็นฟีเจอร์อื่นนอกเหนือจากคําค้นหาหรือรหัสสินค้า สําหรับฟีเจอร์แนะนําภาพยนตร์ ฟีเจอร์ด้านข้างอาจระบุประเทศหรืออายุ การใส่ฟีเจอร์ด้านข้างที่ใช้ได้จะช่วยปรับปรุงคุณภาพของโมเดล แม้ว่าการรวมฟีเจอร์ด้านข้างใน WALS อาจไม่ใช่เรื่องง่าย แต่ การนําเสนอทั่วไปของ WALS ทําให้การดําเนินการนี้เป็นไปได้

หากต้องการทั่วไป WALS ให้เสริมเมทริกซ์อินพุตด้วยฟีเจอร์โดยกําหนดเมทริกซ์บล็อก \(\bar A\)โดยที่

  • บล็อก (0, 0) คือเมทริกซ์ความคิดเห็นต้นฉบับ \(A\)
  • บล็อก (0, 1) คือการเข้ารหัสฟีเจอร์ต่างๆ ของผู้ใช้แบบ Hot-hot
  • การบล็อก (1, 0) คือการเข้ารหัสฟีเจอร์ต่างๆ ของรายการแบบ Multi-Hot