مزايا التصفية التعاونية السلبيات

الإيجابيات

ما مِن حاجة إلى معرفة النطاق

ولسنا بحاجة إلى معرفة بالمجال، لأنه يتم تعلم التضمينات تلقائيًا.

الصدفة

ويمكن أن يساعد النموذج المستخدمين في اكتشاف اهتمامات جديدة. بمعزل عن نظام تعلُّم الآلة عدم معرفة أن المستخدم مهتم بعنصر معين، ولكن النموذج قد يظل أوصي به لأن مستخدمين مشابهين مهتمون بهذا العنصر.

نقطة بداية رائعة

إلى حد ما، يحتاج النظام إلى مصفوفة التعقيبات فقط لتدريب مصفوفة نموذج التحليل إلى العوامل. وعلى وجه الخصوص، لا يحتاج النظام إلى ميزات سياقية. من الناحية العملية، يمكن استخدام هذا كواحد من أدوات إنشاء المرشّحات المتعددة.

العيوب

لا يمكن معالجة العناصر الحديثة

توقع النموذج لزوج معين (مستخدم، عنصر) هو النقطة منتج التضمينات المقابلة. لذلك، إذا لم يظهر عنصر أثناء التدريب، لا يمكن للنظام إنشاء عملية تضمين له ولا يمكنه الاستعلام عن النموذج الذي يحتوي على هذا العنصر. غالبًا ما تسمى هذه المشكلة مشكلة البداية الباردة. ومع ذلك، يمكن أن تتناول الأساليب التالية مشكلة البدء على البارد إلى حدٍ ما وهي:

  • العرض في WALS: بالنظر إلى عنصر جديد \(i_0\) لم تتم مشاهدته في التدريب، إذا كان لدى النظام بعض التفاعلات مع المستخدمين، فيمكن للنظام بسهولة حساب التضمين \(v_{i_0}\) لهذا العنصر بدون الحاجة إلى إعادة تدريب النموذج بأكمله. يتعين على النظام ببساطة حل ما يلي المعادلة أو الإصدار المرجح:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    تتجاوب المعادلة السابقة مع تكرار واحد في WALS: يتم تثبيت تضمينات المستخدم، ويحل النظام عمليات التضمين العنصر \(i_0\). ويمكن إجراء الشيء نفسه للمستخدم الجديد.

  • إرشادات لإنشاء تضمينات من العناصر الجديدة: إذا أكمل النظام لا تتوفر أي تفاعلات، فيمكن للنظام تقريب التضمين عن طريق احتساب متوسط ما تم تضمينه من العناصر من نفس الفئة، من القائم بالتحميل نفسه (في YouTube) وهكذا.

يصعب تضمين الميزات الجانبية لطلب البحث أو العنصر

الميزات الجانبية هي أي ميزات تتجاوز طلب البحث أو معرّف السلعة. للأفلام الاقتراحات، فقد تتضمن الميزات الجانبية البلد أو العمر. تشمل الميزات الجانبية المتوفرة إلى تحسين جودة النموذج. رغم قد لا يكون من السهل تضمين الميزات الجانبية في WALS، فإن تعميم WALS يجعل هذا ممكنًا.

لتعميم WALS، يمكنك زيادة مصفوفة الإدخال بالميزات من خلال تحديد مصفوفة الكتل \(\bar A\)، حيث:

  • الكتلة (0، 0) هي مصفوفة الملاحظات الأصلية \(A\).
  • الجزء (0، 1) هو ترميز متعدد الاستخدامات لميزات المستخدم.
  • الجزء (1، 0) هو ترميز متعدد الاستخدامات لميزات العنصر.