साथ मिलकर फ़िल्टर करने के फ़ायदे & नुकसान

फ़ायदे

डोमेन की जानकारी होना ज़रूरी नहीं है

हमें डोमेन की जानकारी होना ज़रूरी नहीं है, क्योंकि एम्बेड करने की प्रक्रिया अपने-आप सीखी जाती है.

सीरेंडिपिटी

इस मॉडल से, उपयोगकर्ताओं को नई चीज़ें खोजने में मदद मिल सकती है. अलग से, मशीन लर्निंग सिस्टम शायद यह नहीं पता कि उपयोगकर्ता किसी दिए गए आइटम में दिलचस्पी रखता है. हालांकि, मॉडल यह जानकारी अब भी उसका सुझाव दें, क्योंकि मिलते-जुलते उपयोगकर्ताओं की उस आइटम में दिलचस्पी है.

शुरुआत करने के लिए बेहतरीन जगह

कुछ हद तक, किसी मैट्रिक्स को ट्रेनिंग देने के लिए सिस्टम को सिर्फ़ फ़ीडबैक मैट्रिक्स की ज़रूरत होती है फ़ैक्टराइज़ेशन मॉडल. खास तौर पर, इस सिस्टम को कॉन्टेंट के हिसाब से मिलने वाली सुविधाओं की ज़रूरत नहीं है. व्यावहारिक तौर पर, इसका इस्तेमाल एक से ज़्यादा कैंडिडेट जनरेटर के तौर पर किया जा सकता है.

नुकसान

नए आइटम मैनेज नहीं किए जा सकते

दिए गए (उपयोगकर्ता, आइटम) जोड़े के लिए मॉडल का अनुमान बिंदु है प्रॉडक्ट के तौर पर जोड़ा जा सकता है. इसलिए, अगर किसी आइटम को ट्रेनिंग के दौरान, सिस्टम उसके लिए एम्बेड नहीं कर सकता और न ही इस आइटम वाले मॉडल की क्वेरी करें. इस समस्या को अक्सर कोल्ड-स्टार्ट की समस्या हो. हालांकि, इन तकनीकों का इस्तेमाल करके, कुछ हद तक:

  • WALS में प्रोजेक्टेशन. कोई नया आइटम दिया गया \(i_0\) जो ट्रेनिंग में नहीं दिखा, अगर सिस्टम की उपयोगकर्ताओं के साथ थोड़ी-बहुत बातचीत होती है, तो सिस्टम इस आइटम के लिए एक एम्बेडिंग \(v_{i_0}\) को आसानी से कंप्यूट कर लें. पूरे मॉडल को ट्रेनिंग दें. सिस्टम को बस नीचे दिए गए सवाल हल करने हैं समीकरण या भारित वर्शन:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    पहले वाला इक्वेशन, WALS में एक इटरेशन के बारे में बताता है: उपयोगकर्ता के एम्बेड किए गए कॉन्टेंट को ठीक करके रखा जाता है और सिस्टम, एम्बेड करने की प्रोसेस को हल करता है आइटम \(i_0\)में से. नए उपयोगकर्ता के लिए भी ऐसा किया जा सकता है.

  • नए आइटम को एम्बेड करने के अनुमान. अगर सिस्टम इंटरैक्शन नहीं है, तो सिस्टम इसके एम्बेड होने का अनुमान लगा सकता है एक ही कैटगरी के आइटम एम्बेड करने पर, एक ही अपलोड करने वाला (YouTube में) वगैरह.

क्वेरी/आइटम के लिए साइड फ़ीचर शामिल करना मुश्किल है

साइड सुविधाएं, क्वेरी या आइटम आईडी के अलावा सभी सुविधाएं होती हैं. फ़िल्म के लिए के सुझाव दिए गए हैं, तो 'साइड फ़ीचर' में देश या उम्र की जानकारी शामिल हो सकती है. इसमें शामिल है उपलब्ध साइड फ़ीचर मॉडल की क्वालिटी को बेहतर बनाते हैं. हालांकि WALS में साइड फ़ीचर शामिल करना आसान नहीं होता, WALS को सामान्य बनाने की वजह से ऐसा हो सकता है.

WALS को सामान्य बनाने के लिए, इनपुट मैट्रिक्स को सुविधाओं के साथ बढ़ाएँ. ब्लॉक मैट्रिक्स \(\bar A\), जहां:

  • ब्लॉक (0, 0), फ़ीडबैक का मूल मैट्रिक्स है \(A\).
  • ब्लॉक (0, 1) उपयोगकर्ता की सुविधाओं का मल्टी-हॉट एन्कोडिंग है.
  • ब्लॉक (1, 0), आइटम की सुविधाओं की मल्टी-हॉट एन्कोडिंग है.