मिलकर फ़िल्टर करने के फ़ायदे और नुकसान

फ़ायदे

डोमेन के बारे में जानकारी की ज़रूरत नहीं है

एम्बेड करने की सुविधा अपने-आप सीख ली जाती है, इसलिए हमें डोमेन के बारे में जानकारी की ज़रूरत नहीं है.

Serendipity

इस मॉडल से उपयोगकर्ताओं को नई रुचियां खोजने में मदद मिल सकती है. अलग से, एमएल सिस्टम को पता नहीं चल सकता कि उपयोगकर्ता किसी दिए गए आइटम में दिलचस्पी है, लेकिन मॉडल अब भी उसका सुझाव दे सकता है, क्योंकि उससे मिलते-जुलते उपयोगकर्ता उस आइटम में दिलचस्पी रखते हैं.

शुरुआत की शानदार जगह

कुछ हद तक, सिस्टम को सिर्फ़ मैट्रिक्स मैट्रिक्स को ट्रेनिंग देने के लिए, फ़ीडबैक मैट्रिक्स की ज़रूरत होती है. खास तौर पर, सिस्टम को संदर्भ से जुड़ी सुविधाओं की ज़रूरत नहीं होती. व्यावहारिक तौर पर, इसका इस्तेमाल कई उम्मीदवारों में से एक जनरेटर के रूप में किया जा सकता है.

नुकसान

नए आइटम मैनेज नहीं किए जा सकते

दिए गए (उपयोगकर्ता, आइटम) की जोड़ी के लिए मॉडल का अनुमान, एम्बेड किए गए एम्बेड का डॉट प्रॉडक्ट होता है. इसलिए, अगर ट्रेनिंग के दौरान कोई आइटम नहीं देखा जाता है, तो सिस्टम इसके लिए एम्बेड नहीं कर सकता और इस आइटम के साथ मॉडल की क्वेरी नहीं कर सकता. इस समस्या को अक्सर कोल्ड-स्टार्ट प्रॉब्लम कहा जाता है. हालांकि, ये तकनीकें इस समस्या को कुछ हद तक हल कर सकती हैं:

  • चेतावनी वाले प्रोजेक्ट में अनुमान लगाना. अगर सिस्टम में कुछ इंटरैक्शन होते हैं, तो उपयोगकर्ता को एक नया आइटम \(i_0\) दिखाया जाता है. अगर सिस्टम में कुछ इंटरैक्शन होते हैं, तो सिस्टम पूरे मॉडल को फिर से प्रशिक्षित किए बिना, इस आइटम के लिए आसानी से एम्बेड कर सकता है \(v_{i_0}\) . सिस्टम को बस नीचे दिए गए समीकरण या वेटेड वर्शन को हल करना होगा:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    पिछला समीकरण WALS में एक दोहराव से मेल खाता है: उपयोगकर्ता एम्बेडिंग को ठीक रखा जाता है और सिस्टम आइटम को एम्बेड करने के लिए समाधान करता है \(i_0\). किसी नए उपयोगकर्ता के लिए भी ऐसा किया जा सकता है.

  • नए आइटम को एम्बेड करने का तरीका. अगर सिस्टम के पास इंटरैक्शन नहीं होते हैं, तो सिस्टम एक ही कैटगरी, अपलोड करने वाले (YouTube में) और सभी आइटम के एम्बेड किए गए टाइप का औसत तय करके, एम्बेड करने का अनुमानित कर सकता है.

क्वेरी/सामान के लिए साइड फ़ीचर शामिल करना

साइड सुविधाएं, क्वेरी या आइटम आईडी के अलावा अन्य सुविधाएं भी होती हैं. फ़िल्मों के सुझाव देने के लिए, इन सुविधाओं में देश या उम्र शामिल हो सकती हैं. साइड साइड की सुविधाओं को शामिल करने से मॉडल की क्वालिटी बेहतर होती है. हालांकि, WALS में साइड फ़ीचर शामिल करना आसान नहीं है, डब्ल्यूएएलएस की सामान्य जानकारी से ऐसा हो सकता है.

WALS को सामान्य बनाने के लिए, ब्लॉक मैट्रिक्स \(\bar A\)के ज़रिए इनपुट मैट्रिक्स को दिखाने के लिए देखें, जहां:

  • ब्लॉक करें (0, 0), ओरिजनल फ़ीडबैक मैट्रिक्स है \(A\).
  • ब्लॉक (0, 1) उपयोगकर्ता को मिलने वाली सुविधाओं का मल्टी-हॉट एन्कोडिंग है.
  • ब्लॉक (1, 0), आइटम सुविधाओं की मल्टी-हॉट एन्कोडिंग है.