मशीन लर्निंग शब्दावली: सुझाव देने वाले सिस्टम

इस पेज में सुझाव सिस्टम की ग्लॉसरी वाले शब्द हैं. शब्दावली के सभी शब्दों के लिए, यहां क्लिक करें.

C

कैंडिडेट जनरेशन

#recsystems

सुझावों का शुरुआती सेट, जिसे सुझाव देने वाले सिस्टम ने चुना है. उदाहरण के लिए, किसी ऐसे बुकस्टोर का इस्तेमाल करें जिस पर 1,00,000 किताबें मिलती हैं. कैंडिडेट जनरेशन फ़ेज़, किसी खास उपयोगकर्ता के लिए सही किताबों की बहुत छोटी सूची बनाता है, जैसे कि 500. हालांकि, किसी उपयोगकर्ता को 500 किताबें भी ज़्यादा सुझाव के तौर पर नहीं दिखाती हैं. इसके बाद, ज़्यादा महंगा, सुझाव देने वाले सिस्टम के चरण (जैसे कि स्कोरिंग और री-रैंकिंग) उन 500 को कम कर देते हैं और सुझाव के ज़्यादा छोटे और काम के सेट हो जाते हैं.

सहयोगी फ़िल्टरिंग

#recsystems

कई दूसरे उपयोगकर्ताओं की दिलचस्पी के आधार पर, किसी उपयोगकर्ता की दिलचस्पी के बारे में अनुमान लगाना. कोलैबोरेटिव फ़िल्टरिंग का इस्तेमाल अक्सर सुझाव देने वाले सिस्टम में किया जाता है.

I

आइटम मैट्रिक्स

#recsystems

सुझाव देने वाले सिस्टम में, एम्बेड किए जाने वाले वेक्टर का एक मैट्रिक्स होता है, जो मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट होता है. इसमें हर आइटम के बारे में लेटेंट सिग्नल होते हैं. आइटम मैट्रिक्स की हर लाइन में सभी आइटम के लिए, इंतज़ार के समय की एक सुविधा की वैल्यू होती है. उदाहरण के लिए, फ़िल्मों का सुझाव देने वाले सिस्टम के बारे में सोचें. आइटम मैट्रिक्स का हर कॉलम एक मूवी को दिखाता है. लेटेंट सिग्नल, शैलियों को दिखा सकते हैं या उन सिग्नल को समझना मुश्किल हो सकता है जिनमें शैली, स्टार, फ़िल्म की उम्र या दूसरी चीज़ों के बीच जटिल इंटरैक्शन शामिल होता है.

आइटम मैट्रिक्स में उतनी ही संख्या में कॉलम हैं जितने कि फ़ैक्टराइज़ किए जा रहे टारगेट मैट्रिक्स में हैं. उदाहरण के लिए, अगर किसी फ़िल्म के सुझाव देने वाला सिस्टम 10,000 फ़िल्मों का आकलन करता है, तो आइटम मैट्रिक्स में 10,000 कॉलम होंगे.

items

#recsystems

सुझाव देने वाले सिस्टम में, वे इकाइयां जिनका सुझाव सिस्टम देता है. उदाहरण के लिए, वीडियो वे आइटम हैं जिनके सुझाव, वीडियो स्टोर में देते हैं, जबकि किताबें ऐसे आइटम हैं जो किताबों का स्टोर सुझाव देता है.

सोम

मैट्रिक्स फ़ैक्टराइज़ेशन

#recsystems

गणित में, ऐसे आव्यूहों को खोजने का एक तरीका जिनका डॉट प्रॉडक्ट किसी टारगेट मैट्रिक्स का अनुमान लगाता है.

सुझाव देने वाले सिस्टम में, टारगेट मैट्रिक्स में उपयोगकर्ताओं की रेटिंग अक्सर items होती है. उदाहरण के लिए, किसी फ़िल्म का सुझाव देने वाले सिस्टम के लिए टारगेट मैट्रिक्स कुछ ऐसा दिख सकता है: जिसमें पॉज़िटिव पूर्णांक, उपयोगकर्ता रेटिंग हैं और 0 का मतलब है कि उपयोगकर्ता ने फ़िल्म को रेटिंग नहीं दी है:

  कैसाब्लांका द फ़िलाडेल्फ़िया स्टोरी Black Panther वंडर वुमन पल्प फ़िक्शन
यूज़र 1 5.0 3.0 0.0 2.0 0.0
यूज़र 2 4.0 0.0 0.0 1.0 5.0
यूज़र 3 3.0 1.0 4.0 5.0 0.0

फ़िल्मों के सुझाव देने वाले सिस्टम का काम, बिना रेटिंग वाली फ़िल्मों के लिए उपयोगकर्ता रेटिंग का अनुमान लगाना होता है. उदाहरण के लिए, क्या उपयोगकर्ता 1 को Black Panther पसंद होगी?

सुझाव देने वाले सिस्टम के लिए, एक तरीका यह है कि इन दो मैट्रिक्स को जनरेट करने के लिए, मैट्रिक्स फ़ैक्टराइज़ेशन का इस्तेमाल किया जाए:

  • यूज़र मैट्रिक्स, उपयोगकर्ताओं की संख्या X के तौर पर आकार दिया जाता है. यह संख्या, एम्बेड किए गए डाइमेंशन की संख्या होती है.
  • आइटम का मैट्रिक्स, यह एम्बेड किए गए डाइमेंशन की संख्या X के तौर पर आइटम की संख्या के रूप में दिखता है.

उदाहरण के लिए, हमारे तीन उपयोगकर्ताओं और पांच आइटम पर मैट्रिक्स फ़ैक्टराइज़ेशन का इस्तेमाल करने से, नीचे दिया गया यूज़र मैट्रिक्स और आइटम मैट्रिक्स मिल सकता है:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

यूज़र मैट्रिक्स और आइटम मैट्रिक्स का डॉट प्रॉडक्ट, सुझाव वाली एक मैट्रिक्स देता है. इसमें सिर्फ़ मूल उपयोगकर्ता रेटिंग ही नहीं, बल्कि उन फ़िल्मों के लिए भी अनुमान होते हैं जिन्हें हर उपयोगकर्ता ने नहीं देखा है. उदाहरण के लिए, उपयोगकर्ता 1 की Casablanca की रेटिंग देखें, जो 5.0 थी. उम्मीद है कि सुझाव मैट्रिक्स में उस सेल से जुड़े डॉट प्रॉडक्ट की संख्या 5.0 होनी चाहिए और यह:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

इससे भी अहम बात यह है कि क्या उपयोगकर्ता 1, Black Panther को पसंद करेगा? पहली पंक्ति और तीसरे कॉलम के हिसाब से डॉट प्रॉडक्ट लेने पर, 4.3 की अनुमानित रेटिंग मिलती है:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

आम तौर पर, मैट्रिक्स फ़ैक्टराइज़ेशन से यूज़र मैट्रिक्स और आइटम मैट्रिक्स मिलते हैं, जो साथ मिलकर, टारगेट मैट्रिक्स की तुलना में काफ़ी छोटे होते हैं.

R

सुझाव देने वाला सिस्टम

#recsystems

ऐसा सिस्टम जो हर उपयोगकर्ता के लिए, एक बड़े संग्रह में से ज़रूरी आइटम का एक छोटा सेट चुनता है. उदाहरण के लिए, वीडियो का सुझाव देने वाला सिस्टम,1, 00, 000 वीडियो के संग्रह से दो वीडियो का सुझाव दे सकता है. इनमें एक उपयोगकर्ता के लिए कासाब्लांका और फ़िलाडेल्फ़िया स्टोरी और दूसरे उपयोगकर्ता के लिए वंडर वुमन और ब्लैक पैंथर को चुना जा सकता है. वीडियो का सुझाव देने वाला सिस्टम, इन चीज़ों के आधार पर वीडियो के सुझाव दे सकता है:

  • ऐसी फ़िल्में जिन्हें मिलते-जुलते उपयोगकर्ताओं ने रेटिंग दी है या देखा है.
  • शैली, निर्देशक, अभिनेता, टारगेट डेमोग्राफ़िक...

फिर से रैंकिंग

#recsystems

सुझाव देने वाले सिस्टम का आखिरी चरण. इसमें स्कोर वाले आइटम को किसी दूसरे एल्गोरिदम (आम तौर पर, गैर-एमएल) के हिसाब से फिर से ग्रेड किया जा सकता है. फिर से रैंकिंग देने की सुविधा, स्कोरिंग चरण से जनरेट किए गए आइटम की सूची का आकलन करती है. इसके लिए, ये कार्रवाइयां की जाती हैं:

  • ऐसे आइटम हटाए जा रहे हैं जिन्हें उपयोगकर्ता ने पहले ही खरीद लिया है.
  • नए आइटम के स्कोर में बढ़ोतरी करना.

S

स्कोरिंग

#recsystems

सुझाव देने वाले सिस्टम का एक हिस्सा, जो उम्मीदवारों के चरण में बनाए गए हर आइटम के लिए कोई वैल्यू या रैंकिंग देता है.

U

यूज़र मैट्रिक्स

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट किया गया एम्बेड करने वाला वेक्टर होता है. इस वेक्टर में उपयोगकर्ता की पसंद के बारे में लेटेंट सिग्नल होते हैं. उपयोगकर्ता मैट्रिक्स की हर पंक्ति में किसी एक उपयोगकर्ता के लिए, अलग-अलग इंतज़ार के सिग्नल की मिलती-जुलती क्षमता के बारे में जानकारी होती है. उदाहरण के लिए, फ़िल्मों का सुझाव देने वाले सिस्टम के बारे में सोचें. इस सिस्टम में, यूज़र मैट्रिक्स में छिपे हुए सिग्नल, खास शैलियों में हर उपयोगकर्ता की दिलचस्पी दिखा सकते हैं या ऐसे सिग्नलों को समझने में मुश्किल हो सकता है जिनमें कई फ़ैक्टर के बीच जटिल इंटरैक्शन शामिल होते हैं.

यूज़र मैट्रिक्स में हर लेटेंट सुविधा के लिए एक कॉलम और हर उपयोगकर्ता के लिए एक लाइन होती है. इसका मतलब है कि यूज़र मैट्रिक्स में लाइन की संख्या, फ़ैक्टराइज़ किए जा रहे टारगेट मैट्रिक्स में भी उतनी ही है. जैसे, अगर 10,00,000 उपयोगकर्ताओं के लिए किसी फ़िल्म का सुझाव देने वाला सिस्टम दिया गया है, तो उपयोगकर्ता मैट्रिक्स में 10,00,000 लाइनें होंगी.

W

वेटेड अल्टरनेटिंग लेस्ट स्क्वेयर (वॉल)

#recsystems

एक ऐसा एल्गोरिदम जो सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन के दौरान मकसद फ़ंक्शन को कम करता है. इससे उन उदाहरणों को कम करके कम किया जा सकता है जो मौजूद नहीं हैं. WALS, लाइन फ़ैक्टराइज़ेशन और कॉलम फ़ैक्टराइज़ेशन को ठीक करके ओरिजनल मैट्रिक्स और रीकंस्ट्रक्शन के बीच वेटेड स्क्वेयर एरर को कम करता है. इनमें से हर ऑप्टिमाइज़ेशन को कॉन्टेक्स्ट ऑप्टिमाइज़ेशन के कम से कम स्क्वेयर से हल किया जा सकता है. ज़्यादा जानकारी के लिए, सुझाव देने वाले सिस्टम का कोर्स देखें.