मशीन लर्निंग शब्दावली: सुझाव देने वाले सिस्टम

इस पेज पर, सुझाव देने वाले सिस्टम की ग्लॉसरी के शब्द मौजूद हैं. ग्लॉसरी में मौजूद सभी शब्दों के लिए, यहां क्लिक करें.

C

संभावित ग्राहक जनरेशन

#recsystems

सुझाव देने वाले सिस्टम से मिले सुझावों का शुरुआती सेट. उदाहरण के लिए, एक ऐसे किताबों के स्टोर पर विचार करें जो 1,00,000 किताबें उपलब्ध कराता है. संभावित किताबों की सूची बनाने के चरण में, किसी उपयोगकर्ता के लिए, ज़रूरत के मुताबिक किताबों की एक छोटी सूची बनाई जाती है. जैसे, 500 किताबें. हालांकि, किसी उपयोगकर्ता को 500 किताबों के सुझाव देना भी बहुत ज़्यादा है. सुझाव देने वाले सिस्टम के बाद के चरणों में, स्कोरिंग और फिर से रैंकिंग जैसी ज़्यादा खर्चीली प्रोसेस की मदद से, उन 500 सुझावों को कम कर दिया जाता है. साथ ही, उन्हें ज़्यादा काम के सुझावों के सेट में बदल दिया जाता है.

ज़्यादा जानकारी के लिए, सुझाव देने वाले सिस्टम के कोर्स में उम्मीदवारों के जनरेशन की खास जानकारी देखें.

कोलैबोरेटिव फ़िल्टरिंग

#recsystems

कई अन्य उपयोगकर्ताओं की दिलचस्पी के आधार पर, किसी एक उपयोगकर्ता की दिलचस्पी के बारे में अनुमान लगाना. कोलैबोरेटिव फ़िल्टरिंग का इस्तेमाल, अक्सर सुझाव देने वाले सिस्टम में किया जाता है.

ज़्यादा जानकारी के लिए, सुझाव देने वाले सिस्टम के कोर्स में एक साथ फ़िल्टर करने की सुविधा देखें.

I

आइटम मैट्रिक्स

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक फ़ैक्टरिज़ेशन की मदद से जनरेट किए गए एम्बेड किए गए वैक्टर की मैट्रिक होती है. इसमें हर आइटम के बारे में लेटेंट सिग्नल होते हैं. आइटम मैट्रिक की हर पंक्ति में, सभी आइटम के लिए एक ही लатент फ़ीचर की वैल्यू होती है. उदाहरण के लिए, फ़िल्म के सुझाव देने वाला सिस्टम. आइटम मैट्रिक में मौजूद हर कॉलम, एक फ़िल्म के बारे में बताता है. लेटलेंट सिग्नल से शैलियों के बारे में पता चल सकता है. इसके अलावा, ये ऐसे सिग्नल भी हो सकते हैं जिनका विश्लेषण करना मुश्किल हो. इनमें शैली, स्टार, फ़िल्म की उम्र या अन्य फ़ैक्टर के बीच जटिल इंटरैक्शन शामिल होते हैं.

आइटम मैट्रिक में कॉलम की संख्या उतनी ही होती है जितनी फ़ैक्टराइज़ की जा रही टारगेट मैट्रिक में होती है. उदाहरण के लिए, अगर फ़िल्म के सुझाव देने वाला कोई सिस्टम, 10,000 फ़िल्मों के टाइटल का आकलन करता है, तो आइटम मैट्रिक में 10,000 कॉलम होंगे.

आइटम

#recsystems

सुझाव देने वाले सिस्टम में, वे इकाइयां जिनका सुझाव सिस्टम देता है. उदाहरण के लिए, वीडियो ऐसे आइटम होते हैं जिनका सुझाव वीडियो स्टोर देता है, जबकि किताबें ऐसे आइटम होते हैं जिनका सुझाव किताबों की दुकान देता है.

M

मैट्रिक्स फ़ैक्टरिज़ेशन

#recsystems

गणित में, मैट्रिक्स ढूंढने का एक तरीका, जिसका डॉट प्रॉडक्ट टारगेट मैट्रिक्स के करीब होता है.

सुझाव देने वाले सिस्टम में, टारगेट मैट्रिक में अक्सर आइटम पर उपयोगकर्ताओं की रेटिंग होती है. उदाहरण के लिए, मूवी के सुझाव देने वाले सिस्टम के लिए टारगेट मैट्रिक कुछ इस तरह दिख सकती है. इसमें, पॉज़िटिव पूर्णांक, उपयोगकर्ता की रेटिंग हैं और 0 का मतलब है कि उपयोगकर्ता ने मूवी को रेटिंग नहीं दी है:

  कैसाब्लांका द फ़िलाडेल्फ़िया स्टोरी Black Panther वंडर वुमन दिल से
उपयोगकर्ता 1 5.0 3.0 0.0 2.0 0.0
उपयोगकर्ता 2 4.0 0.0 0.0 1.0 5.0
उपयोगकर्ता 3 3.0 1.0 4.0 5.0 0.0

फ़िल्म के सुझाव देने वाले सिस्टम का मकसद, रेटिंग नहीं दी गई फ़िल्मों के लिए उपयोगकर्ताओं की रेटिंग का अनुमान लगाना है. उदाहरण के लिए, क्या उपयोगकर्ता 1 को ब्लैक पैंथर पसंद आएगा?

सुझाव देने वाले सिस्टम के लिए एक तरीका यह है कि इन दो मैट्रिक को जनरेट करने के लिए, मैट्रिक के फ़ैक्टर का इस्तेमाल किया जाए:

  • उपयोगकर्ता मैट्रिक, जिसका साइज़ उपयोगकर्ताओं की संख्या X एम्बेड किए गए डाइमेंशन की संख्या के हिसाब से होता है.
  • आइटम मैट्रिक, जिसका साइज़ एम्बेड किए गए डाइमेंशन की संख्या x आइटम की संख्या के हिसाब से होता है.

उदाहरण के लिए, तीन उपयोगकर्ताओं और पांच आइटम पर मैट्रिक फ़ैक्टरिज़ेशन का इस्तेमाल करने से, उपयोगकर्ता मैट्रिक और आइटम मैट्रिक इस तरह की हो सकती है:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

उपयोगकर्ता मैट्रिक और आइटम मैट्रिक के डॉट प्रॉडक्ट से, सुझाव वाली एक मैट्रिक बनती है. इसमें न सिर्फ़ उपयोगकर्ता की ओरिजनल रेटिंग होती है, बल्कि उन फ़िल्मों के लिए भी अनुमान होते हैं जिन्हें हर उपयोगकर्ता ने नहीं देखा है. उदाहरण के लिए, मान लें कि उपयोगकर्ता 1 ने Casablanca को 5.0 रेटिंग दी है. उम्मीद है कि सुझाव मैट्रिक में उस सेल से जुड़ा बिंदु प्रॉडक्ट करीब 5.0 होगा. यह इस तरह दिखता है:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

सबसे अहम बात यह है कि क्या उपयोगकर्ता 1 को ब्लैक पैंथर पसंद आएगा? पहली पंक्ति और तीसरे कॉलम के डॉट प्रॉडक्ट से, रेटिंग का अनुमानित वैल्यू 4.3 मिलती है:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

मैट्रिक फ़ैक्टरिज़ेशन से आम तौर पर, उपयोगकर्ता मैट्रिक और आइटम मैट्रिक मिलती है. ये दोनों मैट्रिक, टारगेट मैट्रिक के मुकाबले काफ़ी छोटी होती हैं.

R

सुझाव देने वाला सिस्टम

#recsystems

यह एक ऐसा सिस्टम है जो हर उपयोगकर्ता के लिए, बड़े कॉर्पस से, पसंदीदा आइटम का एक छोटा सेट चुनता है. उदाहरण के लिए, वीडियो के सुझाव देने वाला सिस्टम, 1,00,000 वीडियो के कॉर्पस में से दो वीडियो का सुझाव दे सकता है. जैसे, एक उपयोगकर्ता के लिए Casablanca और The Philadelphia Story और दूसरे उपयोगकर्ता के लिए Wonder Woman और Black Panther. वीडियो के सुझाव देने वाला सिस्टम, इन बातों के आधार पर सुझाव दे सकता है:

  • ऐसी फ़िल्में जिन्हें आपके जैसे उपयोगकर्ताओं ने रेटिंग दी है या देखी हैं.
  • शैली, डायरेक्टर, कलाकार, टारगेट डेमोग्राफ़िक...

फिर से रैंकिंग

#recsystems

सुझाव देने वाले सिस्टम का आखिरी चरण, जिस दौरान स्कोर वाले आइटम को किसी दूसरे (आम तौर पर, नॉन-एमएल) एल्गोरिदम के हिसाब से फिर से ग्रेड किया जा सकता है. फिर से रैंकिंग करने की प्रोसेस में, स्कोरिंग फ़ेज़ से जनरेट की गई आइटम की सूची का आकलन किया जाता है. इसके लिए, ये कार्रवाइयां की जाती हैं:

  • उपयोगकर्ता ने जो आइटम पहले से खरीदे हैं उन्हें हटाना.
  • नए आइटम का स्कोर बढ़ाना.

S

स्कोरिंग

#recsystems

सुझाव देने वाले सिस्टम का वह हिस्सा जो कैन्डिडेट जनरेशन फ़ेज़ से तैयार किए गए हर आइटम के लिए वैल्यू या रैंकिंग देता है.

U

उपयोगकर्ता मैट्रिक

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक फ़ैक्टरिज़ेशन की मदद से जनरेट किया गया एम्बेडिंग वेक्टर, जो उपयोगकर्ता की प्राथमिकताओं के बारे में छिपे हुए सिग्नल रखता है. यूज़र मैट्रिक की हर लाइन में, किसी एक उपयोगकर्ता के लिए अलग-अलग लेटल सिग्नल की तुलनात्मक क्षमता के बारे में जानकारी होती है. उदाहरण के लिए, फ़िल्म के सुझाव देने वाला सिस्टम. इस सिस्टम में, यूज़र मैट्रिक्स में मौजूद लेटल सिग्नल, किसी खास शैली में हर उपयोगकर्ता की दिलचस्पी दिखा सकते हैं. इसके अलावा, ये ऐसे सिग्नल भी हो सकते हैं जिनका विश्लेषण करना मुश्किल हो, क्योंकि इनमें कई फ़ैक्टर के साथ जटिल इंटरैक्शन शामिल होते हैं.

यूज़र मैट्रिक में, हर लатент फ़ीचर के लिए एक कॉलम और हर उपयोगकर्ता के लिए एक लाइन होती है. इसका मतलब है कि उपयोगकर्ता मैट्रिक में उतनी ही पंक्तियां होती हैं जितनी टारगेट मैट्रिक में होती हैं. उदाहरण के लिए, अगर 1,000,000 उपयोगकर्ताओं के लिए मूवी के सुझाव देने वाला सिस्टम दिया गया है, तो उपयोगकर्ता मैट्रिक में 1,000,000 लाइनें होंगी.

W

वेटेड ऐल्टरनेटिंग लीस्ट स्क्वेयर (WALS)

#recsystems

सुझाव देने वाले सिस्टम में, मैट्रिक फ़ैक्टोराइज़ेशन के दौरान मकसद के फ़ंक्शन को कम करने के लिए एल्गोरिदम. इससे, मौजूद न होने वाले उदाहरणों को कम अहमियत दी जा सकती है. WALS, ओरिजनल मैट्रिक्स और फिर से बनाए गए मैट्रिक्स के बीच, वज़न वाले स्क्वेयर्ड एरर को कम करता है. इसके लिए, यह पंक्ति के फ़ैक्टर और कॉलम के फ़ैक्टर को ठीक करके, बारी-बारी से काम करता है. इनमें से हर ऑप्टिमाइज़ेशन को, कम से कम स्क्वेयर्स कॉन्वेक्स ऑप्टिमाइज़ेशन से हल किया जा सकता है. ज़्यादा जानकारी के लिए, सुझाव देने वाले सिस्टम का कोर्स देखें.