इस पेज में सुझाव सिस्टम की ग्लॉसरी वाले शब्द हैं. शब्दावली के सभी शब्दों के लिए, यहां क्लिक करें.
C
कैंडिडेट जनरेशन
सुझावों का शुरुआती सेट, जिसे सुझाव देने वाले सिस्टम ने चुना है. उदाहरण के लिए, किसी ऐसे बुकस्टोर का इस्तेमाल करें जिस पर 1,00,000 किताबें मिलती हैं. कैंडिडेट जनरेशन फ़ेज़, किसी खास उपयोगकर्ता के लिए सही किताबों की बहुत छोटी सूची बनाता है, जैसे कि 500. हालांकि, किसी उपयोगकर्ता को 500 किताबें भी ज़्यादा सुझाव के तौर पर नहीं दिखाती हैं. इसके बाद, ज़्यादा महंगा, सुझाव देने वाले सिस्टम के चरण (जैसे कि स्कोरिंग और री-रैंकिंग) उन 500 को कम कर देते हैं और सुझाव के ज़्यादा छोटे और काम के सेट हो जाते हैं.
सहयोगी फ़िल्टरिंग
कई दूसरे उपयोगकर्ताओं की दिलचस्पी के आधार पर, किसी उपयोगकर्ता की दिलचस्पी के बारे में अनुमान लगाना. कोलैबोरेटिव फ़िल्टरिंग का इस्तेमाल अक्सर सुझाव देने वाले सिस्टम में किया जाता है.
I
आइटम मैट्रिक्स
सुझाव देने वाले सिस्टम में, एम्बेड किए जाने वाले वेक्टर का एक मैट्रिक्स होता है, जो मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट होता है. इसमें हर आइटम के बारे में लेटेंट सिग्नल होते हैं. आइटम मैट्रिक्स की हर लाइन में सभी आइटम के लिए, इंतज़ार के समय की एक सुविधा की वैल्यू होती है. उदाहरण के लिए, फ़िल्मों का सुझाव देने वाले सिस्टम के बारे में सोचें. आइटम मैट्रिक्स का हर कॉलम एक मूवी को दिखाता है. लेटेंट सिग्नल, शैलियों को दिखा सकते हैं या उन सिग्नल को समझना मुश्किल हो सकता है जिनमें शैली, स्टार, फ़िल्म की उम्र या दूसरी चीज़ों के बीच जटिल इंटरैक्शन शामिल होता है.
आइटम मैट्रिक्स में उतनी ही संख्या में कॉलम हैं जितने कि फ़ैक्टराइज़ किए जा रहे टारगेट मैट्रिक्स में हैं. उदाहरण के लिए, अगर किसी फ़िल्म के सुझाव देने वाला सिस्टम 10,000 फ़िल्मों का आकलन करता है, तो आइटम मैट्रिक्स में 10,000 कॉलम होंगे.
items
सुझाव देने वाले सिस्टम में, वे इकाइयां जिनका सुझाव सिस्टम देता है. उदाहरण के लिए, वीडियो वे आइटम हैं जिनके सुझाव, वीडियो स्टोर में देते हैं, जबकि किताबें ऐसे आइटम हैं जो किताबों का स्टोर सुझाव देता है.
सोम
मैट्रिक्स फ़ैक्टराइज़ेशन
गणित में, ऐसे आव्यूहों को खोजने का एक तरीका जिनका डॉट प्रॉडक्ट किसी टारगेट मैट्रिक्स का अनुमान लगाता है.
सुझाव देने वाले सिस्टम में, टारगेट मैट्रिक्स में उपयोगकर्ताओं की रेटिंग अक्सर items होती है. उदाहरण के लिए, किसी फ़िल्म का सुझाव देने वाले सिस्टम के लिए टारगेट मैट्रिक्स कुछ ऐसा दिख सकता है: जिसमें पॉज़िटिव पूर्णांक, उपयोगकर्ता रेटिंग हैं और 0 का मतलब है कि उपयोगकर्ता ने फ़िल्म को रेटिंग नहीं दी है:
कैसाब्लांका | द फ़िलाडेल्फ़िया स्टोरी | Black Panther | वंडर वुमन | पल्प फ़िक्शन | |
---|---|---|---|---|---|
यूज़र 1 | 5.0 | 3.0 | 0.0 | 2.0 | 0.0 |
यूज़र 2 | 4.0 | 0.0 | 0.0 | 1.0 | 5.0 |
यूज़र 3 | 3.0 | 1.0 | 4.0 | 5.0 | 0.0 |
फ़िल्मों के सुझाव देने वाले सिस्टम का काम, बिना रेटिंग वाली फ़िल्मों के लिए उपयोगकर्ता रेटिंग का अनुमान लगाना होता है. उदाहरण के लिए, क्या उपयोगकर्ता 1 को Black Panther पसंद होगी?
सुझाव देने वाले सिस्टम के लिए, एक तरीका यह है कि इन दो मैट्रिक्स को जनरेट करने के लिए, मैट्रिक्स फ़ैक्टराइज़ेशन का इस्तेमाल किया जाए:
- यूज़र मैट्रिक्स, उपयोगकर्ताओं की संख्या X के तौर पर आकार दिया जाता है. यह संख्या, एम्बेड किए गए डाइमेंशन की संख्या होती है.
- आइटम का मैट्रिक्स, यह एम्बेड किए गए डाइमेंशन की संख्या X के तौर पर आइटम की संख्या के रूप में दिखता है.
उदाहरण के लिए, हमारे तीन उपयोगकर्ताओं और पांच आइटम पर मैट्रिक्स फ़ैक्टराइज़ेशन का इस्तेमाल करने से, नीचे दिया गया यूज़र मैट्रिक्स और आइटम मैट्रिक्स मिल सकता है:
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
यूज़र मैट्रिक्स और आइटम मैट्रिक्स का डॉट प्रॉडक्ट, सुझाव वाली एक मैट्रिक्स देता है. इसमें सिर्फ़ मूल उपयोगकर्ता रेटिंग ही नहीं, बल्कि उन फ़िल्मों के लिए भी अनुमान होते हैं जिन्हें हर उपयोगकर्ता ने नहीं देखा है. उदाहरण के लिए, उपयोगकर्ता 1 की Casablanca की रेटिंग देखें, जो 5.0 थी. उम्मीद है कि सुझाव मैट्रिक्स में उस सेल से जुड़े डॉट प्रॉडक्ट की संख्या 5.0 होनी चाहिए और यह:
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
इससे भी अहम बात यह है कि क्या उपयोगकर्ता 1, Black Panther को पसंद करेगा? पहली पंक्ति और तीसरे कॉलम के हिसाब से डॉट प्रॉडक्ट लेने पर, 4.3 की अनुमानित रेटिंग मिलती है:
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
आम तौर पर, मैट्रिक्स फ़ैक्टराइज़ेशन से यूज़र मैट्रिक्स और आइटम मैट्रिक्स मिलते हैं, जो साथ मिलकर, टारगेट मैट्रिक्स की तुलना में काफ़ी छोटे होते हैं.
R
सुझाव देने वाला सिस्टम
ऐसा सिस्टम जो हर उपयोगकर्ता के लिए, एक बड़े संग्रह में से ज़रूरी आइटम का एक छोटा सेट चुनता है. उदाहरण के लिए, वीडियो का सुझाव देने वाला सिस्टम,1, 00, 000 वीडियो के संग्रह से दो वीडियो का सुझाव दे सकता है. इनमें एक उपयोगकर्ता के लिए कासाब्लांका और फ़िलाडेल्फ़िया स्टोरी और दूसरे उपयोगकर्ता के लिए वंडर वुमन और ब्लैक पैंथर को चुना जा सकता है. वीडियो का सुझाव देने वाला सिस्टम, इन चीज़ों के आधार पर वीडियो के सुझाव दे सकता है:
- ऐसी फ़िल्में जिन्हें मिलते-जुलते उपयोगकर्ताओं ने रेटिंग दी है या देखा है.
- शैली, निर्देशक, अभिनेता, टारगेट डेमोग्राफ़िक...
फिर से रैंकिंग
सुझाव देने वाले सिस्टम का आखिरी चरण. इसमें स्कोर वाले आइटम को किसी दूसरे एल्गोरिदम (आम तौर पर, गैर-एमएल) के हिसाब से फिर से ग्रेड किया जा सकता है. फिर से रैंकिंग देने की सुविधा, स्कोरिंग चरण से जनरेट किए गए आइटम की सूची का आकलन करती है. इसके लिए, ये कार्रवाइयां की जाती हैं:
- ऐसे आइटम हटाए जा रहे हैं जिन्हें उपयोगकर्ता ने पहले ही खरीद लिया है.
- नए आइटम के स्कोर में बढ़ोतरी करना.
S
स्कोरिंग
सुझाव देने वाले सिस्टम का एक हिस्सा, जो उम्मीदवारों के चरण में बनाए गए हर आइटम के लिए कोई वैल्यू या रैंकिंग देता है.
U
यूज़र मैट्रिक्स
सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन से जनरेट किया गया एम्बेड करने वाला वेक्टर होता है. इस वेक्टर में उपयोगकर्ता की पसंद के बारे में लेटेंट सिग्नल होते हैं. उपयोगकर्ता मैट्रिक्स की हर पंक्ति में किसी एक उपयोगकर्ता के लिए, अलग-अलग इंतज़ार के सिग्नल की मिलती-जुलती क्षमता के बारे में जानकारी होती है. उदाहरण के लिए, फ़िल्मों का सुझाव देने वाले सिस्टम के बारे में सोचें. इस सिस्टम में, यूज़र मैट्रिक्स में छिपे हुए सिग्नल, खास शैलियों में हर उपयोगकर्ता की दिलचस्पी दिखा सकते हैं या ऐसे सिग्नलों को समझने में मुश्किल हो सकता है जिनमें कई फ़ैक्टर के बीच जटिल इंटरैक्शन शामिल होते हैं.
यूज़र मैट्रिक्स में हर लेटेंट सुविधा के लिए एक कॉलम और हर उपयोगकर्ता के लिए एक लाइन होती है. इसका मतलब है कि यूज़र मैट्रिक्स में लाइन की संख्या, फ़ैक्टराइज़ किए जा रहे टारगेट मैट्रिक्स में भी उतनी ही है. जैसे, अगर 10,00,000 उपयोगकर्ताओं के लिए किसी फ़िल्म का सुझाव देने वाला सिस्टम दिया गया है, तो उपयोगकर्ता मैट्रिक्स में 10,00,000 लाइनें होंगी.
W
वेटेड अल्टरनेटिंग लेस्ट स्क्वेयर (वॉल)
एक ऐसा एल्गोरिदम जो सुझाव देने वाले सिस्टम में, मैट्रिक्स फ़ैक्टराइज़ेशन के दौरान मकसद फ़ंक्शन को कम करता है. इससे उन उदाहरणों को कम करके कम किया जा सकता है जो मौजूद नहीं हैं. WALS, लाइन फ़ैक्टराइज़ेशन और कॉलम फ़ैक्टराइज़ेशन को ठीक करके ओरिजनल मैट्रिक्स और रीकंस्ट्रक्शन के बीच वेटेड स्क्वेयर एरर को कम करता है. इनमें से हर ऑप्टिमाइज़ेशन को कॉन्टेक्स्ट ऑप्टिमाइज़ेशन के कम से कम स्क्वेयर से हल किया जा सकता है. ज़्यादा जानकारी के लिए, सुझाव देने वाले सिस्टम का कोर्स देखें.