कोलैबोरेटिव फ़िल्टरिंग

कॉन्टेंट के हिसाब से फ़िल्टर करने की सुविधा की कुछ सीमाओं का पता लगाने के लिए, मिलकर काम करने के लिए फ़िल्टर करने की सुविधा इस्तेमाल करके, उपयोगकर्ताओं और आइटम एक साथ इस्तेमाल करें. इससे आपको अचानक मिलने वाले सुझावों के लिए; इसका मतलब है कि सभी के साथ मिलकर काम करने के लिए फ़िल्टर करने की सुविधा मॉडल, उपयोगकर्ता A को आइटम का सुझाव दे सकते हैं. ऐसा उनकी दिलचस्पी के आधार पर किया जाएगा एक मिलता-जुलता उपयोगकर्ता B. इसके अलावा, एम्बेड करने से जुड़ा कॉन्टेंट और इसके लिए हैंड-इंजीनियरिंग की ज़रूरत नहीं है.

फ़िल्म के सुझाव का उदाहरण

फ़िल्म के सुझाव देने वाले एक ऐसे सिस्टम पर विचार करें जिसमें ट्रेनिंग डेटा में जिसमें:

  • हर पंक्ति एक उपयोगकर्ता की जानकारी देती है.
  • हर कॉलम में एक आइटम (फ़िल्म) दिखता है.

फ़िल्मों के बारे में सुझाव/राय/शिकायत इन दो में से किसी एक कैटगरी में आती है:

  • अश्लील— उपयोगकर्ता यह बताते हैं कि उन्हें कोई खास फ़िल्म कितनी पसंद आई को रेटिंग दें.
  • इंप्लिसिट—अगर कोई उपयोगकर्ता किसी फ़िल्म को देखता है, तो सिस्टम यह अनुमान लगाता है कि उपयोगकर्ता की दिलचस्पी है.

आसान शब्दों में, हम यह मानेंगे कि फ़ीडबैक मैट्रिक्स बाइनरी है; यानी, एक मान का 1 हिस्सा मूवी में रुचि दिखाता है.

जब कोई व्यक्ति होम पेज पर जाता है, तो सिस्टम को फ़िल्मों के सुझाव देने चाहिए दोनों पर आधारित है:

  • उन फ़िल्मों से मिलती-जुलती फ़िल्में जिन्हें उपयोगकर्ता ने पहले पसंद किया है
  • ऐसी फ़िल्में जिन्हें मिलते-जुलते उपयोगकर्ताओं ने पसंद किया

उदाहरण के लिए, चलिए फ़िल्म की कुछ सुविधाओं की मदद से यहां दी गई टेबल में बताया गया है:

मूवी Rating ब्यौरा
द डार्क नाइट राइज़ PG-13 गॉथम शहर को परमाणु तबाही से बचाने की कोशिश करता बैटमैन इस अगली कड़ी में द डार्क नाइट, डीसी के हिसाब से सेट किया गया कॉमिक्स की दुनिया.
हैरी पॉटर और पारस पत्थर PG एक अनाथ लड़के को पता चलता है कि वह जादूगर है और वह घर में रजिस्टर हो जाता है हॉगवर्ट्स स्कूल ऑफ़ जादू-टोना और जादू-टोना, जहां वह दुश्मनों के ख़िलाफ़ अपनी पहली लड़ाई में हिस्सा लेता है शैतान लॉर्ड वोल्डेमॉर्ट के नाम से जाना जाता है.
श्रेक PG एक प्यारा राक्षसी और उसका गधा साथी, जो मिशन पर निकल पड़ता है उसे बचाने के लिए, जिसने प्रिंसेस फ़ियोना को उसके महल में एक ड्रैगन ने अपने काम को कैद किया है.
द ट्रिपलेट्स ऑफ़ बेलेविल PG-13 जब पेशेवर साइकलर चैंपियन का अपहरण हो जाता है टूर दे फ़्रांस, उसकी दादी और ज़्यादा वज़न वाला कुत्ता उसे बचाने के लिए विदेश यात्रा करता है. इसमें जैज़ संगीत के तीन बुज़ुर्गों की मदद ली गई है.
मेमेंटो R अपनी पत्नी की हत्या की कोशिश में, डूबा हुआ व्यक्ति उसके शरीर पर सुरागों की मदद से.

1D एम्बेड करना

मान लें कि हम हर फ़िल्म को एक अदिश राशि असाइन करते हैं \([-1, 1]\) जो यह बताता है कि भले ही, फ़िल्म बच्चों (नेगेटिव वैल्यू) के लिए हो या वयस्कों (पॉज़िटिव वैल्यू) के लिए हो. मान लें कि हम \([-1, 1]\) में हर उपयोगकर्ता को एक स्केलर भी असाइन करते हैं, जो बच्चों की फ़िल्मों (1 से 1 के करीब) या वयस्क लोगों में उपयोगकर्ता की दिलचस्पी मूवी (+1 के करीब). मूवी एम्बेड करने की सुविधा और उपयोगकर्ता का प्रॉडक्ट उन फ़िल्मों के लिए एम्बेडिंग उच्च (1 के करीब) होनी चाहिए जिनके लिए हम उपयोगकर्ता के होने की उम्मीद करते हैं पसंद करना है.

इमेज में कई फ़िल्में और उपयोगकर्ता दिखाए गए हैं. इन्हें एक डाइमेंशन वाली एम्बेड करने की जगह पर रखा गया है. इस ऐक्सिस पर हर फ़िल्म की पोज़िशन यह बताती है कि यह बच्चों की फ़िल्म है (बाएं) या वयस्क फ़िल्म (दाएं). उपयोगकर्ता की पोज़िशन, बच्चों या वयस्कों के लिए बनी फ़िल्मों में दिलचस्पी के बारे में बताती है.

नीचे दिए गए डायग्राम में, हर सही का निशान एक ऐसी फ़िल्म की पहचान करता है जो उपयोगकर्ता ने देखा. तीसरे और चौथे उपयोगकर्ताओं ने अपनी प्राथमिकताएं इस सुविधा में इसके बारे में अच्छी तरह से बताया गया है—तीसरे उपयोगकर्ता को बच्चों के लिए फ़िल्में पसंद हैं और चौथे उपयोगकर्ता को वयस्कों के लिए फ़िल्में पसंद हैं. हालांकि, पहला और दूसरा उपयोगकर्ताओं का इस एक सुविधा में प्राथमिकताओं को अच्छी तरह नहीं समझाया गया है.

फ़ीडबैक मैट्रिक्स की इमेज, जहां पंक्ति किसी उपयोगकर्ता की जानकारी देती है और कॉलम किसी मूवी से जुड़ा हुआ है. हर उपयोगकर्ता और हर फ़िल्म को एक-डाइमेंशन में एम्बेड करने के लिए मैप किया जाता है (जैसा कि पिछले डायग्राम में बताया गया है), ताकि दो एम्बेडिंग प्रॉडक्ट, फ़ीडबैक मैट्रिक्स में ज़मीनी हकीकत का अनुमान लगा सकें.

2D एम्बेड करना

सभी उपयोगकर्ताओं की प्राथमिकताएं समझाने के लिए, एक सुविधा काफ़ी नहीं थी. से आगे बढ़ने में चलिए, दूसरी सुविधा जोड़ते हैं: हर मूवी ब्लॉकबस्टर या आर्टहाउस फ़िल्म. दूसरी सुविधा के ज़रिए, अब हम लोगों को प्रत्येक मूवी में निम्न दो-आयामी एम्बेडिंग शामिल हैं:

इमेज में कई फ़िल्में और उपयोगकर्ता दिख रहे हैं. इन्हें दो डाइमेंशन में एम्बेड करने की जगह पर रखा गया है. हॉरिज़ॉन्टल ऐक्सिस पर हर फ़िल्म की पोज़िशन यह बताती है कि यह बच्चों की फ़िल्म है (बाएं) या वयस्क फ़िल्म (दाएं); वर्टिकल ऐक्सिस की पोज़िशन से पता चलता है कि यह ब्लॉकबस्टर फ़िल्म (टॉप) है या आर्टहाउस फ़िल्म (सबसे नीचे) है. उपयोगकर्ताओं की जगह से, हर कैटगरी में उनकी दिलचस्पी के बारे में पता चलता है.

हम अपने उपयोगकर्ताओं को फिर से उसी एम्बेड स्पेस में रखते हैं जिससे उन्हें सही तरीके से समझाया जा सके फ़ीडबैक मैट्रिक्स: हर (उपयोगकर्ता, आइटम) पेयर के लिए, हम चाहते हैं कि जहां उपयोगकर्ता एम्बेड हो रहा है उसका डॉट प्रॉडक्ट और वह आइटम जिसे एम्बेड किया जा रहा है उपयोगकर्ता के फ़िल्म देखने पर 1 तक होनी चाहिए और अगर नहीं, तो 0 है.

एक ही फ़ीडबैक मैट्रिक्स की इमेज. इस बार, हर उपयोगकर्ता और हर फ़िल्म को दो-डाइमेंशन में एम्बेड करने के लिए मैप किया गया है (जैसा कि पिछले डायग्राम में बताया गया है), ताकि दो एम्बेडिंग के डॉट प्रॉडक्ट, फ़ीडबैक मैट्रिक्स में ज़मीनी सच्चाई का अनुमान लगा सकें.

इस उदाहरण में, हमने एम्बेड की गई चीज़ों को अपने हिसाब से बनाया है. असल में, एम्बेड करना इसे अपने-आप सीखा जा सकता है, जो साथ मिलकर फ़िल्टर करने की क्षमता है. मॉडल. अगले दो सेक्शन में, हम अलग-अलग मॉडल के बारे में चर्चा करेंगे. और उन्हें ट्रेनिंग देने का तरीका भी बताया गया है.

यह तरीका तब साफ़ तौर पर दिखता है, जब मॉडल एम्बेड करना. मान लें कि फ़िल्मों के लिए एम्बेड करने वाले वेक्टर तय हैं. इसके बाद, यह मॉडल, लोगों को एम्बेड करने वाले वेक्टर के बारे में जानकारी दे सकता है. इससे लोगों को, इसके बारे में बेहतर जानकारी मिलेगी उनकी प्राथमिकताएँ चुनें. इस वजह से, मिलती-जुलती प्राथमिकताओं वाले उपयोगकर्ताओं को एम्बेड करना एक-दूसरे के नज़दीक होंगे. इसी तरह, अगर एम्बेड करने की सेटिंग तय कर दी गई है, तो हम फ़ीडबैक मैट्रिक्स को सबसे अच्छी तरह से समझाने के लिए, मूवी एम्बेड करना सीख सकते हैं. इस वजह से, एक जैसे उपयोगकर्ताओं की पसंद की गई फ़िल्मों को एम्बेड करने की सुविधा बंद हो जाएगी तो उसे एम्बेड करने की जगह.

देखें कि आपको कितना समझ आया है

यह मॉडल उपयोगकर्ता को किसी शॉपिंग ऐप्लिकेशन का सुझाव देता है, क्योंकि हाल ही में ने कोई मिलता-जुलता ऐप्लिकेशन इंस्टॉल किया है. यह किस तरह की फ़िल्टर का उदाहरण है?
कॉन्टेंट के हिसाब से फ़िल्टर करना
बहुत खूब! कॉन्टेंट के हिसाब से फ़िल्टर करने की सुविधा, दूसरे उपयोगकर्ताओं के हिसाब से डेटा फ़िल्टर नहीं करती.
कोलैबोरेटिव फ़िल्टरिंग
कोलैबोरेटिव फ़िल्टरिंग दूसरे उपयोगकर्ताओं को ध्यान में रखती है. इस दी गई स्थिति में, हम सिर्फ़ एक उपयोगकर्ता की परवाह करते हैं.