वापस पाना

मान लें कि आपके पास एम्बेड करने का एक मॉडल है. किसी उपयोगकर्ता को देखते हुए, तय करें कि किन आइटम का सुझाव देना है?

क्वेरी देखते समय, इनमें से कोई एक काम करके शुरुआत की जा सकती है:

  • मैट्रिक्स गुणनखंडन मॉडल के लिए, क्वेरी (या उपयोगकर्ता) एम्बेड करने की जानकारी पता होती है स्थिर रूप से होता है और सिस्टम उसे उपयोगकर्ता एम्बेड करने वाला मैट्रिक्स.
  • सिस्टम, डीएनएन मॉडल के लिए क्वेरी को एम्बेड करने की प्रोसेस का हिसाब लगाता है \(\psi(x)\) सुविधा वेक्टर पर नेटवर्क चलाकर, सर्व किए जाने की संख्या का इस्तेमाल करें \(x\).

क्वेरी एम्बेड करने \(q\)के बाद, आइटम एम्बेड करने की खोज करें \(V_j\) जो एम्बेडिंग स्पेस में \(q\) के करीब है. यह सबसे नज़दीकी समस्या है. उदाहरण के लिए, आप शीर्ष k वापस लौटा सकते हैं समानता स्कोर के हिसाब से आइटम \(s(q, V_j)\).

कई मूवी और उपयोगकर्ताओं के साथ व्यवस्थित दो डाइमेंशन वाले स्पेक्ट्रम की इमेज
बच्चों की फ़िल्मों से लेकर वयस्कों की फ़िल्मों तक, आर्टहाउस से लेकर ब्लॉकबस्टर तक. एक उपयोगकर्ता है
साथ ही, आस-पास की दो फ़िल्में हाइलाइट की गईं.

मिलते-जुलते सामान के सुझाव देने के लिए, इसी तरीके का इस्तेमाल किया जा सकता है. उदाहरण के लिए, जब कोई YouTube वीडियो देख रहा होता है, तो सिस्टम सबसे पहले उस आइटम को एम्बेड करें और फिर अन्य आइटम को एम्बेड करने के लिए देखें \(V_j\) जो एम्बेड किए गए स्पेस में काफ़ी करीब है.

बड़े पैमाने पर डेटा हासिल करना

एम्बेड किए जा रहे स्पेस में, आस-पास के आस-पास के लोगों की गणना करने के लिए, सिस्टम हर संभावित उम्मीदवार को स्कोर दे सकते हैं. बेहतरीन स्कोरिंग बहुत बड़े कॉर्पोरा के लिए महंगा हो सकता है, लेकिन इनमें से किसी भी इन रणनीतियों का इस्तेमाल किया जा सकेगा:

  • अगर क्वेरी को एम्बेड करने की प्रोसेस के बारे में स्टैटिक जानकारी मौजूद हो, तो सिस्टम यह काम कर सकता है: पूरी जानकारी के साथ स्कोर करना, हर क्वेरी के लिए सबसे सही उम्मीदवार चुनें. यह उनके लिए एक सामान्य तरीका है मिलते-जुलते आइटम का सुझाव.
  • करीब-करीब आस-पास के लोगों की जानकारी का इस्तेमाल करें.