फिर से रैंकिंग

सुझाव देने वाले सिस्टम के आखिरी चरण में, सिस्टम अन्य मानदंडों या शर्तों पर विचार कर सकते हैं. एक री-रैंकिंग का तरीका ऐसे फ़िल्टर का इस्तेमाल करना है जो कुछ उम्मीदवारों को हटा देते हैं.

री-रैंकिंग का दूसरा तरीका, लौटाए गए स्कोर को मैन्युअल तौर पर बदलना है रैंकर के हिसाब से.

इस सेक्शन में नएपन, विविधता, और निष्पक्षता के बारे में बातचीत की गई है. ये कई बातें हैं, जिनसे आपको वीडियो के सुझाव बेहतर बनाने में मदद मिल सकती है सिस्टम. इनमें से कुछ चीज़ों के लिए, अक्सर अलग-अलग स्टेज में बदलाव करना पड़ता है प्रक्रिया के बारे में बताया है. हर सेक्शन में, ऐसे समाधान दिए गए हैं जिन्हें आप लागू कर सकते हैं अलग-अलग या सामूहिक रूप से.

ताज़ा खबरें

ज़्यादातर सुझाव देने वाले सिस्टम का मकसद, इस्तेमाल के बारे में नई जानकारी, जैसे कि मौजूदा उपयोगकर्ता का इतिहास और सबसे नए आइटम. मॉडल को नया बनाए रखना इससे मॉडल को अच्छे सुझाव देने में मदद मिलती है.

समाधान

  • नए ट्रेनिंग डेटा के बारे में जानने के लिए, जितनी बार हो सके उतनी बार ट्रेनिंग फिर से चलाएं. हमारा सुझाव है कि आप ट्रेनिंग को वॉर्म-स्टार्ट करें, ताकि मॉडल का इस्तेमाल करें. वॉर्म-स्टार्टिंग से ट्रेनिंग में काफ़ी कमी आ सकती है समय. उदाहरण के लिए, मैट्रिक्स गुणनखंडन में, ऐसे आइटम जो मॉडल के पिछले इंस्टेंस में मौजूद थे.
  • "औसत" बनाएं आव्यूह गुणनखंडन में नए उपयोगकर्ताओं को दिखाने के लिए उपयोगकर्ता मॉडल. आपको हर उपयोगकर्ता के लिए एक ही एम्बेड करने की ज़रूरत नहीं है—आप उपयोगकर्ता की सुविधाओं के आधार पर, उपयोगकर्ताओं के क्लस्टर बना सकता है.
  • डीएनएन का इस्तेमाल करें, जैसे कि सॉफ़्टमैक्स मॉडल या दो-टावर मॉडल. मॉडल को सुविधा वेक्टर का इस्तेमाल इनपुट के तौर पर किया जाता है, तो इसे ऐसी क्वेरी या आइटम पर चलाया जा सकता है जो ट्रेनिंग के दौरान दिखा.
  • सुविधा के तौर पर दस्तावेज़ की उम्र की जानकारी जोड़ें. उदाहरण के लिए, YouTube वीडियो की उम्र जोड़ सकता है या सुविधा के रूप में इसे पिछली बार कब देखा गया था.

उल्लू के बारे में सुझाए गए चार वीडियो की इमेज.

विविधता

अगर सिस्टम हमेशा ऐसे आइटम के सुझाव देता है जो "सबसे नज़दीकी" हैं क्वेरी के लिए हैं, तो उम्मीदवार एक-दूसरे से काफ़ी मिलते-जुलते होते हैं. यह विविधता की कमी से उपयोगकर्ता अनुभव खराब या उबाऊ हो सकता है. उदाहरण के लिए, अगर YouTube सिर्फ़ उन वीडियो से मिलते-जुलते वीडियो के सुझाव देता है जो फ़िलहाल, लोग उल्लू के वीडियो देख रहे हैं. जैसे, उल्लू के वीडियो (जैसा कि इमेज में दिखाया गया है), उपयोगकर्ता की दिलचस्पी जल्द ही खत्म हो जाएगी.

समाधान

  • अलग-अलग सोर्स का इस्तेमाल करके, अलग-अलग उम्मीदवारों को ट्रेनिंग दें.
  • अलग-अलग मकसद वाले फ़ंक्शन का इस्तेमाल करके, अलग-अलग रैंकर को ट्रेनिंग दें.
  • विविधता को पक्का करने के लिए शैली या दूसरे मेटाडेटा के आधार पर आइटम को फिर से रैंक करें.

निष्पक्षता

आपके मॉडल को सभी उपयोगकर्ताओं के साथ निष्पक्ष व्यवहार करना चाहिए. इसलिए, यह पक्का करें कि आपका मॉडल, ट्रेनिंग डेटा से अनजाने में किए जाने वाले पक्षपात को नहीं सीख रहा है.

समाधान

  • ऐप्लिकेशन के डिज़ाइन और डेवलपमेंट की प्रक्रिया में अलग-अलग लोगों के नज़रिए को शामिल करें.
  • बेहतर डेटा सेट पर एमएल मॉडल को ट्रेनिंग दें. सहायक डेटा तब जोड़ें, जब आपका डेटा बहुत कम है (उदाहरण के लिए, अगर कुछ कैटगरी कम प्रतिनिधित्व होता है).
  • हर मेट्रिक की मेट्रिक (उदाहरण के लिए, सटीक और पूरी गड़बड़ी) ट्रैक करें पूर्वाग्रह देखने के लिए डेमोग्राफ़िक.
  • वंचित समूहों के लिए अलग मॉडल बनाएं.