ऊपर दी गई इमेज में, अगर आपको b को c के बजाय
a से ज़्यादा मिलता-जुलता दिखाना है, तो आपको कौनसा मेज़र चुनना चाहिए?
डॉट उत्पाद
सही! डॉट प्रॉडक्ट, कोसाइन और सदिशों की लंबाई, दोनों के अनुपात में होता है. इसलिए, b और c से बने ऐंगल के मुकाबले, b और c से बने ऐंगल के लिए कोसाइन ज़्यादा है. हालांकि, a के वेक्टर की लंबाई ज़्यादा होने की वजह से, a और b का डॉट प्रॉडक्ट, b और c के डॉट प्रॉडक्ट से ज़्यादा होता है.a
इयूक्लिडीन दूरी
की दूरी से कम है, इसलिए
b, a के बजाय c के ज़्यादा करीब है.
कोसाइन
कोसाइन सिर्फ़ वेक्टर के बीच के कोण पर निर्भर करता है. साथ ही, छोटा कोण को से बड़ा बनाता है.
म्यूज़िक वीडियो के मिलते-जुलते होने का हिसाब लगाया जा रहा हो. म्यूज़िक वीडियो के एम्बेड किए गए वैक्टर की लंबाई, उनकी लोकप्रियता के हिसाब से तय होती है. आपने मिलती-जुलती चीज़ों का हिसाब लगाने के लिए, कोसाइन से डॉट प्रॉडक्ट पर स्विच किया. संगीत वीडियो के बीच मिलती-जुलती चीज़ों की संख्या कैसे बदलती है?
कोई बदलाव नहीं.
डॉट प्रॉडक्ट पर वेक्टर की लंबाई का असर पड़ता है. लोकप्रिय वीडियो के वेक्टर की लंबाई ज़्यादा होने पर, वीडियो के मिलते-जुलते होने का आकलन करने के लिए, कोसाइन के बजाय किसी दूसरे तरीके का इस्तेमाल किया जाएगा.
लोकप्रिय वीडियो, आम तौर पर सभी वीडियो से ज़्यादा मिलते-जुलते हो जाते हैं.
डॉट प्रॉडक्ट पर, दोनों वेक्टर की लंबाई का असर पड़ता है. इसलिए, लोकप्रिय वीडियो के वेक्टर की लंबाई ज़्यादा होने पर, वे सभी वीडियो से मिलते-जुलते लगेंगे.
लोकप्रिय वीडियो, दूसरे लोकप्रिय वीडियो से सिर्फ़ ज़्यादा मिलते-जुलते बनते हैं.
याद रखें कि डॉट प्रॉडक्ट का हिसाब इस तरह लगाया जाता है .
मान लें कि a एक लोकप्रिय संगीत वीडियो है. हम जानते हैं कि को एम्बेड करने में लगने वाला समय, लोकप्रिय वीडियो के मुकाबले ज़्यादा है.
लंबाई जितनी ज़्यादा होगी, उतना ही की वैल्यू के बावजूद, डॉट प्रॉडक्ट बढ़ेगा. इसलिए, लोकप्रिय वीडियो, सिर्फ़ दूसरे लोकप्रिय वीडियो के साथ ही नहीं, बल्कि दूसरे सभी वीडियो के साथ भी मिलते-जुलते हो जाते हैं.
लोकप्रिय वीडियो, कम लोकप्रिय वीडियो के मुकाबले एक-दूसरे से कम मिलते-जुलते होते हैं.
डॉट प्रॉडक्ट, वैक्टर की लंबाई के साथ बढ़ता है. साथ ही, लोकप्रिय वीडियो की वैक्टर लंबाई ज़्यादा होती है. इसलिए, मिलती-जुलती कॉन्टेंट की मेज़रमेंट कम होने के बजाय बढ़ेगी.
पिछले सवाल के सेटअप के मुताबिक, मान लें कि आपने डॉट प्रॉडक्ट से कोसाइन पर वापस स्विच किया है. संगीत वीडियो के बीच मिलते-जुलते कॉन्टेंट की संख्या कैसे बदलती है?
कोई बदलाव नहीं.
कोसाइन पर वेक्टर की लंबाई का असर नहीं पड़ता, जबकि डॉट प्रॉडक्ट पर पड़ता है. इसलिए, डॉट प्रॉडक्ट से कोसाइन पर स्विच करने पर, मिलती-जुलती वैल्यू में बदलाव होगा.
लोकप्रिय वीडियो, सभी वीडियो से ज़्यादा मिलते-जुलते हो जाते हैं.
कोसाइन पर वेक्टर की लंबाई का असर नहीं पड़ता. इसलिए, बिंदु के प्रॉडक्ट से स्विच करने पर, सभी लोकप्रिय वीडियो के बीच समानता कम हो जाएगी.
लोकप्रिय वीडियो, सभी वीडियो से कम मिलते-जुलते हो जाते हैं.
कोसाइन पर वेक्टर की लंबाई का असर नहीं पड़ता. इसलिए, लोकप्रिय वीडियो एम्बेड की बड़ी वेक्टर लंबाई, मिलती-जुलती कॉन्टेंट की पहचान करने में मदद नहीं करती.
इसलिए, डॉट प्रॉडक्ट से कोसाइन पर स्विच करने से, लोकप्रिय वीडियो और अन्य सभी वीडियो के बीच का अंतर कम हो जाता है.
लोकप्रिय वीडियो, सिर्फ़ एक-दूसरे से ज़्यादा मिलते-जुलते हो जाते हैं.
कोसाइन पर वेक्टर की लंबाई का असर नहीं पड़ता. इसलिए, बिंदु के प्रॉडक्ट से स्विच करने पर, सभी लोकप्रिय वीडियो के बीच समानता कम हो जाएगी.
[null,null,["आखिरी बार 2025-02-25 (UTC) को अपडेट किया गया."],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]