लॉस एक संख्या वाली मेट्रिक है. इससे पता चलता है कि किसी मॉडल के अनुमान कितने गलत हैं. लॉस, मॉडल के अनुमान और असल लेबल के बीच की दूरी को मेज़र करता है. किसी मॉडल को ट्रेनिंग देने का मकसद, नुकसान को कम करना है. इसे कम से कम वैल्यू पर ले जाना है.
नीचे दी गई इमेज में, डेटा पॉइंट से मॉडल तक खींचे गए ऐरो के तौर पर लॉस को विज़ुअलाइज़ किया जा सकता है. ऐरो से पता चलता है कि मॉडल के अनुमान, असल वैल्यू से कितने अलग हैं.
नौवीं इमेज. नुकसान को असल वैल्यू से अनुमानित वैल्यू के हिसाब से मेज़र किया जाता है.
उपयोगकर्ताओं के चले जाने की दूरी
आंकड़ों और मशीन लर्निंग में, लॉस, अनुमानित और असल वैल्यू के बीच के अंतर को मेज़र करता है. लॉस, वैल्यू के बीच की दूरी पर फ़ोकस करता है, न कि दिशा पर. उदाहरण के लिए, अगर कोई मॉडल 2 का अनुमान लगाता है, लेकिन असल वैल्यू 5 है, तो हम इस बात पर ध्यान नहीं देते कि लॉस -3 डॉलर है (). इसके बजाय, हम इस बात पर ध्यान देते हैं कि वैल्यू के बीच का फ़ासला 3 डॉलर है. इसलिए, लॉस का हिसाब लगाने के सभी तरीकों से साइन हटा दिया जाता है.
इस साइन को हटाने के दो सबसे सामान्य तरीके यहां दिए गए हैं:
- असल वैल्यू और अनुमान के बीच के अंतर की पूरी वैल्यू लें.
- असल वैल्यू और अनुमानित वैल्यू के बीच के अंतर को स्क्वेयर करें.
नुकसान के टाइप
लीनियर रिग्रेशन में, चार मुख्य तरह के लॉस होते हैं. इनके बारे में यहां दी गई टेबल में बताया गया है.
नुकसान का टाइप | परिभाषा | समीकरण |
---|---|---|
L1 लॉस | अनुमानित वैल्यू और असल वैल्यू के बीच के फ़र्क़ की वैल्यू का योग. | |
मीन ऐब्सॉल्यूट एरर (एमएई) | उदाहरणों के एक सेट में, L1 के नुकसान का औसत. | |
L2 लॉस | अनुमानित वैल्यू और असल वैल्यू के बीच के स्क्वेयर डिफ़रेंस का योग. | |
मीन स्क्वेयर्ड एरर (एमएसई) | उदाहरणों के एक सेट में, L2 लॉस का औसत. |
L1 लॉस और L2 लॉस (या एमएई और एमएसई) के बीच फ़ंक्शनल अंतर, स्क्वेयरिंग है. जब अनुमान और लेबल के बीच का अंतर ज़्यादा होता है, तो स्क्वेयर करने पर लॉस और भी ज़्यादा हो जाता है. जब अंतर छोटा (1 से कम) होता है, तो स्क्वेयर करने पर नुकसान और भी कम हो जाता है.
एक साथ कई उदाहरणों को प्रोसेस करते समय, हमारा सुझाव है कि सभी उदाहरणों के लिए, लॉस का औसत निकालें. भले ही, एमएई या एमएसई का इस्तेमाल किया जा रहा हो.
नुकसान का हिसाब लगाने का उदाहरण
पिछली सबसे सही लाइन का इस्तेमाल करके, हम एक उदाहरण के लिए L2 लॉस का हिसाब लगाएंगे. सबसे अच्छी तरह से फ़िट होने वाली लाइन से, हमारे पास वज़न और बायस के लिए ये वैल्यू थीं:
अगर मॉडल का अनुमान है कि 2,370 पाउंड की कार को 21.5 मील प्रति गैलन का माइलेज मिलता है, लेकिन उसे असल में 24 मील प्रति गैलन का माइलेज मिलता है, तो हम L2 लॉस का हिसाब इस तरह लगाएंगे:
मान | समीकरण | नतीजा |
---|---|---|
अनुमान |
|
|
वास्तविक मान | ||
L2 लॉस |
|
इस उदाहरण में, उस एक डेटा पॉइंट के लिए L2 लॉस 6.25 है.
नुकसान चुनना
एमएई या एमएसई में से किसी का इस्तेमाल करना, डेटासेट और कुछ अनुमानों को मैनेज करने के तरीके पर निर्भर कर सकता है. आम तौर पर, किसी डेटासेट में मौजूद ज़्यादातर सुविधा की वैल्यू, एक अलग रेंज में होती हैं. उदाहरण के लिए, आम तौर पर कारों की कीमत 2,000 से 5,000 पाउंड के बीच होती है और उनका माइलेज 8 से 50 मील प्रति गैलन होता है. 8,000 पाउंड की कार या ऐसी कार जिसकी माइलेज 100 मील प्रति गैलन है, आम तौर पर कार की सामान्य रेंज से बाहर होती है. ऐसे में, उसे आउटलायर माना जाएगा.
आउटलायर का मतलब यह भी हो सकता है कि मॉडल के अनुमान, असल वैल्यू से कितने अलग हैं. उदाहरण के लिए, 3,000 पाउंड, कार के सामान्य वज़न की रेंज में आता है और 40 मील प्रति गैलन, ईंधन की खपत की सामान्य रेंज में आता है. हालांकि, 3,000 पाउंड की ऐसी कार जिसका माइलेज 40 मील प्रति गैलन हो, वह मॉडल के अनुमान के हिसाब से आउटलायर होगी. इसकी वजह यह है कि मॉडल का अनुमान होगा कि 3,000 पाउंड की कार का माइलेज 18 से 20 मील प्रति गैलन होगा.
सबसे अच्छा लॉस फ़ंक्शन चुनते समय, इस बात का ध्यान रखें कि आपको मॉडल को आउटलायर के साथ कैसे व्यवहार करना है. उदाहरण के लिए, एमएसई, मॉडल को आउटलायर की ओर ज़्यादा ले जाता है, जबकि एमएई ऐसा नहीं करता. L2 लॉस में, आउटलायर के लिए L1 लॉस की तुलना में ज़्यादा जुर्माना लगता है. उदाहरण के लिए, नीचे दी गई इमेज में MAE का इस्तेमाल करके ट्रेन किया गया मॉडल और MSE का इस्तेमाल करके ट्रेन किया गया मॉडल दिखाया गया है. लाल लाइन, पूरी तरह से ट्रेन किए गए मॉडल को दिखाती है. इसका इस्तेमाल अनुमान लगाने के लिए किया जाएगा. आउटलायर, एमएई के साथ ट्रेन किए गए मॉडल के मुकाबले, एमएसई के साथ ट्रेन किए गए मॉडल के ज़्यादा करीब होते हैं.
10वीं इमेज. एमएसई से ट्रेन किया गया मॉडल, आउटलायर के करीब पहुंच जाता है.
11वीं इमेज. एमएई की मदद से ट्रेन किया गया मॉडल, आउटलायर से दूर होता है.
मॉडल और डेटा के बीच के संबंध पर ध्यान दें:
MSE. मॉडल, आउटलायर के करीब है, लेकिन ज़्यादातर अन्य डेटा पॉइंट से दूर है.
मैरी एलेन (फ़्रेंच गियाना). मॉडल, आउटलायर से दूर है, लेकिन ज़्यादातर अन्य डेटा पॉइंट के करीब है.
देखें कि आपको विषय की कितनी समझ है
नीचे दिए गए दो प्लॉट देखें:
![]() |
![]() |