लीनियर रिग्रेशन: नुकसान

लॉस एक संख्या वाली मेट्रिक है. इससे पता चलता है कि किसी मॉडल के अनुमान कितने गलत हैं. लॉस, मॉडल के अनुमान और असल लेबल के बीच की दूरी को मेज़र करता है. किसी मॉडल को ट्रेनिंग देने का मकसद, नुकसान को कम करना है. इसे कम से कम वैल्यू पर ले जाना है.

नीचे दी गई इमेज में, डेटा पॉइंट से मॉडल तक खींचे गए ऐरो के तौर पर लॉस को विज़ुअलाइज़ किया जा सकता है. ऐरो से पता चलता है कि मॉडल के अनुमान, असल वैल्यू से कितने अलग हैं.

नौवां चित्र. लॉस लाइन, डेटा पॉइंट को मॉडल से कनेक्ट करती हैं.

नौवीं इमेज. नुकसान को असल वैल्यू से अनुमानित वैल्यू के हिसाब से मेज़र किया जाता है.

उपयोगकर्ताओं के चले जाने की दूरी

आंकड़ों और मशीन लर्निंग में, लॉस, अनुमानित और असल वैल्यू के बीच के अंतर को मेज़र करता है. लॉस, वैल्यू के बीच की दूरी पर फ़ोकस करता है, न कि दिशा पर. उदाहरण के लिए, अगर कोई मॉडल 2 का अनुमान लगाता है, लेकिन असल वैल्यू 5 है, तो हम इस बात पर ध्यान नहीं देते कि लॉस -3 डॉलर है (25=3). इसके बजाय, हम इस बात पर ध्यान देते हैं कि वैल्यू के बीच का फ़ासला 3 डॉलर है. इसलिए, लॉस का हिसाब लगाने के सभी तरीकों से साइन हटा दिया जाता है.

इस साइन को हटाने के दो सबसे सामान्य तरीके यहां दिए गए हैं:

  • असल वैल्यू और अनुमान के बीच के अंतर की पूरी वैल्यू लें.
  • असल वैल्यू और अनुमानित वैल्यू के बीच के अंतर को स्क्वेयर करें.

नुकसान के टाइप

लीनियर रिग्रेशन में, चार मुख्य तरह के लॉस होते हैं. इनके बारे में यहां दी गई टेबल में बताया गया है.

नुकसान का टाइप परिभाषा समीकरण
L1 लॉस अनुमानित वैल्यू और असल वैल्यू के बीच के फ़र्क़ की वैल्यू का योग. |actual valuepredicted value|
मीन ऐब्सॉल्यूट एरर (एमएई) उदाहरणों के एक सेट में, L1 के नुकसान का औसत. 1N|actual valuepredicted value|
L2 लॉस अनुमानित वैल्यू और असल वैल्यू के बीच के स्क्वेयर डिफ़रेंस का योग. (actual valuepredicted value)2
मीन स्क्वेयर्ड एरर (एमएसई) उदाहरणों के एक सेट में, L2 लॉस का औसत. 1N(actual valuepredicted value)2

L1 लॉस और L2 लॉस (या एमएई और एमएसई) के बीच फ़ंक्शनल अंतर, स्क्वेयरिंग है. जब अनुमान और लेबल के बीच का अंतर ज़्यादा होता है, तो स्क्वेयर करने पर लॉस और भी ज़्यादा हो जाता है. जब अंतर छोटा (1 से कम) होता है, तो स्क्वेयर करने पर नुकसान और भी कम हो जाता है.

एक साथ कई उदाहरणों को प्रोसेस करते समय, हमारा सुझाव है कि सभी उदाहरणों के लिए, लॉस का औसत निकालें. भले ही, एमएई या एमएसई का इस्तेमाल किया जा रहा हो.

नुकसान का हिसाब लगाने का उदाहरण

पिछली सबसे सही लाइन का इस्तेमाल करके, हम एक उदाहरण के लिए L2 लॉस का हिसाब लगाएंगे. सबसे अच्छी तरह से फ़िट होने वाली लाइन से, हमारे पास वज़न और बायस के लिए ये वैल्यू थीं:

  • :3.6
  • Bias:30

अगर मॉडल का अनुमान है कि 2,370 पाउंड की कार को 21.5 मील प्रति गैलन का माइलेज मिलता है, लेकिन उसे असल में 24 मील प्रति गैलन का माइलेज मिलता है, तो हम L2 लॉस का हिसाब इस तरह लगाएंगे:

मान समीकरण नतीजा
अनुमान

bias+(weightfeature value)

30+(3.62.37)

21.5
वास्तविक मान label 24
L2 लॉस

(actual valuepredicted value)2

(2421.5)2

6.25

इस उदाहरण में, उस एक डेटा पॉइंट के लिए L2 लॉस 6.25 है.

नुकसान चुनना

एमएई या एमएसई में से किसी का इस्तेमाल करना, डेटासेट और कुछ अनुमानों को मैनेज करने के तरीके पर निर्भर कर सकता है. आम तौर पर, किसी डेटासेट में मौजूद ज़्यादातर सुविधा की वैल्यू, एक अलग रेंज में होती हैं. उदाहरण के लिए, आम तौर पर कारों की कीमत 2,000 से 5,000 पाउंड के बीच होती है और उनका माइलेज 8 से 50 मील प्रति गैलन होता है. 8,000 पाउंड की कार या ऐसी कार जिसकी माइलेज 100 मील प्रति गैलन है, आम तौर पर कार की सामान्य रेंज से बाहर होती है. ऐसे में, उसे आउटलायर माना जाएगा.

आउटलायर का मतलब यह भी हो सकता है कि मॉडल के अनुमान, असल वैल्यू से कितने अलग हैं. उदाहरण के लिए, 3,000 पाउंड, कार के सामान्य वज़न की रेंज में आता है और 40 मील प्रति गैलन, ईंधन की खपत की सामान्य रेंज में आता है. हालांकि, 3,000 पाउंड की ऐसी कार जिसका माइलेज 40 मील प्रति गैलन हो, वह मॉडल के अनुमान के हिसाब से आउटलायर होगी. इसकी वजह यह है कि मॉडल का अनुमान होगा कि 3,000 पाउंड की कार का माइलेज 18 से 20 मील प्रति गैलन होगा.

सबसे अच्छा लॉस फ़ंक्शन चुनते समय, इस बात का ध्यान रखें कि आपको मॉडल को आउटलायर के साथ कैसे व्यवहार करना है. उदाहरण के लिए, एमएसई, मॉडल को आउटलायर की ओर ज़्यादा ले जाता है, जबकि एमएई ऐसा नहीं करता. L2 लॉस में, आउटलायर के लिए L1 लॉस की तुलना में ज़्यादा जुर्माना लगता है. उदाहरण के लिए, नीचे दी गई इमेज में MAE का इस्तेमाल करके ट्रेन किया गया मॉडल और MSE का इस्तेमाल करके ट्रेन किया गया मॉडल दिखाया गया है. लाल लाइन, पूरी तरह से ट्रेन किए गए मॉडल को दिखाती है. इसका इस्तेमाल अनुमान लगाने के लिए किया जाएगा. आउटलायर, एमएई के साथ ट्रेन किए गए मॉडल के मुकाबले, एमएसई के साथ ट्रेन किए गए मॉडल के ज़्यादा करीब होते हैं.

दसवां चित्र. मॉडल, आउटलायर की ओर ज़्यादा झुका हुआ है.

10वीं इमेज. एमएसई से ट्रेन किया गया मॉडल, आउटलायर के करीब पहुंच जाता है.

इमेज 11. मॉडल, आउटलायर से दूर हो जाता है.

11वीं इमेज. एमएई की मदद से ट्रेन किया गया मॉडल, आउटलायर से दूर होता है.

मॉडल और डेटा के बीच के संबंध पर ध्यान दें:

  • MSE. मॉडल, आउटलायर के करीब है, लेकिन ज़्यादातर अन्य डेटा पॉइंट से दूर है.

  • मैरी एलेन (फ़्रेंच गियाना). मॉडल, आउटलायर से दूर है, लेकिन ज़्यादातर अन्य डेटा पॉइंट के करीब है.

देखें कि आपको विषय की कितनी समझ है

नीचे दिए गए दो प्लॉट देखें:

10 पॉइंट का प्लॉट.
      छह पॉइंट के बीच एक लाइन खींची गई है. दो पॉइंट, लाइन के ऊपर एक यूनिट और दो अन्य पॉइंट, लाइन के नीचे एक यूनिट हैं. 10 पॉइंट का प्लॉट. एक लाइन, आठ पॉइंट के ज़रिए गुज़रती है. एक बिंदु, रेखा के ऊपर दो यूनिट और दूसरा बिंदु, रेखा के नीचे दो यूनिट पर है.
पिछले प्लॉट में दिखाए गए दो डेटा सेट में से किसका मीडियन स्क्वेयर्ड एरर (एमएसई) ज़्यादा है?
दाईं ओर मौजूद डेटासेट.
बाईं ओर मौजूद डेटासेट.