लीनियर रिग्रेशन: नुकसान

लॉस संख्या वाली एक मेट्रिक है. इससे पता चलता है कि किसी मॉडल के अनुमान कितने गलत हैं हैं. नुकसान, मॉडल के अनुमानों और असल अनुमान के बीच की दूरी को मापता है लेबल. किसी मॉडल को ट्रेनिंग देने का मकसद, नुकसान को कम करना होता है. इसके बाद, मॉडल को सबसे कम संभावित वैल्यू.

नीचे दी गई इमेज में, डेटा से लिए गए ऐरो से नुकसान को दिखाया जा सकता है मॉडल पर ले जाता है. ऐरो से पता चलता है कि मॉडल के अनुमान कितने दूर से लिए गए हैं सेट करें.

नौवीं इमेज. लॉस लाइन डेटा पॉइंट को
मॉडल.

नौवीं इमेज. नुकसान को, असल वैल्यू से अनुमानित वैल्यू तक मेज़र किया जाता है.

नुकसान पहुंचने की दूरी

स्टैटिस्टिक्स और मशीन लर्निंग में, लॉस एंजेलिस अनुमानित और असल वैल्यू होती हैं. लॉस का फ़ोकस वैल्यू के बीच की दूरी पर होता है, दिशा नहीं. उदाहरण के लिए, अगर कोई मॉडल 2 का अनुमान लगाता है, लेकिन असल वैल्यू 5, हम इस बात से ध्यान नहीं रखते कि हानि नकारात्मक $ -3 $ ($ 2-5=-3 $) है. इसके बजाय, हम ध्यान रखते हैं कि मानों के बीच दूरी $ 3 $ है. इस तरह, सभी नुकसान का पता लगाने के तरीके के तौर पर साइन इन करता है.

चिह्न को हटाने के दो सबसे सामान्य तरीके ये हैं:

  • वास्तविक मान और वास्तविक मान के बीच के अंतर का निरपेक्ष मान निकालें सुझाव.
  • असल वैल्यू और अनुमान के बीच के अंतर का वर्ग करें.

नुकसान के टाइप

लीनियर रिग्रेशन में, नुकसान के चार मुख्य प्रकार होते हैं, जिनके बारे में नीचे बताया गया है यहां दी गई टेबल में बताया गया है.

नुकसान किस तरह का है परिभाषा समीकरण
L1 नुकसान अंतर की निरपेक्ष वैल्यू का योग अनुमानित वैल्यू और असल वैल्यू के बीच में सेट किया जाता है. $ ∑ | असल\ वैल्यू - अनुमानित\ वैल्यू | डॉलर
मीन ऐब्सलूट एरर (MAE) उदाहरणों के सेट में L1 की हानि का औसत. $ \frac{1}{N} ∑ | असल\ वैल्यू - अनुमानित\ वैल्यू | डॉलर
L2 नुकसान वर्ग के अंतर का योग अनुमानित वैल्यू और असल वैल्यू के बीच में सेट किया जाता है. $ ∑(असल\ वैल्यू - अनुमानित\ वैल्यू)^2 $
मीन स्क्वेयर एरर (एमएसई) उदाहरणों के सेट में L2 नुकसान का औसत. $ \frac{1}{N} ∑ (असल\ वैल्यू - अनुमानित\ वैल्यू)^2 $

L1 नुकसान और L2 नुकसान के बीच काम करने का अंतर (या MAE और MSE के बीच) स्क्वैरिंग है. जब कीवर्ड के बीच अंतर अनुमान और लेबल ज़्यादा होने पर, स्क्वेयर का इस्तेमाल करने से नुकसान की संख्या और बढ़ जाती है. जब अंतर कम है (1 से कम), जिसके डेटा की तुलना में नतीजों को कम या ज़्यादा किया जा सकता है.

हमारा सुझाव है कि एक साथ कई उदाहरण प्रोसेस करते समय, नुकसान का औसत निकालें सभी उदाहरणों में बताया गया है. इससे फ़र्क़ नहीं पड़ता कि MAE का इस्तेमाल किया जा रहा है या MSE का.

नुकसान की गणना करने के उदाहरण

पिछली सबसे अच्छी फ़िट लाइन का इस्तेमाल करके, हम L2 के लॉस का हिसाब एक उदाहरण के तौर पर लगाएंगे. के लिए, हमारे पास वज़न और पूर्वाग्रह के लिए निम्न मान थे:

  • $ \छोटा{वज़न: -3.6} $
  • $ \small{बायस: 30} $

अगर मॉडल अनुमान लगाता है कि 2,370 पाउंड की कार को एक गैलन में 21.5 मील प्रति गैलन मिलता है, लेकिन असल में, 24 मील प्रति गैलन मिलता है, तो हम L2 नुकसान का हिसाब इस तरह लगाएंगे अनुसरण करता है:

मान समीकरण नतीजा
अनुमान

$\small{bias + (वज़न * feature\ value)}$

$\small{30 + (-3.6*2.37)}$

$\छोटा{21.5}$
वास्तविक मान $ \small{ label } $ $ \small{ 24 } $
L2 की कमी

$ \small{ (अनुमान - वास्तविक\ value)^2} $

$\small{ (21.5 - 24)^2 }$

$\छोटा{6.25}$

इस उदाहरण में, उस एक डेटा पॉइंट के लिए L2 की कमी 6.25 है.

नुकसान चुनना

MAE का इस्तेमाल करना है या MSE का, यह तय करना कि डेटासेट और कुछ खास अनुमानों को मैनेज करना चाहते हैं. आम तौर पर, डेटासेट में सुविधा की ज़्यादातर वैल्यू एक अलग रेंज में आते हों. उदाहरण के लिए, कारें आम तौर पर 2000 और करीब 5,000 पाउंड वज़न का वज़न 8 से 50 मील प्रति गैलन तक बढ़ाएं. 8,000 पाउंड वज़न की कार या 100 मील प्रति गैलन की रफ़्तार वाली कार, सामान्य सीमा से बाहर है और एक आउटलायर मानी जाएगी.

आउटलायर यह भी बता सकता है कि किसी मॉडल का अनुमान असल में कितना दूर है वैल्यू. उदाहरण के लिए, 3,000 पाउंड वज़न की कार या 40 मील प्रति गैलन वाली कार सामान्य रेंज में हैं. हालांकि, 3,000 पाउंड की कार इस मॉडल के अनुमान के हिसाब से, एक गैलन प्रति गैलन की दूरी 40 मील से ज़्यादा नहीं होगी क्योंकि मॉडल यह अनुमान लगाएगा कि 3,000 पाउंड की कार 18 और 20 मील प्रति गैलन.

नुकसान पहुंचाने वाला सबसे अच्छा फ़ंक्शन चुनते समय, इस बात पर गौर करें कि मॉडल से आपको किस तरह के नतीजे चाहिए आउटलायर्स. उदाहरण के लिए, MSE मॉडल को आउटलायर की ओर ज़्यादा ले जाता है, जबकि MAE नहीं. L2 में नुकसान की भरपाई करने पर, बायां1 नुकसान. उदाहरण के लिए, नीचे दी गई इमेज में एक मॉडल को ट्रेनिंग दी गई है MAE का इस्तेमाल करके और एक मॉडल जिसे MSE का इस्तेमाल करके ट्रेनिंग दी गई है. लाल रेखा पूरी तरह से जिसका इस्तेमाल अनुमान लगाने के लिए किया जाएगा. आउटलायर्स शायद उनके पास मॉडल को MSE की मदद से ट्रेनिंग दी गई है, न कि MAE की मदद से तैयार किए गए मॉडल से.

इमेज 10. मॉडल को आउटलायर की तरफ़ ज़्यादा झुकाया गया है.

आकृति 10. MSE की मदद से ट्रेनिंग किया गया मॉडल, मॉडल को आउटलायर के ज़्यादा करीब ले जाता है.

इमेज 11. मॉडल, आउटलायर से दूर झुका हुआ हो.

आकृति 11. एमएई की मदद से तैयार किया गया मॉडल, अलग तरह के लोगों से दूर है.

मॉडल और डेटा के बीच के संबंध पर ध्यान दें:

  • MSE. यह मॉडल अन्य कंपनियों से काफ़ी हद तक दूर है, लेकिन ज़्यादातर पहलुओं से दूर है अन्य डेटा पॉइंट.

  • MAE. यह मॉडल अन्य कंपनियों से दूर है, लेकिन ज़्यादातर अन्य डेटा पॉइंट.

अपनी समझ को परखें

इन दो प्लॉट पर गौर करें:

10 पॉइंट वाला प्लॉट.
      एक रेखा 6 बिंदुओं से होकर गुज़रती है. 2 पॉइंट, एक यूनिट है
      ऊपर दिया गया है; दो अन्य पॉइंट, लाइन के नीचे एक यूनिट होते हैं. 10 पॉइंट वाला प्लॉट. एक लाइन चलती है
      में से 8 पॉइंट. 1 पॉइंट, 2 यूनिट है
      ऊपर दिया गया है; एक अन्य पॉइंट, लाइन के नीचे दो यूनिट है.
ऊपर दिए गए प्लॉट में दिखाए गए दो डेटा सेट में से कौनसा डेटा सेट क्या ज़्यादा मीन स्क्वेयर्ड एरर (MSE) है?
बाईं ओर मौजूद डेटासेट.
लाइन पर मौजूद छह उदाहरणों में कुल शून्य का नुकसान हुआ है. चार उदाहरण पंक्ति से बहुत दूर नहीं हैं, इसलिए यहां तक कि उनके ऑफ़सेट का ग्रुप बनाने पर भी कम वैल्यू मिलती है: $MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$
डेटासेट दाईं ओर है.
लाइन पर मौजूद आठ उदाहरणों में कुल शून्य का नुकसान हुआ है. हालांकि, हालांकि, लाइन में सिर्फ़ दो पॉइंट दिखते हैं, लेकिन उन दोनों का पॉइंट, आउटलायर पॉइंट की तुलना में लाइन से दोगुना दूर हैं ऊपर दी गई इमेज में दिखाया गया है. स्क्वेयर लॉस की वजह से और भी बहुत कुछ हो सकता है. इसलिए दो के ऑफ़सेट का नुकसान, ऑफ़सेट से चार गुना ज़्यादा होता है एक में से: $MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है