लॉस संख्या वाली एक मेट्रिक है. इससे पता चलता है कि किसी मॉडल के अनुमान कितने गलत हैं हैं. नुकसान, मॉडल के अनुमानों और असल अनुमान के बीच की दूरी को मापता है लेबल. किसी मॉडल को ट्रेनिंग देने का मकसद, नुकसान को कम करना होता है. इसके बाद, मॉडल को सबसे कम संभावित वैल्यू.
नीचे दी गई इमेज में, डेटा से लिए गए ऐरो से नुकसान को दिखाया जा सकता है मॉडल पर ले जाता है. ऐरो से पता चलता है कि मॉडल के अनुमान कितने दूर से लिए गए हैं सेट करें.
नौवीं इमेज. नुकसान को, असल वैल्यू से अनुमानित वैल्यू तक मेज़र किया जाता है.
नुकसान पहुंचने की दूरी
स्टैटिस्टिक्स और मशीन लर्निंग में, लॉस एंजेलिस अनुमानित और असल वैल्यू होती हैं. लॉस का फ़ोकस वैल्यू के बीच की दूरी पर होता है, दिशा नहीं. उदाहरण के लिए, अगर कोई मॉडल 2 का अनुमान लगाता है, लेकिन असल वैल्यू 5, हम इस बात से ध्यान नहीं रखते कि हानि नकारात्मक $ -3 $ ($ 2-5=-3 $) है. इसके बजाय, हम ध्यान रखते हैं कि मानों के बीच दूरी $ 3 $ है. इस तरह, सभी नुकसान का पता लगाने के तरीके के तौर पर साइन इन करता है.
चिह्न को हटाने के दो सबसे सामान्य तरीके ये हैं:
- वास्तविक मान और वास्तविक मान के बीच के अंतर का निरपेक्ष मान निकालें सुझाव.
- असल वैल्यू और अनुमान के बीच के अंतर का वर्ग करें.
नुकसान के टाइप
लीनियर रिग्रेशन में, नुकसान के चार मुख्य प्रकार होते हैं, जिनके बारे में नीचे बताया गया है यहां दी गई टेबल में बताया गया है.
नुकसान किस तरह का है | परिभाषा | समीकरण |
---|---|---|
L1 नुकसान | अंतर की निरपेक्ष वैल्यू का योग अनुमानित वैल्यू और असल वैल्यू के बीच में सेट किया जाता है. | $ ∑ | असल\ वैल्यू - अनुमानित\ वैल्यू | डॉलर |
मीन ऐब्सलूट एरर (MAE) | उदाहरणों के सेट में L1 की हानि का औसत. | $ \frac{1}{N} ∑ | असल\ वैल्यू - अनुमानित\ वैल्यू | डॉलर |
L2 नुकसान | वर्ग के अंतर का योग अनुमानित वैल्यू और असल वैल्यू के बीच में सेट किया जाता है. | $ ∑(असल\ वैल्यू - अनुमानित\ वैल्यू)^2 $ |
मीन स्क्वेयर एरर (एमएसई) | उदाहरणों के सेट में L2 नुकसान का औसत. | $ \frac{1}{N} ∑ (असल\ वैल्यू - अनुमानित\ वैल्यू)^2 $ |
L1 नुकसान और L2 नुकसान के बीच काम करने का अंतर (या MAE और MSE के बीच) स्क्वैरिंग है. जब कीवर्ड के बीच अंतर अनुमान और लेबल ज़्यादा होने पर, स्क्वेयर का इस्तेमाल करने से नुकसान की संख्या और बढ़ जाती है. जब अंतर कम है (1 से कम), जिसके डेटा की तुलना में नतीजों को कम या ज़्यादा किया जा सकता है.
हमारा सुझाव है कि एक साथ कई उदाहरण प्रोसेस करते समय, नुकसान का औसत निकालें सभी उदाहरणों में बताया गया है. इससे फ़र्क़ नहीं पड़ता कि MAE का इस्तेमाल किया जा रहा है या MSE का.
नुकसान की गणना करने के उदाहरण
पिछली सबसे अच्छी फ़िट लाइन का इस्तेमाल करके, हम L2 के लॉस का हिसाब एक उदाहरण के तौर पर लगाएंगे. के लिए, हमारे पास वज़न और पूर्वाग्रह के लिए निम्न मान थे:
- $ \छोटा{वज़न: -3.6} $
- $ \small{बायस: 30} $
अगर मॉडल अनुमान लगाता है कि 2,370 पाउंड की कार को एक गैलन में 21.5 मील प्रति गैलन मिलता है, लेकिन असल में, 24 मील प्रति गैलन मिलता है, तो हम L2 नुकसान का हिसाब इस तरह लगाएंगे अनुसरण करता है:
मान | समीकरण | नतीजा |
---|---|---|
अनुमान | $\small{bias + (वज़न * feature\ value)}$ $\small{30 + (-3.6*2.37)}$ |
$\छोटा{21.5}$ |
वास्तविक मान | $ \small{ label } $ | $ \small{ 24 } $ |
L2 की कमी | $ \small{ (अनुमान - वास्तविक\ value)^2} $ $\small{ (21.5 - 24)^2 }$ |
$\छोटा{6.25}$ |
इस उदाहरण में, उस एक डेटा पॉइंट के लिए L2 की कमी 6.25 है.
नुकसान चुनना
MAE का इस्तेमाल करना है या MSE का, यह तय करना कि डेटासेट और कुछ खास अनुमानों को मैनेज करना चाहते हैं. आम तौर पर, डेटासेट में सुविधा की ज़्यादातर वैल्यू एक अलग रेंज में आते हों. उदाहरण के लिए, कारें आम तौर पर 2000 और करीब 5,000 पाउंड वज़न का वज़न 8 से 50 मील प्रति गैलन तक बढ़ाएं. 8,000 पाउंड वज़न की कार या 100 मील प्रति गैलन की रफ़्तार वाली कार, सामान्य सीमा से बाहर है और एक आउटलायर मानी जाएगी.
आउटलायर यह भी बता सकता है कि किसी मॉडल का अनुमान असल में कितना दूर है वैल्यू. उदाहरण के लिए, 3,000 पाउंड वज़न की कार या 40 मील प्रति गैलन वाली कार सामान्य रेंज में हैं. हालांकि, 3,000 पाउंड की कार इस मॉडल के अनुमान के हिसाब से, एक गैलन प्रति गैलन की दूरी 40 मील से ज़्यादा नहीं होगी क्योंकि मॉडल यह अनुमान लगाएगा कि 3,000 पाउंड की कार 18 और 20 मील प्रति गैलन.
नुकसान पहुंचाने वाला सबसे अच्छा फ़ंक्शन चुनते समय, इस बात पर गौर करें कि मॉडल से आपको किस तरह के नतीजे चाहिए आउटलायर्स. उदाहरण के लिए, MSE मॉडल को आउटलायर की ओर ज़्यादा ले जाता है, जबकि MAE नहीं. L2 में नुकसान की भरपाई करने पर, बायां1 नुकसान. उदाहरण के लिए, नीचे दी गई इमेज में एक मॉडल को ट्रेनिंग दी गई है MAE का इस्तेमाल करके और एक मॉडल जिसे MSE का इस्तेमाल करके ट्रेनिंग दी गई है. लाल रेखा पूरी तरह से जिसका इस्तेमाल अनुमान लगाने के लिए किया जाएगा. आउटलायर्स शायद उनके पास मॉडल को MSE की मदद से ट्रेनिंग दी गई है, न कि MAE की मदद से तैयार किए गए मॉडल से.
आकृति 10. MSE की मदद से ट्रेनिंग किया गया मॉडल, मॉडल को आउटलायर के ज़्यादा करीब ले जाता है.
आकृति 11. एमएई की मदद से तैयार किया गया मॉडल, अलग तरह के लोगों से दूर है.
मॉडल और डेटा के बीच के संबंध पर ध्यान दें:
MSE. यह मॉडल अन्य कंपनियों से काफ़ी हद तक दूर है, लेकिन ज़्यादातर पहलुओं से दूर है अन्य डेटा पॉइंट.
MAE. यह मॉडल अन्य कंपनियों से दूर है, लेकिन ज़्यादातर अन्य डेटा पॉइंट.
अपनी समझ को परखें
इन दो प्लॉट पर गौर करें: