कई समस्याओं के लिए, आउटपुट के तौर पर प्रॉबबिलिटी के अनुमान की ज़रूरत होती है. लॉजिस्टिक रिग्रेशन प्रायिकताओं की गणना का बेहद कारगर तरीका. व्यावहारिक रूप से बोलकर, आप लौटाए गए प्रॉबबिलिटी का इस्तेमाल इनमें से किसी एक में कर सकते हैं दो तरीके:
"जैसा है" वैसा ही लागू होगा. उदाहरण के लिए, अगर कोई स्पैम-अनुमान मॉडल किसी ईमेल को
0.932
की एक वैल्यू इनपुट और आउटपुट देता है, तो इससे93.2%
की संभावना का पता चलता है कि यह स्पैम वाला ईमेल है.बाइनरी कैटगरी में बदला गया जैसे कि
True
याFalse
,Spam
याNot Spam
.
यह मॉड्यूल लॉजिस्टिक रिग्रेशन मॉडल आउटपुट के इस्तेमाल पर फ़ोकस करता है. इस क्लासिफ़िकेशन मॉड्यूल में, आपको इनके बारे में जानकारी मिलेगी इस आउटपुट को बाइनरी कैटगरी में बदलें.
सिगमॉइड फ़ंक्शन
आपको शायद यह जानना था कि लॉजिस्टिक रिग्रेशन मॉडल अपने-आप आउटपुट पाने की कितनी संभावना रखता है प्रॉबबिलिटी को दिखाता है. यह हमेशा 0 और 1 के बीच की वैल्यू देता है. जैसा है ऐसा होता है, तो लॉजिस्टिक फ़ंक्शन नाम के कई फ़ंक्शन हैं जिसके आउटपुट की विशेषताएं एक जैसी हों. स्टैंडर्ड लॉजिस्टिक फ़ंक्शन, इसे sigmoid फ़ंक्शन (सिगमॉइड का मतलब है, "s के आकार का"), इसमें फ़ॉर्मूला:
\[f(x) = \frac{1}{1 + e^{-x}}\]
इमेज 1 में, सिगमॉइड फ़ंक्शन से जुड़ा संबंधित ग्राफ़ दिखाया गया है.
जब इनपुट के तौर पर x
बढ़ जाता है, तब सिगमॉइड फ़ंक्शन का आउटपुट सामने आता है
लेकिन 1
तक कभी नहीं पहुंचता. इसी तरह, जैसे-जैसे इनपुट घटता है, सिगमॉइड
फ़ंक्शन के आउटपुट अप्रोच का इस्तेमाल करता है, लेकिन कभी भी 0
तक नहीं पहुंचता.
गणित के बारे में ज़्यादा जानने के लिए यहां क्लिक करें सिगमॉइड फ़ंक्शन के पीछे
नीचे दी गई टेबल में, सिगमॉइड फ़ंक्शन के लिए आउटपुट वैल्यू दी गई है 7 से 7 की रेंज में वैल्यू डालें. ध्यान दें कि सिगमॉइड कितनी तेज़ी से पहुंचता है नेगेटिव इनपुट वैल्यू को कम करने और सिगमॉइड के करीब पहुंचने के लिए, 0 वैल्यू पॉज़िटिव इनपुट वैल्यू बढ़ाने के लिए 1.
हालांकि, इनपुट वैल्यू कितनी भी बड़ी या छोटी क्यों न हो, आउटपुट हमेशा 0 से ज़्यादा और 1 से कम होना चाहिए.
इनपुट | सिगमॉइड आउटपुट |
---|---|
-7 | 0.001 |
-6 | 0.002 |
-5 | 0.007 |
-4 | 0.018 |
-3 | 0.047 |
-2 | 0.119 |
-1 | 0.269 |
0 | 0.50 |
1 | 0.731 |
2 | 0.881 |
3 | 0.952 |
4 | 0.982 |
5 | 0.993 |
6 | 0.997 |
7 | 0.999 |
सिगमॉइड फ़ंक्शन का इस्तेमाल करके रैखिक आउटपुट को बदलना
यह समीकरण लॉजिस्टिक के रैखिक घटक के बारे में बताता है रिग्रेशन मॉडल:
\[z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\]
कहां:
- z, लीनियर इक्वेशन का आउटपुट होता है, जिसे लॉग ऑड.
- b पूर्वाग्रह है.
- w वैल्यू, मॉडल के सीखे गए वेट होती हैं.
- x वैल्यू, किसी खास उदाहरण के लिए सुविधा की वैल्यू होती हैं.
लॉजिस्टिक रिग्रेशन का अनुमान पाने के लिए, z वैल्यू को सिगमॉइड फ़ंक्शन, जो 0 और 1 के बीच एक मान (एक संभाव्यता) देता है:
\[y' = \frac{1}{1 + e^{-z}}\]
कहां:
- y' लॉजिस्टिक रिग्रेशन मॉडल का आउटपुट है.
- z लीनियर आउटपुट है (जैसा कि पिछले समीकरण में कैलकुलेट किया गया है).
इस बारे में ज़्यादा जानने के लिए यहां क्लिक करें लॉग-ऑड
समीकरण $z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N$, z में को लॉग-ऑड कहा जाता है, क्योंकि अगर निम्न सिग्मॉइड फ़ंक्शन है (जहां $y$ किसी लॉजिस्टिक का आउटपुट है रिग्रेशन मॉडल, प्रॉबबिलिटी दिखाना):
$$y = \frac{1}{1 + e^{-z}}$$
इसके बाद, z तक हल करें:
$$ z = \log\left(\frac{y}{1-y}\right) $$
फिर z को प्रायिकताओं के अनुपात के लॉग के रूप में परिभाषित किया जाता है दो संभावित नतीजों में से एक है: y और 1 – y.
दूसरी इमेज में दिखाया गया है कि लीनियर आउटपुट, लॉजिस्टिक रिग्रेशन में कैसे बदलता है आउटपुट का आकलन करें.
इमेज 2 में, एक लीनियर इक्वेशन, सिगमॉइड फ़ंक्शन का इनपुट बन जाता है. जो सीधी लाइन को एस के आकार में मोड़ देती है. ध्यान दें कि रैखिक समीकरण z के बहुत बड़े या बहुत छोटे मान हो सकते हैं, लेकिन सिगमॉइड का आउटपुट फ़ंक्शन, y', हमेशा 0 और 1 के बीच होता है, जिसमें यह शामिल नहीं है. उदाहरण के लिए, नारंगी बाएं ग्राफ़ पर मौजूद आयत का z मान -10 है, लेकिन इसमें सिग्मॉइड फ़ंक्शन है दायां ग्राफ़ जो -10 को y' में दिखाता है वैल्यू 0.00004 है.
व्यायाम: अपनी समझ की जांच करें
तीन सुविधाओं वाले लॉजिस्टिक रिग्रेशन मॉडल में ये पूर्वाग्रह होते हैं और वज़न:
\[\begin{align} b &= 1 \\ w_1 &= 2 \\ w_2 &= -1 \\ w_3 &= 5 \end{align} \]
ये इनपुट वैल्यू दी गई हैं:
\[\begin{align} x_1 &= 0 \\ x_2 &= 10 \\ x_3 &= 2 \end{align} \]
नीचे दिए गए दो सवालों के जवाब दें.
जैसा कि ऊपर #1 में बताया गया है, इनपुट वैल्यू का लॉग-ऑड 1 है. z के लिए उस वैल्यू को सिग्मॉइड फ़ंक्शन में प्लग करें:
\(y = \frac{1}{1 + e^{-z}} = \frac{1}{1 + e^{-1}} = \frac{1}{1 + 0.367} = \frac{1}{1.367} = 0.731\)