मशीन लर्निंग (एमएल) मॉडल अपने-आप में किसी मकसद के लिए नहीं होते. मशीन लर्निंग का इस्तेमाल करने वाले लोग मॉडल को ट्रेनिंग देने के लिए, ट्रेनिंग के उदाहरणों का एक डेटासेट फ़ीड करना होगा. में शामिल करने और उसे चुनने पर मॉडल का पूर्वानुमान लगाए जा सकते हैं.
मॉडल बनाते समय, मानवीय पूर्वाग्रहों के बारे में जानना ज़रूरी है, जो को कम किया जा सकेगा, ताकि आप इन समस्याओं को कम करने के लिए इफ़ेक्ट.
रिपोर्टिंग बायस
-
परिभाषा
रिपोर्टिंग बायस तब होता है, जब डेटासेट में कैप्चर किए गए इवेंट, प्रॉपर्टी, और/या नतीजों में इससे उनकी असल दुनिया की फ़्रीक्वेंसी को सटीक तौर पर ज़ाहिर किया जा सकता है. यह पक्षपात पैदा हो सकता है क्योंकि लोग उन स्थितियों पर ध्यान देते हैं जो असामान्य या खास तौर पर याद रहने लायक, यह मानते हुए कि सामान्य को रिकॉर्ड करना ज़रूरी है.
-
उदाहरण
भावनाओं का विश्लेषण करने वाले मॉडल को यह अनुमान लगाने के लिए ट्रेनिंग दी गई है कि उपयोगकर्ताओं की सूची के आधार पर, समीक्षाएं अच्छी या बुरी होती हैं किसी लोकप्रिय वेबसाइट पर सबमिशन के लिए. इस महीने की ज़्यादातर समीक्षाएं ट्रेनिंग डेटासेट में ऐसी राय शामिल की जा सकती है (ऐसे समीक्षक जो किसी पुस्तक को पसंद या नापसंद करते है), क्योंकि लोगों द्वारा उसे सबमिट करने की किताब की समीक्षा के लिए सबमिट करना होगा, अगर उन्होंने उस किताब का कड़ाई से जवाब नहीं दिया था. बतौर नतीजा यह होता है कि यह मॉडल, ऐसी समीक्षाएं जिनमें किसी किताब के बारे में ज़्यादा आसान भाषा का इस्तेमाल किया गया हो.
क्लिक करें chevron_left लिखें.
ऐतिहासिक पक्षपात
-
परिभाषा
पुराने डेटा का पूर्वाग्रह तब होता है, जब पुराना डेटा उस समय दुनिया में मौजूद असमानताओं को दर्शाता हो.
-
उदाहरण
शहर में 1960 के दशक के एक डेटासेट में घर की कीमत का डेटा शामिल है जो दिखाता है क़र्ज़ देने के ऐसे तरीके़ इस्तेमाल किए गए हों दशक.
क्लिक करें chevron_left लिखें.
ऑटोमेशन बायस
-
परिभाषा
ऑटोमेशन बायस, नतीजों के पक्ष में होता है जो ऑटोमेटेड सिस्टम (कार्रवाइयों को अपने-आप पूरा करने वाला सिस्टम) से जनरेट नहीं होते, न कि ऑटोमेटेड सिस्टम से में इस बात का ध्यान नहीं रखा जाता कि हर सिस्टम में गड़बड़ी की दर कितनी है.
-
उदाहरण
स्प्रोकेट मैन्युफ़ैक्चरर के लिए काम कर रहे मशीन लर्निंग प्रोसेसर, उन्हें नया "बुनियादी जानकारी" डिप्लॉय करना मॉडल को पहचानना सिखाया गया दांतों में खराबी को तब तक नहीं देखा जा सकता, जब तक फ़ैक्ट्री के सुपरवाइज़र ने बताया कि सटीक होने और बाज़ार से प्रॉडक्ट हटाने की दर, दोनों में 15% कम थी की समीक्षा करते हैं.
क्लिक करें chevron_left लिखें.
चयन बायस
चुनने के आधार पर भेदभाव तब होता है, जब डेटासेट के उदाहरण इस तरह से चुने गए हैं कि वे असल दुनिया में डिस्ट्रिब्यूशन. चुनने के लिए कई तरह से पूर्वाग्रह हो सकता है, इसमें कवरेज बायस, नॉन-रिस्पॉन्स बायस, और सैंपलिंग बायस शामिल हैं.
कवरेज बायस
-
परिभाषा
कवरेज बायस तब होता है, जब डेटा को फ़ैशन के बारे में बात करते हैं.
-
उदाहरण
आने वाले समय में, नए प्रॉडक्ट की बिक्री का अनुमान लगाने के लिए, मॉडल को ट्रेनिंग दी गई है फ़ोन पर किए गए सर्वे में, प्रॉडक्ट खरीदने वाले लोगों के सैंपल के साथ किए गए प्रॉडक्ट. ऐसे उपभोक्ता जिन्होंने इसके बजाय, किसी दूसरे प्रॉडक्ट को खरीदने का विकल्प चुना की सर्वे में हिस्सा नहीं लिया गया था. इस वजह से, इस ग्रुप के लोगों को ट्रेनिंग डेटा में मौजूद है.
क्लिक करें chevron_left लिखें.
गैर-रिस्पॉन्स बायस
-
परिभाषा
गैर-प्रतिक्रिया पूर्वाग्रह (इसे भागीदारी के लिए भेदभाव) तब किया जाता है, जब डेटा डेटा-कलेक्शन में भागीदारी की कमियों की वजह से वाकिफ़िक नहीं हो सकता प्रोसेस.
-
उदाहरण
आने वाले समय में, नए प्रॉडक्ट की बिक्री का अनुमान लगाने के लिए, मॉडल को ट्रेनिंग दी गई है फ़ोन पर किए गए सर्वे में, प्रॉडक्ट खरीदने वाले लोगों के सैंपल के साथ किए गए लेकिन प्रतिस्पर्धी प्रॉडक्ट खरीदने वाले उपभोक्ताओं के नमूने प्रॉडक्ट. प्रतिस्पर्धी प्रॉडक्ट खरीदने वाले उपभोक्ताओं की संख्या 80% ज़्यादा थी लोग सर्वे पूरा करने से मना कर सकते थे और उनका डेटा को सैंपल में कम प्रस्तुत किया जाता है.
क्लिक करें chevron_left लिखें.
नमूना पूर्वाग्रह
-
परिभाषा
सैंपलिंग बायस तब होता है, जब उचित तरीके से रैंडमाइज़ेशन हो डेटा कलेक्शन के दौरान इस्तेमाल नहीं किया जाता.
-
उदाहरण
आने वाले समय में, नए प्रॉडक्ट की बिक्री का अनुमान लगाने के लिए, मॉडल को ट्रेनिंग दी गई है फ़ोन पर किए गए सर्वे में, प्रॉडक्ट खरीदने वाले लोगों के सैंपल के साथ किए गए लेकिन प्रतिस्पर्धी प्रॉडक्ट खरीदने वाले उपभोक्ताओं के नमूने प्रॉडक्ट. उपभोक्ताओं को बिना किसी क्रम के टारगेट करने के बजाय, सर्वेक्षक ईमेल का जवाब देने वाले पहले 200 उपभोक्ताओं को चुना, जो लोग इस प्रॉडक्ट को लेकर औसत से ज़्यादा दिलचस्पी दिखा रहे हैं खरीदार.
क्लिक करें chevron_left लिखें.
ग्रुप एट्रिब्यूशन बायस
ग्रुप एट्रिब्यूशन बायस जो व्यक्ति के बारे में पूरे समूह के लिए आम तौर पर लागू होने वाली बातों को एक सामान्य बात के रूप में समझा जाता है वे संबंधित हैं. ग्रुप एट्रिब्यूशन से जुड़े पूर्वाग्रह अक्सर इन दोनों स्थितियों में होते हैं फ़ॉर्म भरें.
इन-ग्रुप बायस
-
परिभाषा
इन-ग्रुप पूर्वाग्रह के सदस्यों की प्राथमिकता आपका अपना ग्रुप, जिसमें आप भी शामिल हों या खास चीज़ों के लिए जिसे आप शेयर भी करते हैं.
-
उदाहरण
मशीन लर्निंग प्रोसेस में हिस्सा लेने वाले दो पेशेवर, सॉफ़्टवेयर डेवलपर को यह मानने के लिए पहले से सूचित किया जाता है कि आवेदकों जो उसी कंप्यूटर-साइंस अकैडमी में पढ़ते थे जहां वे दोनों पढ़ते थे उस भूमिका के लिए ज़्यादा बेहतर होते हैं.
क्लिक करें chevron_left लिखें.
आउट-ग्रुप एकरूपता बायस
-
परिभाषा
अलग-अलग ग्रुप के बीच एक ही अंतर को शामिल करना, आम तौर पर किसी समूह के ऐसे अलग-अलग सदस्यों के साथ घिसी-पिटी सोच को बढ़ावा देना, जिनके आप सदस्य नहीं हैं या उनकी विशेषताएं एक जैसी दिखें.
-
उदाहरण
मशीन लर्निंग प्रोसेस में हिस्सा लेने वाले दो पेशेवर, सॉफ़्टवेयर डेवलपर यह मानने के लिए पहले से ही तैयार हैं कि सभी आवेदकों जो कंप्यूटर साइंस अकैडमी में नहीं गए उनके पास इस भूमिका के लिए ज़रूरी विशेषज्ञता है.
क्लिक करें chevron_left लिखें.
इंप्लिसिट बायस
-
परिभाषा
इंप्लिसिट बायस तब होता है, जब अनुमान लगाए जाते हैं और व्यक्तिगत अनुभव के आधार पर, ज़रूरी नहीं है कि इसे सामान्य रूप से लागू किया जाए.
-
उदाहरण
हाथ के जेस्चर (हाव-भाव) की पहचान करने वाले मॉडल को ट्रेनिंग देता एक मशीन लर्निंग कारोबारी सिर हिलाना यह बताने की सुविधा कि कोई व्यक्ति "नहीं" शब्द बोल रहा है. हालांकि, दुनिया के कुछ इलाकों में सिर हिलाने की बात होती है का मतलब है "हां."
क्लिक करें chevron_left लिखें.
एक पक्ष की पुष्टि करना
-
परिभाषा
पुष्टि करने से जुड़ा पूर्वाग्रह तब होता है, जब मॉडल बिल्डर पहले से मौजूद मान्यताओं की पुष्टि करने के लिए, डेटा को अनजाने में प्रोसेस करना और कल्पनाओं को बढ़ावा दें.
-
उदाहरण
मशीन लर्निंग का एक पेशेवर, ऐसा मॉडल बना रहा है जो जल्दबाज़ी में होने का अनुमान लगाता है और उन्हें ट्रैक करने के लिए, जो कुत्तों की अलग-अलग विशेषताओं (लंबाई, वज़न, नस्ल, वातावरण). उस कारोबारी ने बचपन में हाइपरऐक्टिव टॉय पूडल, और तब से थोड़ी आक्रामक हो जाएं. मॉडल का ट्रेनिंग डेटा चुनते समय, कारोबारी ने अनजाने में उन सुविधाओं को खारिज कर दिया जो छोटे कुत्तों में विनम्रता का सबूत देते हैं.
क्लिक करें chevron_left लिखें.
एक्सपेरिमेंटर का पूर्वाग्रह
-
परिभाषा
मॉडल बिल्डर में एक्सपेरिमेंट करने वाले का बायस होता है मॉडल को तब तक ट्रेनिंग देता रहता है, जब तक कि वह मॉडल ओरिजनल अनुमान के साथ काम करता है.
-
उदाहरण
मशीन लर्निंग का एक पेशेवर, ऐसा मॉडल बना रहा है जो जल्दबाज़ी में होने का अनुमान लगाता है और उन्हें ट्रैक करने के लिए, जो कुत्तों की अलग-अलग विशेषताओं (लंबाई, वज़न, नस्ल, वातावरण). उस कारोबारी ने बचपन में हाइपरऐक्टिव टॉय पूडल, और तब से थोड़ी आक्रामक हो जाएं. जब प्रशिक्षित मॉडल ने सबसे टॉय पूडल की तुलना में विनम्रता से व्यवहार करता है. उसे ट्रेनिंग दी गई मॉडल को तब तक कई बार इस्तेमाल किया जाता रहा, जब तक छोटे पूडल बनाए जा सकते हैं.
क्लिक करें chevron_left लिखें.