निष्पक्षता: भेदभाव के टाइप

मशीन लर्निंग (एमएल) मॉडल अपने-आप में किसी मकसद के लिए नहीं होते. मशीन लर्निंग का इस्तेमाल करने वाले लोग मॉडल को ट्रेनिंग देने के लिए, ट्रेनिंग के उदाहरणों का एक डेटासेट फ़ीड करना होगा. में शामिल करने और उसे चुनने पर मॉडल का पूर्वानुमान लगाए जा सकते हैं.

मॉडल बनाते समय, मानवीय पूर्वाग्रहों के बारे में जानना ज़रूरी है, जो को कम किया जा सकेगा, ताकि आप इन समस्याओं को कम करने के लिए इफ़ेक्ट.

रिपोर्टिंग बायस

ऐतिहासिक पक्षपात

ऑटोमेशन बायस

चयन बायस

चुनने के आधार पर भेदभाव तब होता है, जब डेटासेट के उदाहरण इस तरह से चुने गए हैं कि वे असल दुनिया में डिस्ट्रिब्यूशन. चुनने के लिए कई तरह से पूर्वाग्रह हो सकता है, इसमें कवरेज बायस, नॉन-रिस्पॉन्स बायस, और सैंपलिंग बायस शामिल हैं.

कवरेज बायस

गैर-रिस्पॉन्स बायस

नमूना पूर्वाग्रह

ग्रुप एट्रिब्यूशन बायस

ग्रुप एट्रिब्यूशन बायस जो व्यक्ति के बारे में पूरे समूह के लिए आम तौर पर लागू होने वाली बातों को एक सामान्य बात के रूप में समझा जाता है वे संबंधित हैं. ग्रुप एट्रिब्यूशन से जुड़े पूर्वाग्रह अक्सर इन दोनों स्थितियों में होते हैं फ़ॉर्म भरें.

इन-ग्रुप बायस

आउट-ग्रुप एकरूपता बायस

इंप्लिसिट बायस

एक पक्ष की पुष्टि करना

एक्सपेरिमेंटर का पूर्वाग्रह

व्यायाम: अपनी समझ की जांच करें

इनमें से किस तरह के पूर्वाग्रह की वजह से का आकलन करता है. इंच परिचय?
ऐतिहासिक पक्षपात
एडमिशन मॉडल को छात्र-छात्राओं के रिकॉर्ड के हिसाब से, पहले ही ट्रेनिंग दी गई थी 20 साल. अगर इस डेटा में अल्पसंख्यक छात्र-छात्राओं को कमज़ोर दिखाया गया, तो यह मॉडल एक जैसी ऐतिहासिक असमानताओं को फिर से पैदा कर सकता था छात्र-छात्राओं के नए डेटा का अनुमान लगाते समय.
इन-ग्रुप बायस
एडमिशन मॉडल को यूनिवर्सिटी के मौजूदा छात्र-छात्राओं ने ट्रेनिंग दी है, जो छात्र-छात्राओं को दाखिला लेने के लिए अनजाने में प्राथमिकता दे सकते थे जो उनके जैसे बैकग्राउंड से मिले थे. डेटा को क्यूरेट करने या उसे फ़ीचर-इंजीनियर करने के तरीके पर असर पड़ सकता था जिस पर मॉडल को ट्रेनिंग दी गई.
एक पक्ष की पुष्टि करना
एडमिशन मॉडल को यूनिवर्सिटी के मौजूदा छात्र-छात्राओं ने ट्रेनिंग दी है, जो पहले से ही जानते थे कि किसी की योग्यता के बारे में क्या पता है कंप्यूटर साइंस प्रोग्राम में सफलता के साथ संबंध बनाते हैं. वे यह कर सके अनजाने में डेटा को क्यूरेट या फ़ीचर-इंजीनियर किया है ताकि मॉडल ने इन मान्यताओं की पुष्टि की.
ऑटोमेशन बायस
ऐसा हो सकता है कि ऑटोमेशन सिस्टम के इस्तेमाल से जुड़े पूर्वाग्रह की वजह से, एडमिशन कमिटी ने एमएल मॉडल का इस्तेमाल करके, एडमिशन के लिए फ़ैसला लिया जा सकता है; शायद उनके पास हमें लगा कि ऑटोमेटेड सिस्टम का इस्तेमाल करने पर, लोगों के फ़ैसले होते हैं. हालांकि, ऑटोमेशन से जुड़े पूर्वाग्रह इससे आपको यह समझने में मदद मिलेगी कि मॉडल के अनुमान में बदलाव क्यों हो रहा है.