निष्पक्षता: भेदभाव के टाइप

मशीन लर्निंग (एमएल) मॉडल अपने मकसद से नहीं बनाए जाते. मशीन लर्निंग के विशेषज्ञ, मॉडल को ट्रेनिंग के उदाहरणों का डेटासेट देकर उन्हें ट्रेन करते हैं. इस डेटा को उपलब्ध कराने और उसे क्यूरेट करने में मानवीय गतिविधि शामिल होने पर, मॉडल के अनुमान में पक्षपात की आशंका बढ़ सकती है.

मॉडल बनाते समय, यह जानना ज़रूरी है कि डेटा में मानवीय पक्षपात की सामान्य भावनाएं कैसे दिख सकती हैं. इससे, इन भावनाओं के असर को कम करने के लिए, पहले से ही कदम उठाए जा सकते हैं.

रिपोर्टिंग में पक्षपात

पुराने डेटा का असर

ऑटोमेशन बायस

चुनने में पक्षपात

चुनने से जुड़ा पक्षपात तब होता है, जब किसी डेटासेट के उदाहरण ऐसे चुने जाते हैं जो उनके असल डिस्ट्रिब्यूशन को नहीं दिखाते. चुनिंदा नमूने के आधार पर अनुमान लगाने की गड़बड़ी के कई रूप हो सकते हैं. जैसे, कवरेज में गड़बड़ी, नतीजे न मिलने की गड़बड़ी, और सैंपलिंग में गड़बड़ी.

कवरेज बायस

नॉन-रिस्पॉन्स बायस

नमूना पूर्वाग्रह

ग्रुप एट्रिब्यूशन बायस

ग्रुप एट्रिब्यूशन बायस की मदद से, किसी व्यक्ति के बारे में वही जानकारी दी जाती है जो पूरे ग्रुप से जुड़ी होती है. ग्रुप एट्रिब्यूशन बायस अक्सर इन दो तरीकों से दिखता है.

इन-ग्रुप बायस

आउट-ग्रुप होमोजेनिटी बायस

इंप्लिसिट बायस

एक पक्ष की पुष्टि करना

एक्सपेरिमेंटर बायस

एक्सरसाइज़: देखें कि आपको क्या समझ आया

शुरुआत में बताए गए कॉलेज में दाखिले के मॉडल में, इनमें से किस तरह के पूर्वाग्रह की वजह से गलत अनुमान दिए गए हो सकते हैं?
पुराने डेटा के आधार पर गलत नतीजे
ऐडमिशन मॉडल को पिछले 20 सालों के छात्र-छात्राओं के रिकॉर्ड के आधार पर ट्रेन किया गया था. अगर इस डेटा में अल्पसंख्यक छात्र-छात्राओं को कम दिखाया गया है, तो हो सकता है कि नए छात्र-छात्राओं के डेटा का अनुमान लगाते समय, इस मॉडल में पहले जैसी ही असमानताएं मौजूद हों.
इन-ग्रुप बायस
ऐडमिशन मॉडल को ट्रेन करने के लिए, विश्वविद्यालय के मौजूदा छात्र-छात्राओं का इस्तेमाल किया गया था. ऐसा हो सकता है कि वे अपने जैसे बैकग्राउंड वाले छात्र-छात्राओं को स्वीकार करने के लिए, अनजाने में प्राथमिकता देते हों. इस वजह से, उस डेटा को क्यूरेट करने या उसमें फ़ीचर इंजीनियरिंग करने के तरीके पर असर पड़ सकता है जिस पर मॉडल को ट्रेन किया गया था.
कंफ़र्मेशन बायस
ऐडमिशन मॉडल को ट्रेनिंग देने के लिए, यूनिवर्सिटी के मौजूदा छात्र-छात्राओं का इस्तेमाल किया गया. इन छात्र-छात्राओं को पहले से पता था कि कंप्यूटर साइंस प्रोग्राम में सफलता पाने के लिए, किस तरह की योग्यताएं ज़रूरी हैं. हो सकता है कि उन्होंने डेटा को गलती से क्यूरेट किया हो या उसमें बदलाव किया हो, ताकि मॉडल इन मौजूदा मान्यताओं की पुष्टि कर सके.
ऑटोमेशन बायस
ऑटोमेशन बायस की वजह से यह समझा जा सकता है कि ऐडमिशन कमिटी ने ऐडमिशन से जुड़े फ़ैसले लेने के लिए, एआई मॉडल का इस्तेमाल क्यों किया. हो सकता है कि उन्हें लगा हो कि ऑटोमेटेड सिस्टम, मनुष्यों के फ़ैसलों के मुकाबले बेहतर नतीजे देगा. हालांकि, ऑटोमेशन बायस से यह जानकारी नहीं मिलती कि मॉडल के अनुमान गलत क्यों रहे.