এই পৃষ্ঠায় ফেয়ারনেস শব্দকোষের শর্তাবলী রয়েছে। সকল শব্দকোষের জন্য এখানে ক্লিক করুন ।
ক
বৈশিষ্ট্য
বৈশিষ্ট্য জন্য সমার্থক.
মেশিন লার্নিং ন্যায্যতায়, বৈশিষ্ট্যগুলি প্রায়শই ব্যক্তি সম্পর্কিত বৈশিষ্ট্যগুলিকে বোঝায়।
অটোমেশন পক্ষপাত
যখন একজন মানবিক সিদ্ধান্ত গ্রহণকারী অটোমেশন ছাড়াই তৈরি তথ্যের উপর একটি স্বয়ংক্রিয় সিদ্ধান্ত-প্রণয়ন ব্যবস্থার দ্বারা প্রণীত সুপারিশগুলিকে সমর্থন করে, এমনকি যখন স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণের সিস্টেম ত্রুটি করে।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
খ
পক্ষপাত (নৈতিকতা/ন্যায়)
1. কিছু জিনিস, মানুষ বা গোষ্ঠীর প্রতি স্টিরিওটাইপিং, কুসংস্কার বা পক্ষপাতিত্ব। এই পক্ষপাতগুলি ডেটা সংগ্রহ এবং ব্যাখ্যা, একটি সিস্টেমের নকশা এবং ব্যবহারকারীরা কীভাবে একটি সিস্টেমের সাথে যোগাযোগ করে তা প্রভাবিত করতে পারে। এই ধরনের পক্ষপাতের ফর্মগুলির মধ্যে রয়েছে:
- অটোমেশন পক্ষপাত
- নিশ্চিতকরণ পক্ষপাত
- পরীক্ষকের পক্ষপাত
- গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
- অন্তর্নিহিত পক্ষপাত
- ইন-গ্রুপ পক্ষপাত
- আউট-গ্রুপ একজাতীয়তা পক্ষপাত
2. একটি নমুনা বা রিপোর্টিং পদ্ধতি দ্বারা প্রবর্তিত পদ্ধতিগত ত্রুটি। এই ধরনের পক্ষপাতের ফর্মগুলির মধ্যে রয়েছে:
- কভারেজ পক্ষপাত
- অ-প্রতিক্রিয়া পক্ষপাত
- অংশগ্রহণের পক্ষপাতিত্ব
- রিপোর্টিং পক্ষপাত
- স্যাম্পলিং পক্ষপাত
- নির্বাচনের পক্ষপাতিত্ব
মেশিন লার্নিং মডেল বা ভবিষ্যদ্বাণী পক্ষপাতিত্ব শব্দের সাথে বিভ্রান্ত হবেন না।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
গ
নিশ্চিতকরণ পক্ষপাত
এমনভাবে তথ্য অনুসন্ধান, ব্যাখ্যা, অনুগ্রহ এবং স্মরণ করার প্রবণতা যা একজনের পূর্ব-বিদ্যমান বিশ্বাস বা অনুমানকে নিশ্চিত করে। মেশিন লার্নিং ডেভেলপাররা অসাবধানতাবশত এমনভাবে ডেটা সংগ্রহ বা লেবেল করতে পারে যা তাদের বিদ্যমান বিশ্বাসকে সমর্থন করে এমন ফলাফলকে প্রভাবিত করে। নিশ্চিতকরণ পক্ষপাত হল অন্তর্নিহিত পক্ষপাতের একটি রূপ।
এক্সপেরিমেন্টারের পক্ষপাত হল এক ধরনের নিশ্চিতকরণ পক্ষপাত যেখানে একজন পরীক্ষক পূর্ব-বিদ্যমান হাইপোথিসিস নিশ্চিত না হওয়া পর্যন্ত মডেলের প্রশিক্ষণ চালিয়ে যান।
বিপরীত ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে একটি শ্রেণীবিভাগকারী একজন ব্যক্তির জন্য একই ফলাফল তৈরি করে কি না এটি অন্য ব্যক্তির জন্য একই ফলাফল দেয় যা প্রথমটির সাথে অভিন্ন, এক বা একাধিক সংবেদনশীল বৈশিষ্ট্যের ক্ষেত্রে। কাউন্টারফ্যাকচুয়াল ন্যায্যতার জন্য একটি শ্রেণীবিভাগের মূল্যায়ন একটি মডেলে পক্ষপাতের সম্ভাব্য উত্সগুলিকে সারফেস করার একটি পদ্ধতি।
আরও তথ্যের জন্য নিচের যেকোনো একটি দেখুন:
- ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে কাউন্টারফ্যাকচুয়াল ন্যায্যতা ।
- যখন বিশ্বগুলি সংঘর্ষে: ন্যায্যতায় বিভিন্ন কাউন্টারফ্যাকচুয়াল অনুমানকে একীভূত করা
কভারেজ পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
ডি
জনসংখ্যাগত সমতা
একটি ন্যায্যতা মেট্রিক যা একটি মডেলের শ্রেণীবিভাগের ফলাফল একটি প্রদত্ত সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল না হলে সন্তুষ্ট হয়৷
উদাহরণস্বরূপ, যদি লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়ই গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে, তাহলে জনসংখ্যাগত সমতা অর্জন করা হয় যদি লিলিপুটিয়ানদের ভর্তির শতাংশ ব্রোবডিংনাগিয়ানদের ভর্তির শতাংশের সমান হয়, তা নির্বিশেষে যে একটি গোষ্ঠী অন্যের তুলনায় গড়ে বেশি যোগ্য কিনা।
সমতাপূর্ণ প্রতিকূলতা এবং সুযোগের সমতার সাথে বৈসাদৃশ্য, যা শ্রেণীবিভাগের ফলাফলকে সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করার অনুমতি দেয়, কিন্তু নির্দিষ্ট নির্দিষ্ট গ্রাউন্ড ট্রুথ লেবেলগুলির জন্য সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করার জন্য শ্রেণীবিভাগের ফলাফলকে অনুমতি দেয় না। ডেমোগ্রাফিক সমতা অপ্টিমাইজ করার সময় ট্রেডঅফ অন্বেষণ করার একটি ভিজ্যুয়ালাইজেশনের জন্য "স্মার্ট মেশিন লার্নিং দিয়ে বৈষম্যের আক্রমণ" দেখুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ফেয়ারনেস: ডেমোগ্রাফিক প্যারিটি দেখুন।
ভিন্ন প্রভাব
বিভিন্ন জনসংখ্যার উপগোষ্ঠীকে অসমভাবে প্রভাবিত করে এমন লোকদের সম্পর্কে সিদ্ধান্ত নেওয়া। এটি সাধারণত এমন পরিস্থিতিতে বোঝায় যেখানে একটি অ্যালগরিদমিক সিদ্ধান্ত নেওয়ার প্রক্রিয়া কিছু উপগোষ্ঠীকে অন্যদের তুলনায় বেশি ক্ষতি বা উপকার করে।
উদাহরণস্বরূপ, ধরুন একটি অ্যালগরিদম যা একটি ক্ষুদ্র-গৃহঋণের জন্য একটি লিলিপুটিয়ানের যোগ্যতা নির্ধারণ করে তাদের মেইলিং ঠিকানায় একটি নির্দিষ্ট পোস্টাল কোড থাকলে তাদের "অযোগ্য" হিসাবে শ্রেণীবদ্ধ করার সম্ভাবনা বেশি। লিটল-এন্ডিয়ান লিলিপুটিয়ানদের তুলনায় যদি বিগ-এন্ডিয়ান লিলিপুটিয়ানদের এই পোস্টাল কোড সহ মেইলিং ঠিকানার সম্ভাবনা বেশি থাকে, তাহলে এই অ্যালগরিদমটি ভিন্ন প্রভাব ফেলতে পারে।
বৈষম্যপূর্ণ চিকিত্সার সাথে বৈপরীত্য, যা বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে যার ফলস্বরূপ যখন উপগোষ্ঠীর বৈশিষ্ট্যগুলি একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণের প্রক্রিয়ার সুস্পষ্ট ইনপুট হয়।
পৃথক চিকিত্সা
একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণের প্রক্রিয়ার মধ্যে বিষয়গুলির সংবেদনশীল বৈশিষ্ট্যগুলিকে ফ্যাক্টরিং করা যাতে মানুষের বিভিন্ন উপগোষ্ঠীকে আলাদাভাবে বিবেচনা করা হয়।
উদাহরণস্বরূপ, একটি অ্যালগরিদম বিবেচনা করুন যা লিলিপুটিয়ানদের তাদের ঋণের আবেদনে দেওয়া তথ্যের ভিত্তিতে একটি ক্ষুদ্র-গৃহঋণের জন্য যোগ্যতা নির্ধারণ করে। যদি অ্যালগরিদম একটি ইনপুট হিসাবে বিগ-এন্ডিয়ান বা লিটল-এন্ডিয়ান হিসাবে একটি লিলিপুটিয়ানের অধিভুক্তি ব্যবহার করে, তবে এটি সেই মাত্রার সাথে বৈষম্যমূলক চিকিত্সা কার্যকর করছে।
বৈষম্যমূলক প্রভাবের সাথে বৈসাদৃশ্য, যা উপগোষ্ঠীর উপর অ্যালগরিদমিক সিদ্ধান্তের সামাজিক প্রভাবগুলিতে বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে, সেই উপগোষ্ঠীগুলি মডেলের ইনপুট কিনা তা নির্বিশেষে।
ই
সুযোগের সমতা
একটি মডেল একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানগুলির জন্য সমানভাবে পছন্দসই ফলাফলের পূর্বাভাস দিচ্ছে কিনা তা মূল্যায়ন করার জন্য একটি ন্যায্যতা মেট্রিক ৷ অন্য কথায়, যদি একটি মডেলের জন্য আকাঙ্খিত ফলাফল ইতিবাচক শ্রেণী হয়, তাহলে লক্ষ্য হবে প্রকৃত ইতিবাচক হার সব দলের জন্য একই।
সুযোগের সমতা সমান মতভেদের সাথে সম্পর্কিত, যার জন্য সত্য ইতিবাচক হার এবং মিথ্যা ধনাত্মক হার উভয়ই সকল দলের জন্য একই হওয়া প্রয়োজন।
ধরুন Glubbdubdrib ইউনিভার্সিটি লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করেছে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থীই বিশ্ববিদ্যালয়ের প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিতের ক্লাস অফার করে না এবং ফলস্বরূপ, তাদের অনেক কম শিক্ষার্থীই যোগ্য। সুযোগের সমতা জাতীয়তা (লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান) এর ক্ষেত্রে "ভর্তি" এর পছন্দের লেবেলের জন্য সন্তুষ্ট হয় যদি যোগ্য শিক্ষার্থীরা লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান নির্বিশেষে ভর্তি হওয়ার সমান সম্ভাবনা থাকে।
উদাহরণস্বরূপ, ধরুন 100 জন লিলিপুটিয়ান এবং 100 জন ব্রোবডিংনাগিয়ান Glubbdubdrib বিশ্ববিদ্যালয়ে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণী 1. লিলিপুটিয়ান আবেদনকারীরা (90% যোগ্য)
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 45 | 3 |
প্রত্যাখ্যাত | 45 | 7 |
মোট | 90 | 10 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 45/90 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 7/10 = 70% ভর্তিকৃত লিলিপুটিয়ান ছাত্রদের মোট শতাংশ: (45+3)/100 = 48% |
সারণী 2. ব্রোবডিংনাগিয়ান আবেদনকারীরা (10% যোগ্য):
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 5 | 9 |
প্রত্যাখ্যাত | 5 | 81 |
মোট | 10 | 90 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 5/10 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 81/90 = 90% ভর্তিকৃত ব্রোবডিংনাগিয়ান ছাত্রদের মোট শতাংশ: (5+9)/100 = 14% |
পূর্বের উদাহরণগুলি যোগ্য ছাত্রদের গ্রহণের সুযোগের সমতাকে সন্তুষ্ট করে কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার 50% সম্ভাবনা রয়েছে।
সুযোগের সমতা সন্তুষ্ট হলেও, নিম্নলিখিত দুটি ন্যায্যতা মেট্রিক সন্তুষ্ট নয়:
- জনসংখ্যাগত সমতা : লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানরা বিভিন্ন হারে বিশ্ববিদ্যালয়ে ভর্তি হয়; 48% লিলিপুটিয়ান ছাত্র ভর্তি করা হয়, কিন্তু ব্রবডিংনাগিয়ান ছাত্রদের মাত্র 14% ভর্তি হয়।
- সমান মতভেদ : যদিও যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার একই সুযোগ রয়েছে, অতিরিক্ত সীমাবদ্ধতা যে অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই প্রত্যাখ্যাত হওয়ার একই সুযোগ রয়েছে তা সন্তুষ্ট নয়। অযোগ্য লিলিপুটিয়ানদের প্রত্যাখ্যানের হার 70%, যেখানে অযোগ্য ব্রবডিংনাগিয়ানদের প্রত্যাখ্যানের হার 90%।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: সুযোগের সমতা দেখুন।
সমান মতভেদ
একটি মডেল ইতিবাচক শ্রেণী এবং নেতিবাচক উভয় শ্রেণীর ক্ষেত্রেই একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানের জন্য সমানভাবে ফলাফলের পূর্বাভাস দিচ্ছে কিনা তা মূল্যায়ন করার জন্য একটি ন্যায্যতা মেট্রিক - শুধুমাত্র একটি শ্রেণী বা অন্য একচেটিয়াভাবে নয়। অন্য কথায়, সত্যিকারের ইতিবাচক হার এবং মিথ্যা নেতিবাচক হার উভয়ই সকল দলের জন্য একই হওয়া উচিত।
সমান মতভেদ সুযোগের সমতার সাথে সম্পর্কিত, যা শুধুমাত্র একটি একক শ্রেণীর (ইতিবাচক বা নেতিবাচক) ত্রুটির হারের উপর ফোকাস করে।
উদাহরণস্বরূপ, ধরুন Glubbdubdrib বিশ্ববিদ্যালয় লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করেছে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থীই বিশ্ববিদ্যালয়ের প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিতের ক্লাস অফার করে না এবং ফলস্বরূপ, তাদের অনেক কম শিক্ষার্থীই যোগ্য। সমতাপূর্ণ প্রতিকূলতাগুলি সন্তুষ্ট থাকে তবে শর্ত থাকে যে একজন আবেদনকারী লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান যাই হোক না কেন, যদি তারা যোগ্য হন, তবে তাদের প্রোগ্রামে ভর্তি হওয়ার সমান সম্ভাবনা, এবং যদি তারা যোগ্য না হয় তবে তাদের প্রত্যাখ্যাত হওয়ার সম্ভাবনা সমান। .
ধরুন 100 জন লিলিপুটিয়ান এবং 100 জন ব্রোবডিংনাগিয়ান Glubbdubdrib ইউনিভার্সিটিতে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণি 3. লিলিপুটিয়ান আবেদনকারীরা (90% যোগ্য)
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 45 | 2 |
প্রত্যাখ্যাত | 45 | 8 |
মোট | 90 | 10 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 45/90 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 8/10 = 80% ভর্তিকৃত লিলিপুটিয়ান ছাত্রদের মোট শতাংশ: (45+2)/100 = 47% |
সারণী 4. ব্রোবডিংনাগিয়ান আবেদনকারীরা (10% যোগ্য):
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 5 | 18 |
প্রত্যাখ্যাত | 5 | 72 |
মোট | 10 | 90 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 5/10 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 72/90 = 80% ভর্তিকৃত ব্রোবডিংনাগিয়ান ছাত্রদের মোট শতাংশ: (5+18)/100 = 23% |
সমান মতপার্থক্য সন্তুষ্ট কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার সম্ভাবনা 50%, এবং অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের প্রত্যাখ্যাত হওয়ার 80% সম্ভাবনা রয়েছে।
"তত্ত্বাবধানে শিক্ষার সুযোগের সমতা" -এ সমতুল্য মতভেদকে আনুষ্ঠানিকভাবে সংজ্ঞায়িত করা হয়েছে: "ভবিষ্যদ্বাণীকারী Ŷ সুরক্ষিত অ্যাট্রিবিউট A এবং ফলাফল Y যদি Ŷ এবং A স্বাধীন হয়, Y এর উপর শর্তসাপেক্ষে সমান মতভেদকে সন্তুষ্ট করে।"
পরীক্ষকের পক্ষপাত
নিশ্চিতকরণ পক্ষপাত দেখুন।
চ
ন্যায্যতার সীমাবদ্ধতা
ন্যায্যতার এক বা একাধিক সংজ্ঞা সন্তুষ্ট তা নিশ্চিত করতে একটি অ্যালগরিদমে একটি সীমাবদ্ধতা প্রয়োগ করা। ন্যায্যতার সীমাবদ্ধতার উদাহরণগুলির মধ্যে রয়েছে:- পোস্ট-প্রসেসিং আপনার মডেলের আউটপুট.
- ন্যায্যতা মেট্রিক লঙ্ঘনের জন্য একটি জরিমানা অন্তর্ভুক্ত করার জন্য ক্ষতি ফাংশন পরিবর্তন করা।
- একটি অপ্টিমাইজেশান সমস্যায় সরাসরি একটি গাণিতিক সীমাবদ্ধতা যোগ করা।
ন্যায্যতা মেট্রিক
"ন্যায্যতা" এর একটি গাণিতিক সংজ্ঞা যা পরিমাপযোগ্য। কিছু সাধারণভাবে ব্যবহৃত ন্যায্যতা মেট্রিক্স অন্তর্ভুক্ত:
অনেক ন্যায্যতা মেট্রিক পারস্পরিক একচেটিয়া; ন্যায্যতা মেট্রিক্সের অসঙ্গতি দেখুন।
জি
গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
অনুমান করা যায় যে একজন ব্যক্তির জন্য যা সত্য তা সেই দলের প্রত্যেকের জন্যও সত্য। যদি ডেটা সংগ্রহের জন্য একটি সুবিধার নমুনা ব্যবহার করা হয় তবে গ্রুপ অ্যাট্রিবিউশন পক্ষপাতের প্রভাবগুলি আরও বাড়িয়ে তুলতে পারে। একটি অ-প্রতিনিধিত্বমূলক নমুনায়, এমন বৈশিষ্ট্যগুলি তৈরি করা যেতে পারে যা বাস্তবতাকে প্রতিফলিত করে না।
এছাড়াও আউট-গ্রুপ সমজাতীয়তা পক্ষপাত এবং ইন-গ্রুপ পক্ষপাত দেখুন। এছাড়াও, আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এইচ
ঐতিহাসিক পক্ষপাত
এক ধরণের পক্ষপাত যা ইতিমধ্যেই বিশ্বে বিদ্যমান এবং একটি ডেটাসেটে তার পথ তৈরি করেছে৷ এই পক্ষপাতিত্বগুলির মধ্যে বিদ্যমান সাংস্কৃতিক স্টেরিওটাইপ, জনসংখ্যাগত অসমতা এবং নির্দিষ্ট কিছু সামাজিক গোষ্ঠীর বিরুদ্ধে কুসংস্কার প্রতিফলিত করার প্রবণতা রয়েছে।
উদাহরণস্বরূপ, একটি শ্রেণিবিন্যাস মডেল বিবেচনা করুন যা ভবিষ্যদ্বাণী করে যে একটি ঋণ আবেদনকারী তাদের ঋণে ডিফল্ট করবে কি না, যা দুটি ভিন্ন সম্প্রদায়ের স্থানীয় ব্যাঙ্ক থেকে 1980 এর দশক থেকে ঐতিহাসিক ঋণ-ডিফল্ট ডেটার উপর প্রশিক্ষিত ছিল। যদি কমিউনিটি A-এর অতীতের আবেদনকারীরা কমিউনিটি B-এর আবেদনকারীদের তুলনায় তাদের ঋণে খেলাপি হওয়ার সম্ভাবনা ছয়গুণ বেশি থাকে, তাহলে মডেলটি একটি ঐতিহাসিক পক্ষপাত শিখতে পারে যার ফলে মডেলটি কমিউনিটি A-তে ঋণ অনুমোদন করার সম্ভাবনা কম থাকে, এমনকি ঐতিহাসিক অবস্থার কারণেও সেই সম্প্রদায়ের উচ্চ ডিফল্ট হার আর প্রাসঙ্গিক ছিল না।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
আমি
অন্তর্নিহিত পক্ষপাত
নিজের মনের মডেল এবং স্মৃতির উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে একটি সমিতি বা অনুমান তৈরি করা। অন্তর্নিহিত পক্ষপাত নিম্নলিখিতগুলিকে প্রভাবিত করতে পারে:
- কিভাবে তথ্য সংগ্রহ এবং শ্রেণীবদ্ধ করা হয়।
- কিভাবে মেশিন লার্নিং সিস্টেম ডিজাইন এবং ডেভেলপ করা হয়।
উদাহরণস্বরূপ, বিবাহের ফটোগুলি সনাক্ত করার জন্য একটি শ্রেণীবিভাগ তৈরি করার সময়, একজন প্রকৌশলী একটি বৈশিষ্ট্য হিসাবে একটি ফটোতে একটি সাদা পোশাকের উপস্থিতি ব্যবহার করতে পারেন। যাইহোক, সাদা পোশাক শুধুমাত্র নির্দিষ্ট যুগে এবং নির্দিষ্ট সংস্কৃতিতে প্রথাগত ছিল।
নিশ্চিতকরণ পক্ষপাতও দেখুন।
ন্যায্যতা মেট্রিক্সের অসঙ্গতি
এই ধারণা যে ন্যায্যতার কিছু ধারণা পারস্পরিকভাবে বেমানান এবং একই সাথে সন্তুষ্ট হতে পারে না। ফলস্বরূপ, ন্যায্যতা পরিমাপ করার জন্য কোনো একক সার্বজনীন মেট্রিক নেই যা সমস্ত ML সমস্যার ক্ষেত্রে প্রয়োগ করা যেতে পারে।
যদিও এটি নিরুৎসাহিত বলে মনে হতে পারে, ন্যায্যতা মেট্রিক্সের অসঙ্গতি বোঝায় না যে ন্যায্যতার প্রচেষ্টা নিষ্ফল। পরিবর্তে, এটি পরামর্শ দেয় যে ন্যায্যতা অবশ্যই একটি প্রদত্ত এমএল সমস্যার জন্য প্রাসঙ্গিকভাবে সংজ্ঞায়িত করা উচিত, এর ব্যবহারের ক্ষেত্রে নির্দিষ্ট ক্ষতি রোধ করার লক্ষ্যে।
ন্যায্যতা মেট্রিক্সের অসঙ্গতি সম্পর্কে আরও বিশদ আলোচনার জন্য "ন্যায্যতার (im) সম্ভাবনার উপর" দেখুন।
স্বতন্ত্র ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে একই ব্যক্তিদের একইভাবে শ্রেণীবদ্ধ করা হয়েছে কিনা। উদাহরণস্বরূপ, Brobdingnagian Academy অভিন্ন গ্রেড এবং প্রমিত পরীক্ষার স্কোর সহ দুইজন শিক্ষার্থী ভর্তি হওয়ার সম্ভাবনা সমানভাবে নিশ্চিত করার মাধ্যমে স্বতন্ত্র ন্যায্যতাকে সন্তুষ্ট করতে চাইতে পারে।
মনে রাখবেন যে স্বতন্ত্র ন্যায্যতা আপনি কীভাবে "সাদৃশ্য" (এই ক্ষেত্রে, গ্রেড এবং পরীক্ষার স্কোর) সংজ্ঞায়িত করেন তার উপর সম্পূর্ণরূপে নির্ভর করে এবং যদি আপনার মিল মেট্রিক গুরুত্বপূর্ণ তথ্য (যেমন একজন শিক্ষার্থীর কঠোরতা) মিস করে তাহলে আপনি নতুন ন্যায্যতা সমস্যা প্রবর্তনের ঝুঁকি চালাতে পারেন পাঠ্যক্রম)।
স্বতন্ত্র ন্যায্যতার আরও বিশদ আলোচনার জন্য "সচেতনতার মাধ্যমে ন্যায্যতা" দেখুন।
ইন-গ্রুপ পক্ষপাত
নিজের গোষ্ঠী বা নিজস্ব বৈশিষ্ট্যের প্রতি পক্ষপাতিত্ব দেখানো। যদি পরীক্ষক বা রেটারদের মধ্যে মেশিন লার্নিং ডেভেলপারের বন্ধু, পরিবার বা সহকর্মী থাকে, তাহলে ইন-গ্রুপ পক্ষপাত পণ্য পরীক্ষা বা ডেটাসেটকে বাতিল করতে পারে।
ইন-গ্রুপ বায়াস হল গ্রুপ অ্যাট্রিবিউশন বায়াসের একটি রূপ। এছাড়াও আউট-গ্রুপ একজাতীয়তা পক্ষপাত দেখুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এন
অ-প্রতিক্রিয়া পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
ও
আউট-গ্রুপ একজাতীয়তা পক্ষপাত
মনোভাব, মূল্যবোধ, ব্যক্তিত্বের বৈশিষ্ট্য এবং অন্যান্য বৈশিষ্ট্যের তুলনা করার সময় গ্রুপের বাইরের সদস্যদের মধ্যে-গোষ্ঠীর সদস্যদের চেয়ে বেশি একইভাবে দেখার প্রবণতা। ইন-গ্রুপ বলতে আপনি যাদের সাথে নিয়মিত যোগাযোগ করেন তাদের বোঝায়; আউট-গ্রুপ বলতে এমন লোকদের বোঝায় যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন না। আপনি যদি লোকেদেরকে আউট-গ্রুপ সম্পর্কে অ্যাট্রিবিউট দিতে বলে একটি ডেটাসেট তৈরি করেন, তাহলে সেই অ্যাট্রিবিউটগুলি কম সংক্ষিপ্ত এবং আরও স্টেরিওটাইপড হতে পারে যেগুলি অংশগ্রহণকারীরা তাদের গ্রুপের লোকেদের জন্য তালিকাভুক্ত করে।
উদাহরণস্বরূপ, স্থাপত্য শৈলী, জানালা, দরজা এবং আকারের ছোট পার্থক্য উল্লেখ করে লিলিপুটিয়ানরা অন্যান্য লিলিপুটিয়ানদের বাড়িগুলিকে বিশদভাবে বর্ণনা করতে পারে। যাইহোক, একই লিলিপুটিয়ানরা সহজভাবে ঘোষণা করতে পারে যে ব্রবডিংনাগিয়ানরা সবাই অভিন্ন বাড়িতে বাস করে।
আউট-গ্রুপ সমজাতীয়তা পক্ষপাত হল গ্রুপ অ্যাট্রিবিউশন পক্ষপাতের একটি রূপ।
এছাড়াও ইন-গ্রুপ পক্ষপাত দেখুন।
পৃ
অংশগ্রহণের পক্ষপাতিত্ব
অ-প্রতিক্রিয়া পক্ষপাত জন্য সমার্থক. নির্বাচনের পক্ষপাত দেখুন।
পোস্ট-প্রসেসিং
মডেল চালানোর পরে একটি মডেলের আউটপুট সামঞ্জস্য করা। পোস্ট-প্রসেসিং মডেলগুলি নিজেরাই পরিবর্তন না করে ন্যায্যতার সীমাবদ্ধতা প্রয়োগ করতে ব্যবহার করা যেতে পারে।
উদাহরণ স্বরূপ, কেউ একটি শ্রেণীবিন্যাস থ্রেশহোল্ড সেট করে বাইনারি ক্লাসিফায়ারে পোস্ট-প্রসেসিং প্রয়োগ করতে পারে যাতে কিছু অ্যাট্রিবিউটের জন্য সুযোগের সমতা বজায় রাখা হয় যেটি সেই অ্যাট্রিবিউটের সমস্ত মানের জন্য সত্য ইতিবাচক হার একই।
ভবিষ্যদ্বাণীমূলক সমতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে প্রদত্ত শ্রেণিবিন্যাসকারীর জন্য, নির্ভুলতা হারগুলি বিবেচনাধীন সাবগ্রুপগুলির জন্য সমতুল্য কিনা।
উদাহরণস্বরূপ, একটি মডেল যা কলেজের গ্রহণযোগ্যতার ভবিষ্যদ্বাণী করে তা জাতীয়তার জন্য ভবিষ্যদ্বাণীমূলক সমতাকে সন্তুষ্ট করবে যদি লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের জন্য এর নির্ভুলতার হার একই হয়।
ভবিষ্যদ্বাণীমূলক সমতাকে কখনও কখনও ভবিষ্যদ্বাণীমূলক হার সমতাও বলা হয়।
ভবিষ্যদ্বাণীমূলক সমতার আরও বিশদ আলোচনার জন্য "ন্যায্যতার সংজ্ঞা ব্যাখ্যা করা হয়েছে" (বিভাগ 3.2.1) দেখুন।
ভবিষ্যদ্বাণীমূলক হার সমতা
ভবিষ্যদ্বাণীমূলক সমতার আরেকটি নাম।
প্রিপ্রসেসিং
একটি মডেলকে প্রশিক্ষণের জন্য ব্যবহার করার আগে ডেটা প্রক্রিয়াকরণ। প্রি-প্রসেসিং ইংরেজি টেক্সট কর্পাস থেকে শব্দগুলি সরানোর মতো সহজ হতে পারে যা ইংরেজি অভিধানে ঘটে না, বা ডেটা পয়েন্টগুলিকে এমনভাবে পুনরায় প্রকাশ করার মতো জটিল হতে পারে যা যতটা সম্ভব সংবেদনশীল বৈশিষ্ট্যগুলির সাথে সম্পর্কযুক্ত অনেকগুলি বৈশিষ্ট্যকে সরিয়ে দেয়। . প্রি-প্রসেসিং ন্যায্যতার সীমাবদ্ধতা পূরণ করতে সাহায্য করতে পারে।প্রক্সি (সংবেদনশীল বৈশিষ্ট্য)
একটি সংবেদনশীল বৈশিষ্ট্যের জন্য স্ট্যান্ড-ইন হিসাবে ব্যবহৃত একটি বৈশিষ্ট্য। উদাহরণস্বরূপ, একজন ব্যক্তির পোস্টাল কোড তাদের আয়, জাতি বা জাতিগততার জন্য একটি প্রক্সি হিসাবে ব্যবহার করা যেতে পারে।আর
রিপোর্টিং পক্ষপাত
যে ফ্রিকোয়েন্সি দিয়ে লোকেরা ক্রিয়া, ফলাফল বা বৈশিষ্ট্যগুলি সম্পর্কে লেখে তা তাদের বাস্তব-বিশ্বের ফ্রিকোয়েন্সির প্রতিফলন নয় বা কোনও সম্পত্তি এক শ্রেণীর ব্যক্তিদের বৈশিষ্ট্যের ডিগ্রি নয়। রিপোর্টিং পক্ষপাত ডেটার গঠনকে প্রভাবিত করতে পারে যা মেশিন লার্নিং সিস্টেমগুলি থেকে শেখে।
উদাহরণস্বরূপ, বইগুলিতে, হাঁস শব্দটি নিঃশ্বাসের চেয়ে বেশি প্রচলিত। একটি মেশিন লার্নিং মডেল যা একটি বই কর্পাস থেকে হাসি এবং শ্বাস নেওয়ার আপেক্ষিক ফ্রিকোয়েন্সি অনুমান করে সম্ভবত এটি নির্ধারণ করবে যে শ্বাস-প্রশ্বাসের চেয়ে হাসি বেশি সাধারণ।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এস
স্যাম্পলিং পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
নির্বাচনের পক্ষপাতিত্ব
একটি নির্বাচন প্রক্রিয়ার কারণে নমুনাযুক্ত ডেটা থেকে উপসংহারে ত্রুটি যা ডেটাতে পর্যবেক্ষণ করা নমুনার মধ্যে পদ্ধতিগত পার্থক্য তৈরি করে এবং সেগুলি পর্যবেক্ষণ করা হয়নি৷ নির্বাচন পক্ষপাতের নিম্নলিখিত ফর্ম বিদ্যমান:
- কভারেজ পক্ষপাত : ডেটাসেটে প্রতিনিধিত্ব করা জনসংখ্যা মেশিন লার্নিং মডেল যে জনসংখ্যা সম্পর্কে ভবিষ্যদ্বাণী করছে তার সাথে মেলে না।
- স্যাম্পলিং বায়াস : টার্গেট গ্রুপ থেকে এলোমেলোভাবে ডেটা সংগ্রহ করা হয় না।
- অ-প্রতিক্রিয়া পক্ষপাত ( অংশগ্রহণ পক্ষপাতও বলা হয়): নির্দিষ্ট গোষ্ঠীর ব্যবহারকারীরা অন্যান্য গোষ্ঠীর ব্যবহারকারীদের তুলনায় ভিন্ন হারে সমীক্ষা থেকে অপ্ট-আউট করে৷
উদাহরণ স্বরূপ, ধরুন আপনি একটি মেশিন লার্নিং মডেল তৈরি করছেন যা একটি মুভি দেখে মানুষের উপভোগের পূর্বাভাস দেয়। প্রশিক্ষণের তথ্য সংগ্রহ করতে, আপনি সিনেমাটি দেখানো একটি থিয়েটারের সামনের সারিতে থাকা প্রত্যেকের কাছে একটি সমীক্ষা তুলে দেন। অফহ্যান্ড, এটি একটি ডেটাসেট সংগ্রহ করার একটি যুক্তিসঙ্গত উপায় বলে মনে হতে পারে; যাইহোক, তথ্য সংগ্রহের এই ফর্মটি নির্বাচনের পক্ষপাতের নিম্নলিখিত ফর্মগুলি প্রবর্তন করতে পারে:
- কভারেজ পক্ষপাত: মুভি দেখার জন্য বেছে নেওয়া জনসংখ্যার নমুনা দ্বারা, আপনার মডেলের ভবিষ্যদ্বাণীগুলি এমন লোকেদের কাছে সাধারণীকরণ নাও করতে পারে যারা ইতিমধ্যেই মুভিতে সেই স্তরের আগ্রহ প্রকাশ করেনি৷
- স্যাম্পলিং বায়াস: ইচ্ছাকৃত জনসংখ্যা (চলচ্চিত্রের সমস্ত লোক) থেকে এলোমেলোভাবে নমুনা নেওয়ার পরিবর্তে, আপনি কেবলমাত্র সামনের সারির লোকদের নমুনা করেছেন৷ এটা সম্ভব যে সামনের সারিতে বসা লোকেরা অন্যান্য সারির লোকদের তুলনায় সিনেমাটির প্রতি বেশি আগ্রহী ছিল।
- অ-প্রতিক্রিয়া পক্ষপাত: সাধারণভাবে, দৃঢ় মতামতের লোকেরা হালকা মতামতের লোকদের তুলনায় ঐচ্ছিক সমীক্ষায় বেশি সাড়া দেয়। যেহেতু চলচ্চিত্র সমীক্ষা ঐচ্ছিক, প্রতিক্রিয়াগুলি একটি স্বাভাবিক (ঘণ্টা-আকৃতির) বিতরণের চেয়ে একটি বিমোডাল বিতরণ গঠনের সম্ভাবনা বেশি।
সংবেদনশীল বৈশিষ্ট্য
একটি মানবিক বৈশিষ্ট্য যা আইনী, নৈতিক, সামাজিক বা ব্যক্তিগত কারণে বিশেষ বিবেচনা করা যেতে পারে।উ
অসচেতনতা (একটি সংবেদনশীল বৈশিষ্ট্যে)
এমন একটি পরিস্থিতি যেখানে সংবেদনশীল গুণাবলী উপস্থিত আছে, কিন্তু প্রশিক্ষণের ডেটাতে অন্তর্ভুক্ত নয়। যেহেতু সংবেদনশীল বৈশিষ্ট্যগুলি প্রায়শই একজনের ডেটার অন্যান্য বৈশিষ্ট্যগুলির সাথে সম্পর্কযুক্ত হয়, একটি সংবেদনশীল বৈশিষ্ট্য সম্পর্কে অসচেতনতার সাথে প্রশিক্ষিত একটি মডেল এখনও সেই বৈশিষ্ট্যের ক্ষেত্রে আলাদা প্রভাব ফেলতে পারে, বা অন্যান্য ন্যায্যতার সীমাবদ্ধতা লঙ্ঘন করতে পারে৷
,এই পৃষ্ঠায় ফেয়ারনেস শব্দকোষের শর্তাবলী রয়েছে। সকল শব্দকোষের জন্য এখানে ক্লিক করুন ।
ক
বৈশিষ্ট্য
বৈশিষ্ট্য জন্য সমার্থক.
মেশিন লার্নিং ন্যায্যতায়, বৈশিষ্ট্যগুলি প্রায়শই ব্যক্তি সম্পর্কিত বৈশিষ্ট্যগুলিকে বোঝায়।
অটোমেশন পক্ষপাত
যখন একজন মানবিক সিদ্ধান্ত গ্রহণকারী অটোমেশন ছাড়াই তৈরি তথ্যের উপর একটি স্বয়ংক্রিয় সিদ্ধান্ত-প্রণয়ন ব্যবস্থার দ্বারা প্রণীত সুপারিশগুলিকে সমর্থন করে, এমনকি যখন স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণের সিস্টেম ত্রুটি করে।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
খ
পক্ষপাত (নৈতিকতা/ন্যায়)
1. কিছু জিনিস, মানুষ বা গোষ্ঠীর প্রতি স্টিরিওটাইপিং, কুসংস্কার বা পক্ষপাতিত্ব। এই পক্ষপাতগুলি ডেটা সংগ্রহ এবং ব্যাখ্যা, একটি সিস্টেমের নকশা এবং ব্যবহারকারীরা কীভাবে একটি সিস্টেমের সাথে যোগাযোগ করে তা প্রভাবিত করতে পারে। এই ধরনের পক্ষপাতের ফর্মগুলির মধ্যে রয়েছে:
- অটোমেশন পক্ষপাত
- নিশ্চিতকরণ পক্ষপাত
- পরীক্ষকের পক্ষপাত
- গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
- অন্তর্নিহিত পক্ষপাত
- ইন-গ্রুপ পক্ষপাত
- আউট-গ্রুপ একজাতীয়তা পক্ষপাত
2. একটি নমুনা বা রিপোর্টিং পদ্ধতি দ্বারা প্রবর্তিত পদ্ধতিগত ত্রুটি। এই ধরনের পক্ষপাতের ফর্মগুলির মধ্যে রয়েছে:
- কভারেজ পক্ষপাত
- অ-প্রতিক্রিয়া পক্ষপাত
- অংশগ্রহণের পক্ষপাতিত্ব
- রিপোর্টিং পক্ষপাত
- স্যাম্পলিং পক্ষপাত
- নির্বাচনের পক্ষপাতিত্ব
মেশিন লার্নিং মডেল বা ভবিষ্যদ্বাণী পক্ষপাতিত্ব শব্দের সাথে বিভ্রান্ত হবেন না।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
গ
নিশ্চিতকরণ পক্ষপাত
এমনভাবে তথ্য অনুসন্ধান, ব্যাখ্যা, অনুগ্রহ এবং স্মরণ করার প্রবণতা যা একজনের পূর্ব-বিদ্যমান বিশ্বাস বা অনুমানকে নিশ্চিত করে। মেশিন লার্নিং ডেভেলপাররা অসাবধানতাবশত এমনভাবে ডেটা সংগ্রহ বা লেবেল করতে পারে যা তাদের বিদ্যমান বিশ্বাসকে সমর্থন করে এমন ফলাফলকে প্রভাবিত করে। নিশ্চিতকরণ পক্ষপাত হল অন্তর্নিহিত পক্ষপাতের একটি রূপ।
এক্সপেরিমেন্টারের পক্ষপাত হল এক ধরনের নিশ্চিতকরণ পক্ষপাত যেখানে একজন পরীক্ষক পূর্ব-বিদ্যমান হাইপোথিসিস নিশ্চিত না হওয়া পর্যন্ত মডেলের প্রশিক্ষণ চালিয়ে যান।
বিপরীত ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে একটি শ্রেণীবিভাগকারী একজন ব্যক্তির জন্য একই ফলাফল তৈরি করে কি না এটি অন্য ব্যক্তির জন্য একই ফলাফল দেয় যা প্রথমটির সাথে অভিন্ন, এক বা একাধিক সংবেদনশীল বৈশিষ্ট্যের ক্ষেত্রে। কাউন্টারফ্যাকচুয়াল ন্যায্যতার জন্য একটি শ্রেণীবিভাগের মূল্যায়ন একটি মডেলে পক্ষপাতের সম্ভাব্য উত্সগুলিকে সারফেস করার একটি পদ্ধতি।
আরও তথ্যের জন্য নিচের যেকোনো একটি দেখুন:
- ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে কাউন্টারফ্যাকচুয়াল ন্যায্যতা ।
- যখন বিশ্বগুলি সংঘর্ষে: ন্যায্যতায় বিভিন্ন কাউন্টারফ্যাকচুয়াল অনুমানকে একীভূত করা
কভারেজ পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
ডি
জনসংখ্যাগত সমতা
একটি ন্যায্যতা মেট্রিক যা একটি মডেলের শ্রেণীবিভাগের ফলাফল একটি প্রদত্ত সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল না হলে সন্তুষ্ট হয়৷
উদাহরণস্বরূপ, যদি লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়ই গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে, তাহলে জনসংখ্যাগত সমতা অর্জন করা হয় যদি লিলিপুটিয়ানদের ভর্তির শতাংশ ব্রোবডিংনাগিয়ানদের ভর্তির শতাংশের সমান হয়, তা নির্বিশেষে যে একটি গোষ্ঠী অন্যের তুলনায় গড়ে বেশি যোগ্য কিনা।
সমতাপূর্ণ প্রতিকূলতা এবং সুযোগের সমতার সাথে বৈসাদৃশ্য, যা শ্রেণীবিভাগের ফলাফলকে সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করার অনুমতি দেয়, কিন্তু নির্দিষ্ট নির্দিষ্ট গ্রাউন্ড ট্রুথ লেবেলগুলির জন্য সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করার জন্য শ্রেণীবিভাগের ফলাফলকে অনুমতি দেয় না। ডেমোগ্রাফিক সমতা অপ্টিমাইজ করার সময় ট্রেডঅফ অন্বেষণ করার একটি ভিজ্যুয়ালাইজেশনের জন্য "স্মার্ট মেশিন লার্নিং দিয়ে বৈষম্যের আক্রমণ" দেখুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ফেয়ারনেস: ডেমোগ্রাফিক প্যারিটি দেখুন।
ভিন্ন প্রভাব
বিভিন্ন জনসংখ্যার উপগোষ্ঠীকে অসমভাবে প্রভাবিত করে এমন লোকদের সম্পর্কে সিদ্ধান্ত নেওয়া। এটি সাধারণত এমন পরিস্থিতিতে বোঝায় যেখানে একটি অ্যালগরিদমিক সিদ্ধান্ত নেওয়ার প্রক্রিয়া কিছু উপগোষ্ঠীকে অন্যদের তুলনায় বেশি ক্ষতি বা উপকার করে।
উদাহরণস্বরূপ, ধরুন একটি অ্যালগরিদম যা একটি ক্ষুদ্র-গৃহঋণের জন্য একটি লিলিপুটিয়ানের যোগ্যতা নির্ধারণ করে তাদের মেইলিং ঠিকানায় একটি নির্দিষ্ট পোস্টাল কোড থাকলে তাদের "অযোগ্য" হিসাবে শ্রেণীবদ্ধ করার সম্ভাবনা বেশি। লিটল-এন্ডিয়ান লিলিপুটিয়ানদের তুলনায় যদি বিগ-এন্ডিয়ান লিলিপুটিয়ানদের এই পোস্টাল কোড সহ মেইলিং ঠিকানার সম্ভাবনা বেশি থাকে, তাহলে এই অ্যালগরিদমটি ভিন্ন প্রভাব ফেলতে পারে।
বৈষম্যপূর্ণ চিকিত্সার সাথে বৈপরীত্য, যা বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে যার ফলস্বরূপ যখন উপগোষ্ঠীর বৈশিষ্ট্যগুলি একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণের প্রক্রিয়ার সুস্পষ্ট ইনপুট হয়।
পৃথক চিকিত্সা
একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণের প্রক্রিয়ার মধ্যে বিষয়গুলির সংবেদনশীল বৈশিষ্ট্যগুলিকে ফ্যাক্টরিং করা যাতে মানুষের বিভিন্ন উপগোষ্ঠীকে আলাদাভাবে বিবেচনা করা হয়।
উদাহরণস্বরূপ, একটি অ্যালগরিদম বিবেচনা করুন যা লিলিপুটিয়ানদের তাদের ঋণের আবেদনে দেওয়া তথ্যের ভিত্তিতে একটি ক্ষুদ্র-গৃহঋণের জন্য যোগ্যতা নির্ধারণ করে। যদি অ্যালগরিদম একটি ইনপুট হিসাবে বিগ-এন্ডিয়ান বা লিটল-এন্ডিয়ান হিসাবে একটি লিলিপুটিয়ানের অধিভুক্তি ব্যবহার করে, তবে এটি সেই মাত্রার সাথে বৈষম্যমূলক চিকিত্সা কার্যকর করছে।
বৈষম্যমূলক প্রভাবের সাথে বৈসাদৃশ্য, যা উপগোষ্ঠীর উপর অ্যালগরিদমিক সিদ্ধান্তের সামাজিক প্রভাবগুলিতে বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে, সেই উপগোষ্ঠীগুলি মডেলের ইনপুট কিনা তা নির্বিশেষে।
ই
সুযোগের সমতা
একটি মডেল একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানগুলির জন্য সমানভাবে পছন্দসই ফলাফলের পূর্বাভাস দিচ্ছে কিনা তা মূল্যায়ন করার জন্য একটি ন্যায্যতা মেট্রিক ৷ অন্য কথায়, যদি একটি মডেলের জন্য আকাঙ্খিত ফলাফল ইতিবাচক শ্রেণী হয়, তাহলে লক্ষ্য হবে প্রকৃত ইতিবাচক হার সব দলের জন্য একই।
সুযোগের সমতা সমান মতভেদের সাথে সম্পর্কিত, যার জন্য সত্য ইতিবাচক হার এবং মিথ্যা ধনাত্মক হার উভয়ই সকল দলের জন্য একই হওয়া প্রয়োজন।
ধরুন Glubbdubdrib ইউনিভার্সিটি লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করেছে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থীই বিশ্ববিদ্যালয়ের প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিতের ক্লাস অফার করে না এবং ফলস্বরূপ, তাদের অনেক কম শিক্ষার্থীই যোগ্য। সুযোগের সমতা জাতীয়তা (লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান) এর ক্ষেত্রে "ভর্তি" এর পছন্দের লেবেলের জন্য সন্তুষ্ট হয় যদি যোগ্য শিক্ষার্থীরা লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান নির্বিশেষে ভর্তি হওয়ার সমান সম্ভাবনা থাকে।
উদাহরণস্বরূপ, ধরুন 100 জন লিলিপুটিয়ান এবং 100 জন ব্রোবডিংনাগিয়ান Glubbdubdrib বিশ্ববিদ্যালয়ে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণী 1. লিলিপুটিয়ান আবেদনকারীরা (90% যোগ্য)
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 45 | 3 |
প্রত্যাখ্যাত | 45 | 7 |
মোট | 90 | 10 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 45/90 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 7/10 = 70% ভর্তিকৃত লিলিপুটিয়ান ছাত্রদের মোট শতাংশ: (45+3)/100 = 48% |
সারণী 2. ব্রোবডিংনাগিয়ান আবেদনকারীরা (10% যোগ্য):
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 5 | 9 |
প্রত্যাখ্যাত | 5 | 81 |
মোট | 10 | 90 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 5/10 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 81/90 = 90% ভর্তিকৃত ব্রোবডিংনাগিয়ান ছাত্রদের মোট শতাংশ: (5+9)/100 = 14% |
পূর্বের উদাহরণগুলি যোগ্য ছাত্রদের গ্রহণের সুযোগের সমতাকে সন্তুষ্ট করে কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার 50% সম্ভাবনা রয়েছে।
সুযোগের সমতা সন্তুষ্ট হলেও, নিম্নলিখিত দুটি ন্যায্যতা মেট্রিক সন্তুষ্ট নয়:
- জনসংখ্যাগত সমতা : লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানরা বিভিন্ন হারে বিশ্ববিদ্যালয়ে ভর্তি হয়; 48% লিলিপুটিয়ান ছাত্র ভর্তি করা হয়, কিন্তু ব্রবডিংনাগিয়ান ছাত্রদের মাত্র 14% ভর্তি হয়।
- সমান মতভেদ : যদিও যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার একই সুযোগ রয়েছে, অতিরিক্ত সীমাবদ্ধতা যে অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই প্রত্যাখ্যাত হওয়ার একই সুযোগ রয়েছে তা সন্তুষ্ট নয়। অযোগ্য লিলিপুটিয়ানদের প্রত্যাখ্যানের হার 70%, যেখানে অযোগ্য ব্রবডিংনাগিয়ানদের প্রত্যাখ্যানের হার 90%।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: সুযোগের সমতা দেখুন।
সমান মতভেদ
একটি মডেল ইতিবাচক শ্রেণী এবং নেতিবাচক উভয় শ্রেণীর ক্ষেত্রেই একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানের জন্য সমানভাবে ফলাফলের পূর্বাভাস দিচ্ছে কিনা তা মূল্যায়ন করার জন্য একটি ন্যায্যতা মেট্রিক - শুধুমাত্র একটি শ্রেণী বা অন্য একচেটিয়াভাবে নয়। অন্য কথায়, সত্যিকারের ইতিবাচক হার এবং মিথ্যা নেতিবাচক হার উভয়ই সকল দলের জন্য একই হওয়া উচিত।
সমান মতভেদ সুযোগের সমতার সাথে সম্পর্কিত, যা শুধুমাত্র একটি একক শ্রেণীর (ইতিবাচক বা নেতিবাচক) ত্রুটির হারের উপর ফোকাস করে।
উদাহরণস্বরূপ, ধরুন Glubbdubdrib বিশ্ববিদ্যালয় লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করেছে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থীই বিশ্ববিদ্যালয়ের প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিতের ক্লাস অফার করে না এবং ফলস্বরূপ, তাদের অনেক কম শিক্ষার্থীই যোগ্য। সমতাপূর্ণ প্রতিকূলতাগুলি সন্তুষ্ট থাকে তবে শর্ত থাকে যে একজন আবেদনকারী লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান যাই হোক না কেন, যদি তারা যোগ্য হন, তবে তাদের প্রোগ্রামে ভর্তি হওয়ার সমান সম্ভাবনা, এবং যদি তারা যোগ্য না হয় তবে তাদের প্রত্যাখ্যাত হওয়ার সম্ভাবনা সমান। .
ধরুন 100 জন লিলিপুটিয়ান এবং 100 জন ব্রোবডিংনাগিয়ান Glubbdubdrib ইউনিভার্সিটিতে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণি 3. লিলিপুটিয়ান আবেদনকারীরা (90% যোগ্য)
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 45 | 2 |
প্রত্যাখ্যাত | 45 | 8 |
মোট | 90 | 10 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 45/90 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 8/10 = 80% ভর্তিকৃত লিলিপুটিয়ান ছাত্রদের মোট শতাংশ: (45+2)/100 = 47% |
সারণী 4. ব্রোবডিংনাগিয়ান আবেদনকারীরা (10% যোগ্য):
যোগ্য | অযোগ্য | |
---|---|---|
ভর্তি হয়েছে | 5 | 18 |
প্রত্যাখ্যাত | 5 | 72 |
মোট | 10 | 90 |
ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: 5/10 = 50% প্রত্যাখ্যাত অযোগ্য ছাত্রদের শতাংশ: 72/90 = 80% ভর্তিকৃত ব্রোবডিংনাগিয়ান ছাত্রদের মোট শতাংশ: (5+18)/100 = 23% |
সমান মতপার্থক্য সন্তুষ্ট কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার সম্ভাবনা 50%, এবং অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের প্রত্যাখ্যাত হওয়ার 80% সম্ভাবনা রয়েছে।
"তত্ত্বাবধানে শিক্ষার সুযোগের সমতা" -এ সমতুল্য মতভেদকে আনুষ্ঠানিকভাবে সংজ্ঞায়িত করা হয়েছে: "ভবিষ্যদ্বাণীকারী Ŷ সুরক্ষিত অ্যাট্রিবিউট A এবং ফলাফল Y যদি Ŷ এবং A স্বাধীন হয়, Y এর উপর শর্তসাপেক্ষে সমান মতভেদকে সন্তুষ্ট করে।"
পরীক্ষকের পক্ষপাত
নিশ্চিতকরণ পক্ষপাত দেখুন।
চ
ন্যায্যতার সীমাবদ্ধতা
ন্যায্যতার এক বা একাধিক সংজ্ঞা সন্তুষ্ট তা নিশ্চিত করতে একটি অ্যালগরিদমে একটি সীমাবদ্ধতা প্রয়োগ করা। ন্যায্যতার সীমাবদ্ধতার উদাহরণগুলির মধ্যে রয়েছে:- পোস্ট-প্রসেসিং আপনার মডেলের আউটপুট.
- ন্যায্যতা মেট্রিক লঙ্ঘনের জন্য একটি জরিমানা অন্তর্ভুক্ত করার জন্য ক্ষতি ফাংশন পরিবর্তন করা।
- একটি অপ্টিমাইজেশান সমস্যায় সরাসরি একটি গাণিতিক সীমাবদ্ধতা যোগ করা।
ন্যায্যতা মেট্রিক
"ন্যায্যতা" এর একটি গাণিতিক সংজ্ঞা যা পরিমাপযোগ্য। কিছু সাধারণভাবে ব্যবহৃত ন্যায্যতা মেট্রিক্স অন্তর্ভুক্ত:
অনেক ন্যায্যতা মেট্রিক পারস্পরিক একচেটিয়া; ন্যায্যতা মেট্রিক্সের অসঙ্গতি দেখুন।
জি
গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
অনুমান করা যায় যে একজন ব্যক্তির জন্য যা সত্য তা সেই দলের প্রত্যেকের জন্যও সত্য। যদি ডেটা সংগ্রহের জন্য একটি সুবিধার নমুনা ব্যবহার করা হয় তবে গ্রুপ অ্যাট্রিবিউশন পক্ষপাতের প্রভাবগুলি আরও বাড়িয়ে তুলতে পারে। একটি অ-প্রতিনিধিত্বমূলক নমুনায়, এমন বৈশিষ্ট্যগুলি তৈরি করা যেতে পারে যা বাস্তবতাকে প্রতিফলিত করে না।
এছাড়াও আউট-গ্রুপ সমজাতীয়তা পক্ষপাত এবং ইন-গ্রুপ পক্ষপাত দেখুন। এছাড়াও, আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এইচ
ঐতিহাসিক পক্ষপাত
এক ধরণের পক্ষপাত যা ইতিমধ্যেই বিশ্বে বিদ্যমান এবং একটি ডেটাসেটে তার পথ তৈরি করেছে৷ এই পক্ষপাতিত্বগুলির মধ্যে বিদ্যমান সাংস্কৃতিক স্টেরিওটাইপ, জনসংখ্যাগত অসমতা এবং নির্দিষ্ট কিছু সামাজিক গোষ্ঠীর বিরুদ্ধে কুসংস্কার প্রতিফলিত করার প্রবণতা রয়েছে।
উদাহরণস্বরূপ, একটি শ্রেণিবিন্যাস মডেল বিবেচনা করুন যা ভবিষ্যদ্বাণী করে যে একটি ঋণ আবেদনকারী তাদের ঋণে ডিফল্ট করবে কি না, যা দুটি ভিন্ন সম্প্রদায়ের স্থানীয় ব্যাঙ্ক থেকে 1980 এর দশক থেকে ঐতিহাসিক ঋণ-ডিফল্ট ডেটার উপর প্রশিক্ষিত ছিল। যদি কমিউনিটি A-এর অতীতের আবেদনকারীরা কমিউনিটি B-এর আবেদনকারীদের তুলনায় তাদের ঋণে খেলাপি হওয়ার সম্ভাবনা ছয়গুণ বেশি থাকে, তাহলে মডেলটি একটি ঐতিহাসিক পক্ষপাত শিখতে পারে যার ফলে মডেলটি কমিউনিটি A-তে ঋণ অনুমোদন করার সম্ভাবনা কম থাকে, এমনকি ঐতিহাসিক অবস্থার কারণেও সেই সম্প্রদায়ের উচ্চ ডিফল্ট হার আর প্রাসঙ্গিক ছিল না।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
আমি
অন্তর্নিহিত পক্ষপাত
নিজের মনের মডেল এবং স্মৃতির উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে একটি সমিতি বা অনুমান তৈরি করা। অন্তর্নিহিত পক্ষপাত নিম্নলিখিতগুলিকে প্রভাবিত করতে পারে:
- কিভাবে তথ্য সংগ্রহ এবং শ্রেণীবদ্ধ করা হয়।
- কিভাবে মেশিন লার্নিং সিস্টেম ডিজাইন এবং ডেভেলপ করা হয়।
উদাহরণস্বরূপ, বিবাহের ফটোগুলি সনাক্ত করার জন্য একটি শ্রেণীবিভাগ তৈরি করার সময়, একজন প্রকৌশলী একটি বৈশিষ্ট্য হিসাবে একটি ফটোতে একটি সাদা পোশাকের উপস্থিতি ব্যবহার করতে পারেন। যাইহোক, সাদা পোশাক শুধুমাত্র নির্দিষ্ট যুগে এবং নির্দিষ্ট সংস্কৃতিতে প্রথাগত ছিল।
নিশ্চিতকরণ পক্ষপাতও দেখুন।
ন্যায্যতা মেট্রিক্সের অসঙ্গতি
এই ধারণা যে ন্যায্যতার কিছু ধারণা পারস্পরিকভাবে বেমানান এবং একই সাথে সন্তুষ্ট হতে পারে না। ফলস্বরূপ, ন্যায্যতা পরিমাপ করার জন্য কোনো একক সার্বজনীন মেট্রিক নেই যা সমস্ত ML সমস্যার ক্ষেত্রে প্রয়োগ করা যেতে পারে।
যদিও এটি নিরুৎসাহিত বলে মনে হতে পারে, ন্যায্যতা মেট্রিক্সের অসঙ্গতি বোঝায় না যে ন্যায্যতার প্রচেষ্টা নিষ্ফল। পরিবর্তে, এটি পরামর্শ দেয় যে ন্যায্যতা অবশ্যই একটি প্রদত্ত এমএল সমস্যার জন্য প্রাসঙ্গিকভাবে সংজ্ঞায়িত করা উচিত, এর ব্যবহারের ক্ষেত্রে নির্দিষ্ট ক্ষতি রোধ করার লক্ষ্যে।
ন্যায্যতা মেট্রিক্সের অসঙ্গতি সম্পর্কে আরও বিশদ আলোচনার জন্য "ন্যায্যতার (im) সম্ভাবনার উপর" দেখুন।
স্বতন্ত্র ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে একই ব্যক্তিদের একইভাবে শ্রেণীবদ্ধ করা হয়েছে কিনা। উদাহরণস্বরূপ, Brobdingnagian Academy অভিন্ন গ্রেড এবং প্রমিত পরীক্ষার স্কোর সহ দুইজন শিক্ষার্থী ভর্তি হওয়ার সম্ভাবনা সমানভাবে নিশ্চিত করার মাধ্যমে স্বতন্ত্র ন্যায্যতাকে সন্তুষ্ট করতে চাইতে পারে।
মনে রাখবেন যে স্বতন্ত্র ন্যায্যতা আপনি কীভাবে "সাদৃশ্য" (এই ক্ষেত্রে, গ্রেড এবং পরীক্ষার স্কোর) সংজ্ঞায়িত করেন তার উপর সম্পূর্ণরূপে নির্ভর করে এবং যদি আপনার মিল মেট্রিক গুরুত্বপূর্ণ তথ্য (যেমন একজন শিক্ষার্থীর কঠোরতা) মিস করে তাহলে আপনি নতুন ন্যায্যতা সমস্যা প্রবর্তনের ঝুঁকি চালাতে পারেন পাঠ্যক্রম)।
স্বতন্ত্র ন্যায্যতার আরও বিশদ আলোচনার জন্য "সচেতনতার মাধ্যমে ন্যায্যতা" দেখুন।
ইন-গ্রুপ পক্ষপাত
নিজের গোষ্ঠী বা নিজস্ব বৈশিষ্ট্যের প্রতি পক্ষপাতিত্ব দেখানো। যদি পরীক্ষক বা রেটারদের মধ্যে মেশিন লার্নিং ডেভেলপারের বন্ধু, পরিবার বা সহকর্মী থাকে, তাহলে ইন-গ্রুপ পক্ষপাত পণ্য পরীক্ষা বা ডেটাসেটকে বাতিল করতে পারে।
ইন-গ্রুপ বায়াস হল গ্রুপ অ্যাট্রিবিউশন বায়াসের একটি রূপ। এছাড়াও আউট-গ্রুপ একজাতীয়তা পক্ষপাত দেখুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এন
অ-প্রতিক্রিয়া পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
ও
আউট-গ্রুপ একজাতীয়তা পক্ষপাত
মনোভাব, মূল্যবোধ, ব্যক্তিত্বের বৈশিষ্ট্য এবং অন্যান্য বৈশিষ্ট্যের তুলনা করার সময় গ্রুপের বাইরের সদস্যদের মধ্যে-গোষ্ঠীর সদস্যদের চেয়ে বেশি একইভাবে দেখার প্রবণতা। ইন-গ্রুপ বলতে আপনি যাদের সাথে নিয়মিত যোগাযোগ করেন তাদের বোঝায়; আউট-গ্রুপ বলতে এমন লোকদের বোঝায় যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন না। আপনি যদি লোকেদেরকে আউট-গ্রুপ সম্পর্কে অ্যাট্রিবিউট দিতে বলে একটি ডেটাসেট তৈরি করেন, তাহলে সেই অ্যাট্রিবিউটগুলি কম সংক্ষিপ্ত এবং আরও স্টেরিওটাইপড হতে পারে যেগুলি অংশগ্রহণকারীরা তাদের গ্রুপের লোকেদের জন্য তালিকাভুক্ত করে।
উদাহরণস্বরূপ, স্থাপত্য শৈলী, জানালা, দরজা এবং আকারের ছোট পার্থক্য উল্লেখ করে লিলিপুটিয়ানরা অন্যান্য লিলিপুটিয়ানদের বাড়িগুলিকে বিশদভাবে বর্ণনা করতে পারে। যাইহোক, একই লিলিপুটিয়ানরা সহজভাবে ঘোষণা করতে পারে যে ব্রবডিংনাগিয়ানরা সবাই অভিন্ন বাড়িতে বাস করে।
আউট-গ্রুপ সমজাতীয়তা পক্ষপাত হল গ্রুপ অ্যাট্রিবিউশন পক্ষপাতের একটি রূপ।
এছাড়াও ইন-গ্রুপ পক্ষপাত দেখুন।
পৃ
অংশগ্রহণের পক্ষপাতিত্ব
অ-প্রতিক্রিয়া পক্ষপাত জন্য সমার্থক. নির্বাচনের পক্ষপাত দেখুন।
পোস্ট-প্রসেসিং
মডেল চালানোর পরে একটি মডেলের আউটপুট সামঞ্জস্য করা। পোস্ট-প্রসেসিং মডেলগুলি নিজেরাই পরিবর্তন না করে ন্যায্যতার সীমাবদ্ধতা প্রয়োগ করতে ব্যবহার করা যেতে পারে।
উদাহরণ স্বরূপ, কেউ একটি শ্রেণীবিন্যাস থ্রেশহোল্ড সেট করে বাইনারি ক্লাসিফায়ারে পোস্ট-প্রসেসিং প্রয়োগ করতে পারে যাতে কিছু অ্যাট্রিবিউটের জন্য সুযোগের সমতা বজায় রাখা হয় যেটি সেই অ্যাট্রিবিউটের সমস্ত মানের জন্য সত্য ইতিবাচক হার একই।
ভবিষ্যদ্বাণীমূলক সমতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে প্রদত্ত শ্রেণিবিন্যাসকারীর জন্য, নির্ভুলতা হারগুলি বিবেচনাধীন সাবগ্রুপগুলির জন্য সমতুল্য কিনা।
উদাহরণস্বরূপ, একটি মডেল যা কলেজের গ্রহণযোগ্যতার ভবিষ্যদ্বাণী করে তা জাতীয়তার জন্য ভবিষ্যদ্বাণীমূলক সমতাকে সন্তুষ্ট করবে যদি লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের জন্য এর নির্ভুলতার হার একই হয়।
ভবিষ্যদ্বাণীমূলক সমতাকে কখনও কখনও ভবিষ্যদ্বাণীমূলক হার সমতাও বলা হয়।
ভবিষ্যদ্বাণীমূলক সমতার আরও বিশদ আলোচনার জন্য "ন্যায্যতার সংজ্ঞা ব্যাখ্যা করা হয়েছে" (বিভাগ 3.2.1) দেখুন।
ভবিষ্যদ্বাণীমূলক হার সমতা
ভবিষ্যদ্বাণীমূলক সমতার আরেকটি নাম।
প্রিপ্রসেসিং
একটি মডেলকে প্রশিক্ষণের জন্য ব্যবহার করার আগে ডেটা প্রক্রিয়াকরণ। প্রি-প্রসেসিং ইংরেজি টেক্সট কর্পাস থেকে শব্দগুলি সরানোর মতো সহজ হতে পারে যা ইংরেজি অভিধানে ঘটে না, বা ডেটা পয়েন্টগুলিকে এমনভাবে পুনরায় প্রকাশ করার মতো জটিল হতে পারে যা যতটা সম্ভব সংবেদনশীল বৈশিষ্ট্যগুলির সাথে সম্পর্কযুক্ত অনেকগুলি বৈশিষ্ট্যকে সরিয়ে দেয়। . প্রি-প্রসেসিং ন্যায্যতার সীমাবদ্ধতা পূরণ করতে সাহায্য করতে পারে।প্রক্সি (সংবেদনশীল বৈশিষ্ট্য)
একটি সংবেদনশীল বৈশিষ্ট্যের জন্য স্ট্যান্ড-ইন হিসাবে ব্যবহৃত একটি বৈশিষ্ট্য। উদাহরণস্বরূপ, একজন ব্যক্তির পোস্টাল কোড তাদের আয়, জাতি বা জাতিগততার জন্য একটি প্রক্সি হিসাবে ব্যবহার করা যেতে পারে।আর
রিপোর্টিং পক্ষপাত
যে ফ্রিকোয়েন্সি দিয়ে লোকেরা ক্রিয়া, ফলাফল বা বৈশিষ্ট্যগুলি সম্পর্কে লেখে তা তাদের বাস্তব-বিশ্বের ফ্রিকোয়েন্সির প্রতিফলন নয় বা কোনও সম্পত্তি এক শ্রেণীর ব্যক্তিদের বৈশিষ্ট্যের ডিগ্রি নয়। রিপোর্টিং পক্ষপাত ডেটার গঠনকে প্রভাবিত করতে পারে যা মেশিন লার্নিং সিস্টেমগুলি থেকে শেখে।
উদাহরণস্বরূপ, বইগুলিতে, হাঁস শব্দটি নিঃশ্বাসের চেয়ে বেশি প্রচলিত। একটি মেশিন লার্নিং মডেল যা একটি বই কর্পাস থেকে হাসি এবং শ্বাস নেওয়ার আপেক্ষিক ফ্রিকোয়েন্সি অনুমান করে সম্ভবত এটি নির্ধারণ করবে যে শ্বাস-প্রশ্বাসের চেয়ে হাসি বেশি সাধারণ।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ন্যায্যতা: পক্ষপাতের প্রকারগুলি দেখুন।
এস
স্যাম্পলিং পক্ষপাত
নির্বাচনের পক্ষপাত দেখুন।
নির্বাচনের পক্ষপাতিত্ব
একটি নির্বাচন প্রক্রিয়ার কারণে নমুনাযুক্ত ডেটা থেকে উপসংহারে ত্রুটি যা ডেটাতে পর্যবেক্ষণ করা নমুনার মধ্যে পদ্ধতিগত পার্থক্য তৈরি করে এবং সেগুলি পর্যবেক্ষণ করা হয়নি৷ নির্বাচন পক্ষপাতের নিম্নলিখিত ফর্ম বিদ্যমান:
- কভারেজ পক্ষপাত : ডেটাসেটে প্রতিনিধিত্ব করা জনসংখ্যা মেশিন লার্নিং মডেল যে জনসংখ্যা সম্পর্কে ভবিষ্যদ্বাণী করছে তার সাথে মেলে না।
- স্যাম্পলিং বায়াস : টার্গেট গ্রুপ থেকে এলোমেলোভাবে ডেটা সংগ্রহ করা হয় না।
- অ-প্রতিক্রিয়া পক্ষপাত ( অংশগ্রহণ পক্ষপাতও বলা হয়): নির্দিষ্ট গোষ্ঠীর ব্যবহারকারীরা অন্যান্য গোষ্ঠীর ব্যবহারকারীদের তুলনায় ভিন্ন হারে সমীক্ষা থেকে অপ্ট-আউট করে৷
উদাহরণ স্বরূপ, ধরুন আপনি একটি মেশিন লার্নিং মডেল তৈরি করছেন যা একটি মুভি দেখে মানুষের উপভোগের পূর্বাভাস দেয়। প্রশিক্ষণের তথ্য সংগ্রহ করতে, আপনি সিনেমাটি দেখানো একটি থিয়েটারের সামনের সারিতে থাকা প্রত্যেকের কাছে একটি সমীক্ষা তুলে দেন। অফহ্যান্ড, এটি একটি ডেটাসেট সংগ্রহ করার একটি যুক্তিসঙ্গত উপায় বলে মনে হতে পারে; যাইহোক, তথ্য সংগ্রহের এই ফর্মটি নির্বাচনের পক্ষপাতের নিম্নলিখিত ফর্মগুলি প্রবর্তন করতে পারে:
- কভারেজ পক্ষপাত: মুভি দেখার জন্য বেছে নেওয়া জনসংখ্যার নমুনা দ্বারা, আপনার মডেলের ভবিষ্যদ্বাণীগুলি এমন লোকেদের কাছে সাধারণীকরণ নাও করতে পারে যারা ইতিমধ্যেই মুভিতে সেই স্তরের আগ্রহ প্রকাশ করেনি৷
- স্যাম্পলিং বায়াস: ইচ্ছাকৃত জনসংখ্যা (চলচ্চিত্রের সমস্ত লোক) থেকে এলোমেলোভাবে নমুনা নেওয়ার পরিবর্তে, আপনি কেবলমাত্র সামনের সারির লোকদের নমুনা করেছেন৷ এটা সম্ভব যে সামনের সারিতে বসা লোকেরা অন্যান্য সারির লোকদের তুলনায় সিনেমাটির প্রতি বেশি আগ্রহী ছিল।
- অ-প্রতিক্রিয়া পক্ষপাত: সাধারণভাবে, দৃঢ় মতামতের লোকেরা হালকা মতামতের লোকদের তুলনায় ঐচ্ছিক সমীক্ষায় বেশি সাড়া দেয়। যেহেতু চলচ্চিত্র সমীক্ষা ঐচ্ছিক, প্রতিক্রিয়াগুলি একটি স্বাভাবিক (ঘণ্টা-আকৃতির) বিতরণের চেয়ে একটি বিমোডাল বিতরণ গঠনের সম্ভাবনা বেশি।
সংবেদনশীল বৈশিষ্ট্য
একটি মানবিক বৈশিষ্ট্য যা আইনী, নৈতিক, সামাজিক বা ব্যক্তিগত কারণে বিশেষ বিবেচনা করা যেতে পারে।উ
অসচেতনতা (একটি সংবেদনশীল বৈশিষ্ট্যে)
এমন একটি পরিস্থিতি যেখানে সংবেদনশীল গুণাবলী উপস্থিত আছে, কিন্তু প্রশিক্ষণের ডেটাতে অন্তর্ভুক্ত নয়। যেহেতু সংবেদনশীল বৈশিষ্ট্যগুলি প্রায়শই একজনের ডেটার অন্যান্য বৈশিষ্ট্যগুলির সাথে সম্পর্কযুক্ত হয়, একটি সংবেদনশীল বৈশিষ্ট্য সম্পর্কে অসচেতনতার সাথে প্রশিক্ষিত একটি মডেল এখনও সেই বৈশিষ্ট্যের ক্ষেত্রে আলাদা প্রভাব ফেলতে পারে, বা অন্যান্য ন্যায্যতার সীমাবদ্ধতা লঙ্ঘন করতে পারে৷