এই পৃষ্ঠায় দায়িত্বশীল AI শব্দকোষের শব্দাবলী রয়েছে। সমস্ত শব্দকোষের শব্দাবলীর জন্য, এখানে ক্লিক করুন ।
ক
বৈশিষ্ট্য
বৈশিষ্ট্যের সমার্থক শব্দ।
মেশিন লার্নিং ফেয়ারনেসে, অ্যাট্রিবিউটগুলি প্রায়শই ব্যক্তিদের সাথে সম্পর্কিত বৈশিষ্ট্যগুলিকে বোঝায়।
অটোমেশন পক্ষপাত
যখন একজন মানব সিদ্ধান্ত গ্রহণকারী স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণ ব্যবস্থার সুপারিশগুলিকে অটোমেশন ছাড়া প্রদত্ত তথ্যের চেয়ে বেশি পছন্দ করেন, এমনকি যখন স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণ ব্যবস্থা ত্রুটি করে।
আরও তথ্যের জন্য "ফেয়ারনেস: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের ধরণ" দেখুন।
খ
পক্ষপাত (নীতিশাস্ত্র/ন্যায্যতা)
১. কিছু জিনিস, মানুষ বা গোষ্ঠীর প্রতি অন্যদের তুলনায় স্টেরিওটাইপিং, পক্ষপাত বা পক্ষপাতিত্ব। এই পক্ষপাতিত্বগুলি তথ্য সংগ্রহ এবং ব্যাখ্যা, একটি সিস্টেমের নকশা এবং ব্যবহারকারীরা কীভাবে একটি সিস্টেমের সাথে যোগাযোগ করে তা প্রভাবিত করতে পারে। এই ধরণের পক্ষপাতিত্বের ধরণগুলির মধ্যে রয়েছে:
- অটোমেশন পক্ষপাত
- নিশ্চিতকরণ পক্ষপাত
- পরীক্ষকের পক্ষপাত
- গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
- অন্তর্নিহিত পক্ষপাত
- গ্রুপ-ইন পক্ষপাত
- গোষ্ঠীর বাইরের একজাতীয়তা পক্ষপাত
২. নমুনা বা রিপোর্টিং পদ্ধতির মাধ্যমে প্রবর্তিত পদ্ধতিগত ত্রুটি। এই ধরণের পক্ষপাতের ফর্মগুলির মধ্যে রয়েছে:
- কভারেজ পক্ষপাত
- প্রতিক্রিয়াহীন পক্ষপাত
- অংশগ্রহণ পক্ষপাত
- রিপোর্টিং পক্ষপাত
- নমুনা পক্ষপাত
- নির্বাচন পক্ষপাত
মেশিন লার্নিং মডেল বা ভবিষ্যদ্বাণী পক্ষপাতের ক্ষেত্রে পক্ষপাত শব্দটির সাথে বিভ্রান্ত হবেন না।
আরও তথ্যের জন্য "ফেয়ারনেস: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের ধরণ" দেখুন।
গ
নিশ্চিতকরণ পক্ষপাত
তথ্য অনুসন্ধান, ব্যাখ্যা, সমর্থন এবং প্রত্যাহারের প্রবণতা এমনভাবে যা কারও পূর্ব-বিদ্যমান বিশ্বাস বা অনুমানকে নিশ্চিত করে। মেশিন লার্নিং ডেভেলপাররা অসাবধানতাবশত এমনভাবে ডেটা সংগ্রহ বা লেবেল করতে পারে যা তাদের বিদ্যমান বিশ্বাসকে সমর্থন করে এমন ফলাফলকে প্রভাবিত করে। নিশ্চিতকরণ পক্ষপাত হল অন্তর্নিহিত পক্ষপাতের একটি রূপ।
পরীক্ষকের পক্ষপাত হল নিশ্চিতকরণ পক্ষপাতের একটি রূপ যেখানে একজন পরীক্ষক পূর্ব-বিদ্যমান অনুমান নিশ্চিত না হওয়া পর্যন্ত মডেলগুলিকে প্রশিক্ষণ দিতে থাকেন।
প্রতি-তথ্যমূলক ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে একটি শ্রেণীবদ্ধকরণ মডেল একজন ব্যক্তির জন্য একই ফলাফল দেয় কিনা যা অন্য ব্যক্তির জন্য প্রথমটির সাথে অভিন্ন, এক বা একাধিক সংবেদনশীল বৈশিষ্ট্য ব্যতীত। প্রতি-তত্ত্বীয় ন্যায্যতার জন্য একটি শ্রেণীবদ্ধকরণ মডেল মূল্যায়ন করা একটি মডেলে পক্ষপাতের সম্ভাব্য উৎসগুলি প্রকাশ করার একটি পদ্ধতি।
আরও তথ্যের জন্য নিম্নলিখিত যেকোনো একটি দেখুন:
- ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে কাউন্টারফ্যাক্টুয়াল ন্যায্যতা ।
- যখন পৃথিবী সংঘর্ষে লিপ্ত হয়: ন্যায্যতার মধ্যে বিভিন্ন প্রতি-তথ্যমূলক অনুমানকে একীভূত করা
কভারেজ পক্ষপাত
নির্বাচন পক্ষপাত দেখুন।
দ
জনসংখ্যার সমতা
একটি ন্যায্যতা মেট্রিক যা একটি মডেলের শ্রেণীবিভাগের ফলাফল যদি একটি প্রদত্ত সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল না হয় তবে সন্তুষ্ট হয়।
উদাহরণস্বরূপ, যদি লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়ই গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে, তাহলে জনসংখ্যার সমতা অর্জিত হবে যদি লিলিপুটিয়ানদের ভর্তির শতাংশ এবং ব্রোবডিংনাগিয়ানদের ভর্তির শতাংশ একই হয়, তা নির্বিশেষে, একটি গ্রুপ অন্যটির তুলনায় গড়ে বেশি যোগ্য কিনা।
সমতুল্য প্রতিকূলতা এবং সুযোগের সমতার সাথে তুলনা করুন, যা সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করে সমষ্টিগত শ্রেণীবিভাগের ফলাফলকে অনুমতি দেয়, কিন্তু নির্দিষ্ট নির্দিষ্ট গ্রাউন্ড ট্রুথ লেবেলের জন্য সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভর করে শ্রেণীবিভাগের ফলাফলকে অনুমতি দেয় না। জনসংখ্যাতাত্ত্বিক সমতার জন্য অপ্টিমাইজ করার সময় ট্রেডঅফগুলি অন্বেষণ করার জন্য একটি ভিজ্যুয়ালাইজেশনের জন্য "স্মার্ট মেশিন লার্নিং দিয়ে বৈষম্য আক্রমণ" দেখুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ফেয়ারনেস: ডেমোগ্রাফিক প্যারিটি দেখুন।
ভিন্ন প্রভাব
বিভিন্ন জনসংখ্যার উপগোষ্ঠীকে অসামঞ্জস্যপূর্ণভাবে প্রভাবিত করে এমন ব্যক্তিদের সম্পর্কে সিদ্ধান্ত নেওয়া। এটি সাধারণত এমন পরিস্থিতিগুলিকে বোঝায় যেখানে একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়া কিছু উপগোষ্ঠীকে অন্যদের তুলনায় বেশি ক্ষতি করে বা উপকৃত করে।
উদাহরণস্বরূপ, ধরুন একটি অ্যালগরিদম যা একজন লিলিপুটিয়ানের ক্ষুদ্রাকৃতির গৃহ ঋণের যোগ্যতা নির্ধারণ করে, যদি তাদের মেইলিং ঠিকানায় একটি নির্দিষ্ট পোস্টাল কোড থাকে, তাহলে তাদের "অযোগ্য" হিসেবে শ্রেণীবদ্ধ করার সম্ভাবনা বেশি। যদি লিটল-এন্ডিয়ান লিলিপুটিয়ানদের তুলনায় বিগ-এন্ডিয়ান লিলিপুটিয়ানদের এই পোস্টাল কোড সহ মেইলিং ঠিকানা থাকার সম্ভাবনা বেশি থাকে, তাহলে এই অ্যালগরিদমের ফলে ভিন্ন প্রভাব পড়তে পারে।
বৈষম্যমূলক চিকিৎসার সাথে তুলনা করুন, যা বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে যা তখন ঘটে যখন উপগোষ্ঠীর বৈশিষ্ট্যগুলি একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়ার স্পষ্ট ইনপুট হয়।
ভিন্ন চিকিৎসা
বিষয়গুলির সংবেদনশীল বৈশিষ্ট্যগুলিকে একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়ার সাথে এমনভাবে ফ্যাক্টর করা যাতে বিভিন্ন উপগোষ্ঠীর লোকদের সাথে ভিন্নভাবে আচরণ করা হয়।
উদাহরণস্বরূপ, একটি অ্যালগরিদম বিবেচনা করুন যা লিলিপুটিয়ানদের তাদের ঋণ আবেদনে প্রদত্ত তথ্যের উপর ভিত্তি করে একটি ক্ষুদ্র-গৃহ ঋণের জন্য যোগ্যতা নির্ধারণ করে। যদি অ্যালগরিদমটি লিলিপুটিয়ানদের বিগ-এন্ডিয়ান বা লিটল-এন্ডিয়ান হিসাবে একটি ইনপুট হিসাবে সংযুক্তি ব্যবহার করে, তবে এটি সেই মাত্রায় ভিন্ন আচরণ প্রণয়ন করছে।
বৈষম্যমূলক প্রভাবের সাথে তুলনা করুন, যা উপগোষ্ঠীর উপর অ্যালগরিদমিক সিদ্ধান্তের সামাজিক প্রভাবের বৈষম্যের উপর দৃষ্টি নিবদ্ধ করে, সেই উপগোষ্ঠীগুলি মডেলের ইনপুট কিনা তা নির্বিশেষে।
ই
সুযোগের সমতা
একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানের জন্য একটি মডেল সমানভাবে ভালভাবে কাঙ্ক্ষিত ফলাফলের পূর্বাভাস দিচ্ছে কিনা তা মূল্যায়ন করার জন্য একটি ন্যায্যতা মেট্রিক । অন্য কথায়, যদি একটি মডেলের জন্য কাঙ্ক্ষিত ফলাফল ধনাত্মক শ্রেণী হয়, তাহলে লক্ষ্য হবে সকল গোষ্ঠীর জন্য প্রকৃত ধনাত্মক হার একই হওয়া।
সুযোগের সমতা সমান প্রতিকূলতার সাথে সম্পর্কিত, যার জন্য সকল গোষ্ঠীর জন্য সত্য ধনাত্মক হার এবং মিথ্যা ধনাত্মক হার উভয়ই একই হওয়া প্রয়োজন।
ধরুন, গ্লুবডুবড্রিব বিশ্ববিদ্যালয় লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থী বিশ্ববিদ্যালয় প্রোগ্রামের জন্য যোগ্য। ব্রোবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিত ক্লাস অফার করে না, এবং ফলস্বরূপ, তাদের ছাত্রদের মধ্যে অনেক কম সংখ্যকই যোগ্য। জাতীয়তার (লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান) ক্ষেত্রে "ভর্তি" এর পছন্দের লেবেলের জন্য সুযোগের সমতা পূরণ করা হয় যদি যোগ্য শিক্ষার্থীরা লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান যাই হোক না কেন, ভর্তি হওয়ার সম্ভাবনা সমানভাবে থাকে।
উদাহরণস্বরূপ, ধরুন ১০০ জন লিলিপুটিয়ান এবং ১০০ জন ব্রোবডিংনাগিয়ান গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণী ১. লিলিপুটিয়ান আবেদনকারী (৯০% যোগ্য)
| যোগ্য | অযোগ্য | |
|---|---|---|
| ভর্তি | ৪৫ | ৩ |
| প্রত্যাখ্যাত | ৪৫ | ৭ |
| মোট | ৯০ | ১০ |
| ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: ৪৫/৯০ = ৫০% অযোগ্য শিক্ষার্থী প্রত্যাখ্যাত হওয়ার শতাংশ: ৭/১০ = ৭০% লিলিপুটিয়ান ভর্তিচ্ছু শিক্ষার্থীদের মোট শতাংশ: (৪৫+৩)/১০০ = ৪৮% | ||
সারণী ২। ব্রোবডিংনাগিয়ান আবেদনকারী (১০% যোগ্য):
| যোগ্য | অযোগ্য | |
|---|---|---|
| ভর্তি | ৫ | ৯ |
| প্রত্যাখ্যাত | ৫ | ৮১ |
| মোট | ১০ | ৯০ |
| ভর্তিকৃত যোগ্য শিক্ষার্থীদের শতাংশ: ৫/১০ = ৫০% অযোগ্য শিক্ষার্থী প্রত্যাখ্যাত হওয়ার শতাংশ: ৮১/৯০ = ৯০% ভর্তি হওয়া ব্রোবডিংনাগিয়ান শিক্ষার্থীদের মোট শতাংশ: (৫+৯)/১০০ = ১৪% | ||
পূর্ববর্তী উদাহরণগুলি যোগ্য শিক্ষার্থীদের গ্রহণের সুযোগের সমতা পূরণ করে কারণ যোগ্য লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়েরই ভর্তির সম্ভাবনা ৫০%।
সুযোগের সমতা সন্তুষ্ট হলেও, নিম্নলিখিত দুটি ন্যায্যতা মেট্রিক্স সন্তুষ্ট নয়:
- জনসংখ্যার সমতা : লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ানদের বিশ্ববিদ্যালয়ে ভর্তির হার ভিন্ন; লিলিপুটিয়ানদের ৪৮% শিক্ষার্থী ভর্তি হয়, কিন্তু ব্রোবডিংনাগিয়ানদের মাত্র ১৪% শিক্ষার্থী ভর্তি হয়।
- সমান সম্ভাবনা : যদিও যোগ্য লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয় শিক্ষার্থীর ভর্তির সম্ভাবনা সমান, তবুও অতিরিক্ত সীমাবদ্ধতা যে অযোগ্য লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়েরই প্রত্যাখ্যাত হওয়ার সম্ভাবনা সমান তা পূরণ হয় না। অযোগ্য লিলিপুটিয়ানদের প্রত্যাখ্যানের হার ৭০%, যেখানে অযোগ্য ব্রোবডিংনাগিয়ানদের প্রত্যাখ্যানের হার ৯০%।
আরও তথ্যের জন্য "ফেয়ারনেস: মেশিন লার্নিং ক্র্যাশ কোর্সে সুযোগের সমতা" দেখুন।
সমান ব্যবধান
একটি ন্যায্যতা মেট্রিক যা মূল্যায়ন করে যে একটি মডেল একটি সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানের জন্য সমানভাবে ভাল ফলাফল পূর্বাভাস দিচ্ছে কিনা , ইতিবাচক শ্রেণী এবং নেতিবাচক শ্রেণী উভয়ের ক্ষেত্রেই - কেবল একটি শ্রেণী বা অন্য শ্রেণীর ক্ষেত্রেই নয়। অন্য কথায়, সমস্ত গোষ্ঠীর জন্য প্রকৃত ইতিবাচক হার এবং মিথ্যা নেতিবাচক হার উভয়ই একই হওয়া উচিত।
সমতুল্য প্রতিকূলতা সুযোগের সমতার সাথে সম্পর্কিত, যা শুধুমাত্র একটি একক শ্রেণীর (ধনাত্মক বা নেতিবাচক) ত্রুটির হারের উপর দৃষ্টি নিবদ্ধ করে।
উদাহরণস্বরূপ, ধরুন গ্লুবডুবড্রিব বিশ্ববিদ্যালয় লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলি গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম অফার করে এবং বেশিরভাগ শিক্ষার্থী বিশ্ববিদ্যালয় প্রোগ্রামের জন্য যোগ্য। ব্রোবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলি মোটেও গণিত ক্লাস অফার করে না, এবং ফলস্বরূপ, তাদের ছাত্রদের মধ্যে অনেক কম যোগ্য। সমান সম্ভাবনা পূরণ করা হয় যদি আবেদনকারী লিলিপুটিয়ান বা ব্রোবডিংনাগিয়ান যাই হোক না কেন, যদি তারা যোগ্য হয়, তবে তাদের প্রোগ্রামে ভর্তি হওয়ার সম্ভাবনা সমানভাবে বেশি, এবং যদি তারা যোগ্য না হয়, তবে তাদের প্রত্যাখ্যাত হওয়ার সম্ভাবনা সমানভাবে বেশি।
ধরুন ১০০ জন লিলিপুটিয়ান এবং ১০০ জন ব্রোবডিংনাগিয়ান গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করেন এবং ভর্তির সিদ্ধান্ত নিম্নরূপ নেওয়া হয়:
সারণী ৩। লিলিপুটিয়ান আবেদনকারী (৯০% যোগ্য)
| যোগ্য | অযোগ্য | |
|---|---|---|
| ভর্তি | ৪৫ | ২ |
| প্রত্যাখ্যাত | ৪৫ | ৮ |
| মোট | ৯০ | ১০ |
| ভর্তিকৃত যোগ্য শিক্ষার্থীর শতাংশ: ৪৫/৯০ = ৫০% অযোগ্য শিক্ষার্থী প্রত্যাখ্যাত হওয়ার শতাংশ: ৮/১০ = ৮০% লিলিপুটিয়ান ভর্তিচ্ছু শিক্ষার্থীদের মোট শতাংশ: (৪৫+২)/১০০ = ৪৭% | ||
সারণী ৪। ব্রোবডিংনাগিয়ান আবেদনকারী (১০% যোগ্য):
| যোগ্য | অযোগ্য | |
|---|---|---|
| ভর্তি | ৫ | ১৮ |
| প্রত্যাখ্যাত | ৫ | ৭২ |
| মোট | ১০ | ৯০ |
| ভর্তিকৃত যোগ্য শিক্ষার্থীদের শতাংশ: ৫/১০ = ৫০% অযোগ্য শিক্ষার্থী প্রত্যাখ্যাত হওয়ার শতাংশ: ৭২/৯০ = ৮০% ব্রোবডিংনাগিয়ান ভর্তিচ্ছু শিক্ষার্থীদের মোট শতাংশ: (৫+১৮)/১০০ = ২৩% | ||
সমান সম্ভাবনা পূরণ করা হয় কারণ যোগ্য লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ান উভয় শিক্ষার্থীরই ভর্তির সম্ভাবনা ৫০% এবং অযোগ্য লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ানের প্রত্যাখ্যাত হওয়ার সম্ভাবনা ৮০%।
"তত্ত্বাবধানে থাকা শিক্ষায় সুযোগের সমতা" তে সমান প্রতিকূলতাকে আনুষ্ঠানিকভাবে নিম্নরূপে সংজ্ঞায়িত করা হয়েছে: "যদি Ŷ এবং A স্বাধীন, Y এর উপর শর্তাধীন হয়, তাহলে ভবিষ্যদ্বাণীকারী Ŷ সুরক্ষিত বৈশিষ্ট্য A এবং ফলাফল Y এর ক্ষেত্রে সমান প্রতিকূলতা পূরণ করে।"
পরীক্ষকের পক্ষপাত
নিশ্চিতকরণ পক্ষপাত দেখুন।
চ
ন্যায্যতার সীমাবদ্ধতা
ন্যায্যতার এক বা একাধিক সংজ্ঞা পূরণ নিশ্চিত করার জন্য একটি অ্যালগরিদমে একটি সীমাবদ্ধতা প্রয়োগ করা। ন্যায্যতার সীমাবদ্ধতার উদাহরণগুলির মধ্যে রয়েছে:- আপনার মডেলের আউটপুট প্রক্রিয়াকরণের পরে ।
- ন্যায্যতা মেট্রিক লঙ্ঘনের জন্য জরিমানা অন্তর্ভুক্ত করার জন্য ক্ষতির ফাংশন পরিবর্তন করা।
- একটি অপ্টিমাইজেশন সমস্যায় সরাসরি একটি গাণিতিক সীমাবদ্ধতা যোগ করা।
ন্যায্যতা মেট্রিক
"ন্যায্যতা" এর একটি গাণিতিক সংজ্ঞা যা পরিমাপযোগ্য। কিছু সাধারণভাবে ব্যবহৃত ন্যায্যতা মেট্রিক্সের মধ্যে রয়েছে:
অনেক ন্যায্যতা মেট্রিক্স পারস্পরিকভাবে একচেটিয়া; ন্যায্যতা মেট্রিক্সের অসঙ্গতি দেখুন।
গ
গ্রুপ অ্যাট্রিবিউশন পক্ষপাত
ধরে নিচ্ছি যে একজন ব্যক্তির জন্য যা সত্য, সেই গোষ্ঠীর সকলের জন্যও তা সত্য। তথ্য সংগ্রহের জন্য যদি সুবিধাজনক নমুনা ব্যবহার করা হয়, তাহলে গোষ্ঠী অ্যাট্রিবিউশন পক্ষপাতের প্রভাব আরও বাড়তে পারে। একটি অ-প্রতিনিধিত্বমূলক নমুনায়, এমন অ্যাট্রিবিউশন তৈরি করা যেতে পারে যা বাস্তবতাকে প্রতিফলিত করে না।
আরও তথ্যের জন্য "Fairness: Types of bias in Machine Learning Crash Course " দেখুন।
জ
ঐতিহাসিক পক্ষপাত
এক ধরণের পক্ষপাত যা ইতিমধ্যেই বিশ্বে বিদ্যমান এবং একটি ডেটাসেটে প্রবেশ করেছে। এই পক্ষপাতগুলিতে বিদ্যমান সাংস্কৃতিক স্টেরিওটাইপ, জনসংখ্যাগত বৈষম্য এবং নির্দিষ্ট সামাজিক গোষ্ঠীর বিরুদ্ধে কুসংস্কার প্রতিফলিত হওয়ার প্রবণতা রয়েছে।
উদাহরণস্বরূপ, একটি শ্রেণিবিন্যাস মডেল বিবেচনা করুন যা ভবিষ্যদ্বাণী করে যে একজন ঋণ আবেদনকারী তাদের ঋণ খেলাপি হবেন কিনা, যা দুটি ভিন্ন সম্প্রদায়ের স্থানীয় ব্যাংক থেকে ১৯৮০-এর দশকের ঐতিহাসিক ঋণ-খেলাপি তথ্যের উপর প্রশিক্ষিত ছিল। যদি সম্প্রদায় A-এর অতীত আবেদনকারীদের সম্প্রদায় B-এর আবেদনকারীদের তুলনায় তাদের ঋণ খেলাপি হওয়ার সম্ভাবনা ছয় গুণ বেশি থাকে, তাহলে মডেলটি একটি ঐতিহাসিক পক্ষপাত শিখতে পারে যার ফলে মডেলটি সম্প্রদায় A-তে ঋণ অনুমোদনের সম্ভাবনা কম থাকে, এমনকি যদি ঐতিহাসিক পরিস্থিতির ফলে সেই সম্প্রদায়ের উচ্চ খেলাপি হার আর প্রাসঙ্গিক না থাকে।
আরও তথ্যের জন্য "ফেয়ারনেস: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের ধরণ" দেখুন।
আমি
অন্তর্নিহিত পক্ষপাত
নিজের মনের মডেল এবং স্মৃতির উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে একটি সম্পর্ক বা অনুমান তৈরি করা। অন্তর্নিহিত পক্ষপাত নিম্নলিখিতগুলিকে প্রভাবিত করতে পারে:
- কিভাবে তথ্য সংগ্রহ এবং শ্রেণীবদ্ধ করা হয়।
- মেশিন লার্নিং সিস্টেমগুলি কীভাবে ডিজাইন এবং বিকশিত হয়।
উদাহরণস্বরূপ, বিবাহের ছবি সনাক্ত করার জন্য একটি শ্রেণীবিভাগ মডেল তৈরি করার সময়, একজন প্রকৌশলী একটি ছবিতে সাদা পোশাকের উপস্থিতিকে একটি বৈশিষ্ট্য হিসাবে ব্যবহার করতে পারেন। তবে, সাদা পোশাক শুধুমাত্র নির্দিষ্ট যুগে এবং নির্দিষ্ট সংস্কৃতিতে প্রথাগত ছিল।
নিশ্চিতকরণ পক্ষপাতও দেখুন।
ন্যায্যতার মেট্রিক্সের অসঙ্গতি
ন্যায্যতার কিছু ধারণা পারস্পরিকভাবে অসঙ্গত এবং একই সাথে সন্তুষ্ট হতে পারে না এই ধারণা। ফলস্বরূপ, ন্যায্যতার পরিমাপের জন্য এমন কোনও একক সার্বজনীন মেট্রিক নেই যা সমস্ত ML সমস্যার ক্ষেত্রে প্রয়োগ করা যেতে পারে।
যদিও এটি হতাশাজনক বলে মনে হতে পারে, ন্যায্যতা মেট্রিক্সের অসঙ্গতি বোঝায় না যে ন্যায্যতা প্রচেষ্টা নিষ্ফল। পরিবর্তে, এটি পরামর্শ দেয় যে ন্যায্যতাকে একটি নির্দিষ্ট ML সমস্যার জন্য প্রাসঙ্গিকভাবে সংজ্ঞায়িত করা উচিত, যার লক্ষ্য এর ব্যবহারের ক্ষেত্রে নির্দিষ্ট ক্ষতি প্রতিরোধ করা।
ন্যায্যতার মেট্রিক্সের অসঙ্গতি সম্পর্কে আরও বিস্তারিত আলোচনার জন্য "ন্যায়পরায়ণতার (অ)সম্ভাব্যতা সম্পর্কে" দেখুন।
ব্যক্তিগত ন্যায্যতা
একটি ন্যায্যতা মেট্রিক যা একই ধরণের ব্যক্তিদের একইভাবে শ্রেণীবদ্ধ করা হয়েছে কিনা তা পরীক্ষা করে। উদাহরণস্বরূপ, ব্রোবডিংনাগিয়ান একাডেমি একই গ্রেড এবং মানসম্মত পরীক্ষার স্কোর সহ দুজন শিক্ষার্থীর ভর্তির সম্ভাবনা সমানভাবে নিশ্চিত করে ব্যক্তিগত ন্যায্যতা পূরণ করতে চাইতে পারে।
মনে রাখবেন যে ব্যক্তিগত ন্যায্যতা সম্পূর্ণরূপে আপনি "সাদৃশ্য" কীভাবে সংজ্ঞায়িত করেন তার উপর নির্ভর করে (এই ক্ষেত্রে, গ্রেড এবং পরীক্ষার স্কোর), এবং যদি আপনার সাদৃশ্য মেট্রিকে গুরুত্বপূর্ণ তথ্য (যেমন একজন শিক্ষার্থীর পাঠ্যক্রমের কঠোরতা) বাদ দেওয়া হয় তবে আপনি নতুন ন্যায্যতা সমস্যার প্রবর্তনের ঝুঁকি নিতে পারেন।
ব্যক্তিগত ন্যায্যতা সম্পর্কে আরও বিস্তারিত আলোচনার জন্য "সচেতনতার মাধ্যমে ন্যায্যতা" দেখুন।
গ্রুপ-ইন পক্ষপাত
নিজের গ্রুপ বা নিজস্ব বৈশিষ্ট্যের প্রতি পক্ষপাতিত্ব দেখানো। যদি পরীক্ষক বা রেটারগুলিতে মেশিন লার্নিং ডেভেলপারের বন্ধু, পরিবার বা সহকর্মী থাকে, তাহলে গ্রুপের মধ্যে পক্ষপাত পণ্য পরীক্ষা বা ডেটাসেটকে অবৈধ করে তুলতে পারে।
গ্রুপ-ইন-গ্রুপ পক্ষপাত হল গ্রুপ অ্যাট্রিবিউশন পক্ষপাতের একটি রূপ। গ্রুপের বাইরের সমজাতীয়তা পক্ষপাত আরও দেখুন।
আরও তথ্যের জন্য "ফেয়ারনেস: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের ধরণ" দেখুন।
ন
প্রতিক্রিয়াহীন পক্ষপাত
নির্বাচন পক্ষপাত দেখুন।
ও
গোষ্ঠীর বাইরের একজাতীয়তা পক্ষপাত
মনোভাব, মূল্যবোধ, ব্যক্তিত্বের বৈশিষ্ট্য এবং অন্যান্য বৈশিষ্ট্যের তুলনা করার সময়, গ্রুপের বাইরের সদস্যদেরকে গ্রুপের সদস্যদের তুলনায় বেশি একই রকম দেখার প্রবণতা। গ্রুপের মধ্যে এমন লোকদের কথা বলা হয় যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন; গ্রুপের বাইরের ব্যক্তিদের কথা বলা হয় যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন না। যদি আপনি লোকেদেরকে গ্রুপের বাইরের বৈশিষ্ট্যগুলি সরবরাহ করতে বলে একটি ডেটাসেট তৈরি করেন, তাহলে সেই বৈশিষ্ট্যগুলি অংশগ্রহণকারীদের তাদের গ্রুপের মধ্যে থাকা ব্যক্তিদের জন্য তালিকাভুক্ত বৈশিষ্ট্যগুলির তুলনায় কম সূক্ষ্ম এবং বেশি স্টেরিওটাইপড হতে পারে।
উদাহরণস্বরূপ, লিলিপুটিয়ানরা অন্যান্য লিলিপুটিয়ানদের ঘরবাড়ির বিশদ বর্ণনা দিতে পারে, স্থাপত্য শৈলী, জানালা, দরজা এবং আকারের মধ্যে সামান্য পার্থক্য উল্লেখ করে। তবে, একই লিলিপুটিয়ানরা কেবল ঘোষণা করতে পারে যে ব্রোবডিংনাগিয়ানরা সকলেই একই বাড়িতে বাস করে।
গোষ্ঠীর বাইরের একজাতীয়তা পক্ষপাত হল গোষ্ঠী বৈশিষ্ট্য পক্ষপাতের একটি রূপ।
আরও দেখুন ইন-গ্রুপ পক্ষপাত ।
প
অংশগ্রহণ পক্ষপাত
অ-প্রতিক্রিয়া পক্ষপাতের সমার্থক শব্দ। নির্বাচন পক্ষপাত দেখুন।
প্রক্রিয়াকরণ পরবর্তী
মডেলটি চালানোর পরে মডেলের আউটপুট সামঞ্জস্য করা। পোস্ট-প্রসেসিং মডেলগুলিকে পরিবর্তন না করেই ন্যায্যতার সীমাবদ্ধতা প্রয়োগ করতে ব্যবহার করা যেতে পারে।
উদাহরণস্বরূপ, কেউ একটি বাইনারি শ্রেণীবিভাগ মডেলে পোস্ট-প্রসেসিং প্রয়োগ করতে পারে একটি শ্রেণীবিভাগ থ্রেশহোল্ড সেট করে যাতে কোনও বৈশিষ্ট্যের জন্য সুযোগের সমতা বজায় থাকে এবং সেই বৈশিষ্ট্যের সমস্ত মানের জন্য প্রকৃত ধনাত্মক হার একই কিনা তা পরীক্ষা করে।
ভবিষ্যদ্বাণীমূলক সমতা
একটি ন্যায্যতা মেট্রিক যা পরীক্ষা করে যে, একটি প্রদত্ত শ্রেণিবিন্যাস মডেলের জন্য, বিবেচনাধীন উপগোষ্ঠীর জন্য নির্ভুলতার হার সমতুল্য কিনা।
উদাহরণস্বরূপ, কলেজ গ্রহণযোগ্যতার ভবিষ্যদ্বাণী করে এমন একটি মডেল জাতীয়তার জন্য ভবিষ্যদ্বাণীমূলক সমতা পূরণ করবে যদি এর নির্ভুলতার হার লিলিপুটিয়ান এবং ব্রোবডিংনাগিয়ানদের জন্য একই হয়।
ভবিষ্যদ্বাণীমূলক সমতাকে কখনও কখনও ভবিষ্যদ্বাণীমূলক হার সমতাও বলা হয়।
ভবিষ্যদ্বাণীমূলক সমতা সম্পর্কে আরও বিস্তারিত আলোচনার জন্য "ন্যায্যতার সংজ্ঞা ব্যাখ্যা করা হয়েছে" (অনুচ্ছেদ 3.2.1) দেখুন।
ভবিষ্যদ্বাণীমূলক হার সমতা
ভবিষ্যদ্বাণীমূলক সমতার আরেকটি নাম।
প্রাক-প্রক্রিয়াকরণ
একটি মডেলকে প্রশিক্ষণ দেওয়ার আগে ডেটা প্রক্রিয়াকরণ। প্রিপ্রসেসিং ইংরেজি অভিধানে না থাকা কোনও ইংরেজি টেক্সট কর্পাস থেকে শব্দগুলি সরিয়ে ফেলার মতো সহজ হতে পারে, অথবা সংবেদনশীল বৈশিষ্ট্যের সাথে সম্পর্কিত যতগুলি বৈশিষ্ট্য সম্ভব বাদ দিয়ে ডেটা পয়েন্টগুলি পুনরায় প্রকাশ করার মতো জটিল হতে পারে। প্রিপ্রসেসিং ন্যায্যতার সীমাবদ্ধতা পূরণ করতে সাহায্য করতে পারে।প্রক্সি (সংবেদনশীল বৈশিষ্ট্য)
একটি সংবেদনশীল বৈশিষ্ট্যের জন্য স্ট্যান্ড-ইন হিসেবে ব্যবহৃত একটি বৈশিষ্ট্য। উদাহরণস্বরূপ, একজন ব্যক্তির পোস্টাল কোড তাদের আয়, জাতি বা জাতিগততার জন্য একটি প্রক্সি হিসেবে ব্যবহার করা যেতে পারে।র
রিপোর্টিং পক্ষপাত
লোকেরা যে ফ্রিকোয়েন্সিতে কর্ম, ফলাফল বা বৈশিষ্ট্য সম্পর্কে লেখে, তা তাদের বাস্তব-বিশ্বের ফ্রিকোয়েন্সি বা কোনও সম্পত্তি কোন শ্রেণীর ব্যক্তির বৈশিষ্ট্যের প্রতিফলন নয়। রিপোর্টিং পক্ষপাত মেশিন লার্নিং সিস্টেমগুলি যে ডেটা থেকে শেখে তার গঠনকে প্রভাবিত করতে পারে।
উদাহরণস্বরূপ, বইগুলিতে, "হাসি" শব্দটি শ্বাস নেওয়ার চেয়ে বেশি প্রচলিত। একটি মেশিন লার্নিং মডেল যা বইয়ের সংগ্রহ থেকে হাসি এবং শ্বাস নেওয়ার আপেক্ষিক ফ্রিকোয়েন্সি অনুমান করে, সম্ভবত এটি নির্ধারণ করবে যে হাসি শ্বাস নেওয়ার চেয়ে বেশি সাধারণ।
See Fairness: Types of bias in Machine Learning Crash Course for more information.
স
নমুনা পক্ষপাত
See selection bias .
নির্বাচন পক্ষপাত
Errors in conclusions drawn from sampled data due to a selection process that generates systematic differences between samples observed in the data and those not observed. The following forms of selection bias exist:
- coverage bias : The population represented in the dataset doesn't match the population that the machine learning model is making predictions about.
- sampling bias : Data is not collected randomly from the target group.
- non-response bias (also called participation bias ): Users from certain groups opt-out of surveys at different rates than users from other groups.
For example, suppose you are creating a machine learning model that predicts people's enjoyment of a movie. To collect training data, you hand out a survey to everyone in the front row of a theater showing the movie. Offhand, this may sound like a reasonable way to gather a dataset; however, this form of data collection may introduce the following forms of selection bias:
- coverage bias: By sampling from a population who chose to see the movie, your model's predictions may not generalize to people who did not already express that level of interest in the movie.
- sampling bias: Rather than randomly sampling from the intended population (all the people at the movie), you sampled only the people in the front row. It is possible that the people sitting in the front row were more interested in the movie than those in other rows.
- non-response bias: In general, people with strong opinions tend to respond to optional surveys more frequently than people with mild opinions. Since the movie survey is optional, the responses are more likely to form a bimodal distribution than a normal (bell-shaped) distribution.
sensitive attribute
A human attribute that may be given special consideration for legal, ethical, social, or personal reasons.উ
unawareness (to a sensitive attribute)
A situation in which sensitive attributes are present, but not included in the training data. Because sensitive attributes are often correlated with other attributes of one's data, a model trained with unawareness about a sensitive attribute could still have disparate impact with respect to that attribute, or violate other fairness constraints .