মেশিন লার্নিং শব্দকোষ: দায়ী এআই

এই পাতায় দায়িত্বশীল এআই সম্পর্কিত পরিভাষা রয়েছে। সম্পূর্ণ পরিভাষা দেখতে এখানে ক্লিক করুন

একটি

বৈশিষ্ট্য

#দায়িত্বশীল

feature- এর সমার্থক শব্দ।

মেশিন লার্নিং-এর ক্ষেত্রে, অ্যাট্রিবিউট বলতে প্রায়শই কোনো ব্যক্তির বৈশিষ্ট্যকে বোঝানো হয়।

স্বয়ংক্রিয়করণ পক্ষপাত

#দায়িত্বশীল

যখন কোনো মানব সিদ্ধান্ত গ্রহণকারী, স্বয়ংক্রিয় ব্যবস্থা ছাড়া প্রাপ্ত তথ্যের চেয়ে স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণকারী ব্যবস্থার সুপারিশকে বেশি গুরুত্ব দেয়, এমনকি যখন সেই স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণকারী ব্যবস্থাটি ভুল করে।

আরও তথ্যের জন্য 'ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের প্রকারভেদ' দেখুন।

বি

পক্ষপাত (নীতিশাস্ত্র/ন্যায্যতা)

#দায়িত্বশীল
#মৌলিক বিষয়

১. কিছু জিনিস, ব্যক্তি বা গোষ্ঠীর প্রতি অন্যদের তুলনায় গতানুগতিক ধারণা, কুসংস্কার বা পক্ষপাতিত্ব। এই পক্ষপাতগুলো তথ্য সংগ্রহ ও ব্যাখ্যা, একটি সিস্টেমের নকশা এবং ব্যবহারকারীরা কীভাবে সিস্টেমটির সাথে মিথস্ক্রিয়া করে, সেগুলোকে প্রভাবিত করতে পারে। এই ধরনের পক্ষপাতের রূপগুলোর মধ্যে রয়েছে:

২. নমুনা সংগ্রহ বা প্রতিবেদন তৈরির পদ্ধতির কারণে সৃষ্ট পদ্ধতিগত ত্রুটি। এই ধরনের পক্ষপাতের রূপগুলোর মধ্যে অন্তর্ভুক্ত হলো:

মেশিন লার্নিং মডেলের বায়াস টার্ম বা প্রেডিকশন বায়াস- এর সাথে একে গুলিয়ে ফেলবেন না।

আরও তথ্যের জন্য 'ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের প্রকারভেদ' দেখুন।

সি

নিশ্চিতকরণ পক্ষপাত

#দায়িত্বশীল

নিজের পূর্ব-বিদ্যমান বিশ্বাস বা অনুমানকে সমর্থন করে এমনভাবে তথ্য অনুসন্ধান, ব্যাখ্যা, পছন্দ এবং স্মরণ করার প্রবণতা। মেশিন লার্নিং ডেভেলপাররা অনিচ্ছাকৃতভাবে এমনভাবে ডেটা সংগ্রহ বা লেবেল করতে পারেন যা তাদের বিদ্যমান বিশ্বাসকে সমর্থন করে এমন একটি ফলাফলকে প্রভাবিত করে। কনফার্মেশন বায়াস হলো এক ধরনের ইমপ্লিসিট বায়াস

পরীক্ষকের পক্ষপাত হলো এক প্রকার নিশ্চিতকরণ পক্ষপাত, যেখানে একজন পরীক্ষক পূর্ব-বিদ্যমান কোনো অনুমান নিশ্চিত না হওয়া পর্যন্ত মডেলগুলোকে প্রশিক্ষণ দিতে থাকেন।

প্রতিবাস্তব ন্যায্যতা

#দায়িত্বশীল
#মেট্রিক

একটি ন্যায্যতার পরিমাপক যা যাচাই করে যে, একটি ক্লাসিফিকেশন মডেল এক বা একাধিক সংবেদনশীল বৈশিষ্ট্য ছাড়া প্রথম ব্যক্তির অনুরূপ আরেকজন ব্যক্তির জন্য যে ফলাফল দেয়, সেই একই ফলাফল দেয় কি না। একটি ক্লাসিফিকেশন মডেলের প্রতিবাস্তব ন্যায্যতা মূল্যায়ন করা হলো মডেলটিতে পক্ষপাতের সম্ভাব্য উৎসগুলো উদ্ঘাটন করার একটি পদ্ধতি।

আরও তথ্যের জন্য নিম্নলিখিতগুলির যেকোনো একটি দেখুন:

কভারেজ পক্ষপাত

#দায়িত্বশীল

নির্বাচন পক্ষপাত দেখুন।

ডি

জনসংখ্যার সমতা

#দায়িত্বশীল
#মেট্রিক

ন্যায্যতার একটি পরিমাপক , যা তখনই পূরণ হয় যখন কোনো মডেলের শ্রেণিবিন্যাসের ফলাফল একটি প্রদত্ত সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল না হয়।

উদাহরণস্বরূপ, যদি লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়ই গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে, তাহলে জনতাত্ত্বিক সমতা অর্জিত হয় যদি ভর্তিকৃত লিলিপুটিয়ানদের শতাংশ এবং ভর্তিকৃত ব্রবডিংনাগিয়ানদের শতাংশ সমান হয়, একটি গোষ্ঠী গড়ে অন্যটির চেয়ে বেশি যোগ্য কি না তা নির্বিশেষে।

সমীকৃত সম্ভাবনা এবং সুযোগের সমতার সাথে এর তুলনা করুন, যা সামগ্রিকভাবে শ্রেণিবিন্যাসের ফলাফলকে সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল হতে দেয়, কিন্তু নির্দিষ্ট কিছু গ্রাউন্ড ট্রুথ লেবেলের জন্য শ্রেণিবিন্যাসের ফলাফলকে সংবেদনশীল বৈশিষ্ট্যের উপর নির্ভরশীল হতে দেয় না। জনসংখ্যাতাত্ত্বিক সমতার জন্য অপ্টিমাইজ করার ক্ষেত্রে সুবিধা-অসুবিধাগুলো নিয়ে একটি ভিজ্যুয়ালাইজেশনের জন্য "স্মার্টার মেশিন লার্নিং দিয়ে বৈষম্যের বিরুদ্ধে লড়াই" দেখুন।

আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ‘ন্যায্যতা: জনসংখ্যাতাত্ত্বিক সমতা’ দেখুন।

অসম প্রভাব

#দায়িত্বশীল

মানুষ সম্পর্কে এমন সিদ্ধান্ত গ্রহণ করা যা জনসংখ্যার বিভিন্ন উপগোষ্ঠীকে অসামঞ্জস্যপূর্ণভাবে প্রভাবিত করে। এটি সাধারণত এমন পরিস্থিতিকে বোঝায় যেখানে একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়া কিছু উপগোষ্ঠীকে অন্যদের তুলনায় বেশি ক্ষতি বা সুবিধা প্রদান করে।

উদাহরণস্বরূপ, ধরা যাক, একটি অ্যালগরিদম যা একজন লিলিপুটিয়ানের ক্ষুদ্রাকৃতির বাড়ির ঋণের জন্য যোগ্যতা নির্ধারণ করে, সেটি তাকে 'অযোগ্য' হিসেবে চিহ্নিত করার সম্ভাবনা বেশি রাখে যদি তার ডাক ঠিকানায় একটি নির্দিষ্ট পোস্টাল কোড থাকে। যদি লিটল-এন্ডিয়ান লিলিপুটিয়ানদের তুলনায় বিগ-এন্ডিয়ান লিলিপুটিয়ানদের এই পোস্টাল কোডযুক্ত ডাক ঠিকানা থাকার সম্ভাবনা বেশি হয়, তাহলে এই অ্যালগরিদমটি বৈষম্যমূলক প্রভাব ফেলতে পারে।

বৈষম্যমূলক আচরণের সাথে এর বৈসাদৃশ্য রয়েছে, যা এমন বৈষম্যের উপর আলোকপাত করে যা তখন ঘটে যখন উপগোষ্ঠীর বৈশিষ্ট্যগুলো একটি অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়ার সুস্পষ্ট ইনপুট হিসেবে ব্যবহৃত হয়।

বৈষম্যমূলক আচরণ

#দায়িত্বশীল

অ্যালগরিদমিক সিদ্ধান্ত গ্রহণ প্রক্রিয়ায় অংশগ্রহণকারীদের সংবেদনশীল বৈশিষ্ট্যগুলোকে এমনভাবে অন্তর্ভুক্ত করা, যাতে মানুষের বিভিন্ন উপগোষ্ঠীর সাথে ভিন্ন ভিন্ন আচরণ করা হয়।

উদাহরণস্বরূপ, এমন একটি অ্যালগরিদম বিবেচনা করুন যা লিলিপুটিয়ানদের ঋণ আবেদনে দেওয়া তথ্যের ভিত্তিতে একটি ক্ষুদ্রাকৃতির বাড়ির ঋণের জন্য তাদের যোগ্যতা নির্ধারণ করে। যদি অ্যালগরিদমটি কোনো লিলিপুটিয়ানের বিগ-এন্ডিয়ান বা লিটল-এন্ডিয়ান হিসেবে অন্তর্ভুক্তিকে ইনপুট হিসেবে ব্যবহার করে, তবে এটি সেই মাত্রা বরাবর বৈষম্যমূলক আচরণ করছে।

এর বিপরীতে ‘অসম প্রভাব’ (disparate impact) ধারণাটি রয়েছে, যা বিভিন্ন উপগোষ্ঠীর উপর অ্যালগরিদমিক সিদ্ধান্তের সামাজিক প্রভাবের বৈষম্যের উপর আলোকপাত করে, সেই উপগোষ্ঠীগুলো মডেলের ইনপুট হিসেবে বিবেচিত হোক বা না হোক।

সুযোগের সমতা

#দায়িত্বশীল
#মেট্রিক

একটি মডেল কোনো সংবেদনশীল বৈশিষ্ট্যের সকল মানের জন্য কাঙ্ক্ষিত ফলাফল সমানভাবে ভালোভাবে পূর্বাভাস দিচ্ছে কিনা, তা মূল্যায়ন করার জন্য এটি একটি ন্যায্যতার পরিমাপক । অন্য কথায়, যদি কোনো মডেলের জন্য কাঙ্ক্ষিত ফলাফল ধনাত্মক শ্রেণি হয়, তবে লক্ষ্য হবে সকল গোষ্ঠীর জন্য প্রকৃত ধনাত্মক হার একই রাখা।

সুযোগের সমতা সমীকৃত সম্ভাবনার সাথে সম্পর্কিত, যার জন্য প্রয়োজন যে সকল গোষ্ঠীর ক্ষেত্রে প্রকৃত ইতিবাচক হার এবং মিথ্যা ইতিবাচক হার উভয়ই একই হবে।

ধরা যাক, গ্লুবডুবড্রিব বিশ্ববিদ্যালয় লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়কেই একটি কঠোর গণিত প্রোগ্রামে ভর্তি করে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলোতে গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম রয়েছে এবং শিক্ষার্থীদের সিংহভাগই বিশ্ববিদ্যালয় প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলোতে গণিতের কোনো ক্লাসই নেই, এবং ফলস্বরূপ, তাদের অনেক কম সংখ্যক শিক্ষার্থী যোগ্য। জাতীয়তার (লিলিপুটিয়ান বা ব্রবডিংনাগিয়ান) সাপেক্ষে "ভর্তি" নামক পছন্দের তকমাটির জন্য সুযোগের সমতা পূরণ হয়, যদি যোগ্য শিক্ষার্থীদের লিলিপুটিয়ান বা ব্রবডিংনাগিয়ান নির্বিশেষে ভর্তি হওয়ার সম্ভাবনা সমান থাকে।

উদাহরণস্বরূপ, ধরা যাক ১০০ জন লিলিপুটিয়ান এবং ১০০ জন ব্রবডিংনাগিয়ান গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে, এবং ভর্তির সিদ্ধান্তগুলো নিম্নোক্তভাবে নেওয়া হয়:

সারণি ১. স্বল্পসংখ্যক আবেদনকারী (৯০% যোগ্যতাসম্পন্ন)

যোগ্য অযোগ্য
ভর্তি ৪৫
প্রত্যাখ্যাত ৪৫
মোট ৯০ ১০
যোগ্য ছাত্রছাত্রীদের ভর্তির হার: ৪৫/৯০ = ৫০%
অযোগ্য প্রত্যাখ্যাত শিক্ষার্থীদের হার: ৭/১০ = ৭০%
ভর্তি হওয়া লিলিপুটিয়ান শিক্ষার্থীদের মোট শতাংশ: (৪৫+৩)/১০০ = ৪৮%

সারণি ২. ব্রবডিংনাগিয়ান আবেদনকারী (১০% যোগ্য):

যোগ্য অযোগ্য
ভর্তি
প্রত্যাখ্যাত ৮১
মোট ১০ ৯০
যোগ্য শিক্ষার্থীদের ভর্তির হার: ৫/১০ = ৫০%
অযোগ্য প্রত্যাখ্যাত শিক্ষার্থীদের হার: ৮১/৯০ = ৯০%
ব্রবডিংনাগিয়ান শিক্ষার্থীদের ভর্তির মোট হার: (৫+৯)/১০০ = ১৪%

পূর্ববর্তী উদাহরণগুলো যোগ্য শিক্ষার্থীদের ভর্তির ক্ষেত্রে সুযোগের সমতা পূরণ করে, কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই ভর্তি হওয়ার ৫০% সম্ভাবনা রয়েছে।

সুযোগের সমতা পূরণ হলেও, ন্যায্যতার নিম্নলিখিত দুটি মাপকাঠি পূরণ হয় না:

  • জনসংখ্যাতাত্ত্বিক সমতা : লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানরা ভিন্ন হারে বিশ্ববিদ্যালয়ে ভর্তি হয়; ৪৮% লিলিপুটিয়ান শিক্ষার্থী ভর্তি হয়, কিন্তু মাত্র ১৪% ব্রবডিংনাগিয়ান শিক্ষার্থী ভর্তি হয়।
  • সমান সুযোগ : যদিও যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয় ছাত্রছাত্রীরই ভর্তি হওয়ার সম্ভাবনা সমান, কিন্তু এই অতিরিক্ত শর্তটি পূরণ হয় না যে অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়েরই প্রত্যাখ্যাত হওয়ার সম্ভাবনা সমান। অযোগ্য লিলিপুটিয়ানদের প্রত্যাখানের হার ৭০%, অপরদিকে অযোগ্য ব্রবডিংনাগিয়ানদের প্রত্যাখানের হার ৯০%।

আরও তথ্যের জন্য "ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে সুযোগের সমতা" দেখুন।

সমান প্রতিকূলতা

#দায়িত্বশীল
#মেট্রিক

একটি ন্যায্যতার পরিমাপক, যা মূল্যায়ন করে যে একটি মডেল কোনো সংবেদনশীল বৈশিষ্ট্যের সমস্ত মানের জন্য ইতিবাচক এবং নেতিবাচক উভয় শ্রেণীর ক্ষেত্রেই ফলাফল সমানভাবে ভালোভাবে পূর্বাভাস দিচ্ছে কিনা—শুধুমাত্র একটি শ্রেণীর জন্য নয়। অন্য কথায়, ট্রু পজিটিভ রেট এবং ফলস নেগেটিভ রেট উভয়ই সমস্ত গ্রুপের জন্য একই হওয়া উচিত।

সমীকৃত সম্ভাবনা সুযোগের সমতার সাথে সম্পর্কিত, যা শুধুমাত্র একটি নির্দিষ্ট শ্রেণীর (ধনাত্মক বা ঋণাত্মক) ভুলের হারের উপর আলোকপাত করে।

উদাহরণস্বরূপ, ধরা যাক গ্লুবডুবড্রিব বিশ্ববিদ্যালয় একটি কঠোর গণিত প্রোগ্রামে লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয়কেই ভর্তি করে। লিলিপুটিয়ানদের মাধ্যমিক বিদ্যালয়গুলোতে গণিত ক্লাসের একটি শক্তিশালী পাঠ্যক্রম রয়েছে এবং শিক্ষার্থীদের বিশাল সংখ্যাগরিষ্ঠ অংশ বিশ্ববিদ্যালয় প্রোগ্রামের জন্য যোগ্য। ব্রবডিংনাগিয়ানদের মাধ্যমিক বিদ্যালয়গুলোতে গণিতের কোনো ক্লাসই নেই, এবং ফলস্বরূপ, তাদের অনেক কম সংখ্যক শিক্ষার্থী যোগ্য। সমীকৃত সম্ভাবনার শর্তটি পূরণ হয় যদি আবেদনকারী লিলিপুটিয়ান বা ব্রবডিংনাগিয়ান যেই হোক না কেন, যদি সে যোগ্য হয়, তবে তার প্রোগ্রামে ভর্তি হওয়ার সম্ভাবনা সমান থাকে, এবং যদি সে যোগ্য না হয়, তবে তার প্রত্যাখ্যাত হওয়ার সম্ভাবনাও সমান থাকে।

ধরা যাক, ১০০ জন লিলিপুটিয়ান এবং ১০০ জন ব্রবডিংনাগিয়ান গ্লুবডুবড্রিব বিশ্ববিদ্যালয়ে আবেদন করে এবং ভর্তির সিদ্ধান্তগুলো নিম্নরূপভাবে নেওয়া হয়:

সারণি ৩. নগণ্য সংখ্যক আবেদনকারী (৯০% যোগ্যতাসম্পন্ন)

যোগ্য অযোগ্য
ভর্তি ৪৫
প্রত্যাখ্যাত ৪৫
মোট ৯০ ১০
যোগ্য ছাত্রছাত্রীদের ভর্তির হার: ৪৫/৯০ = ৫০%
অযোগ্য প্রত্যাখ্যাত শিক্ষার্থীদের হার: ৮/১০ = ৮০%
ভর্তি হওয়া লিলিপুটিয়ান শিক্ষার্থীদের মোট শতাংশ: (৪৫+২)/১০০ = ৪৭%

সারণি ৪. বিশাল আকারের আবেদনকারী (১০% যোগ্য):

যোগ্য অযোগ্য
ভর্তি ১৮
প্রত্যাখ্যাত ৭২
মোট ১০ ৯০
যোগ্য শিক্ষার্থীদের ভর্তির হার: ৫/১০ = ৫০%
অযোগ্য প্রত্যাখ্যাত শিক্ষার্থীদের হার: ৭২/৯০ = ৮০%
ব্রবডিংনাগিয়ান শিক্ষার্থীদের ভর্তির মোট হার: (৫+১৮)/১০০ = ২৩%

সম্ভাবনার সমতা সাধিত হয়, কারণ যোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ান উভয় ছাত্রছাত্রীরই ভর্তি হওয়ার সম্ভাবনা ৫০%, এবং অযোগ্য লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের প্রত্যাখ্যাত হওয়ার সম্ভাবনা ৮০%।

"Equality of Opportunity in Supervised Learning"- এ সমীকৃত সম্ভাবনা (Equalized odds)-কে আনুষ্ঠানিকভাবে নিম্নরূপে সংজ্ঞায়িত করা হয়েছে: "পূর্বাভাসকারী Ŷ, সুরক্ষিত বৈশিষ্ট্য A এবং ফলাফল Y-এর সাপেক্ষে সমীকৃত সম্ভাবনা পূরণ করে, যদি Y-এর সাপেক্ষে Ŷ এবং A স্বাধীন হয়।"

পরীক্ষকের পক্ষপাত

#দায়িত্বশীল

নিশ্চিতকরণ পক্ষপাত দেখুন।

এফ

ন্যায্যতার সীমাবদ্ধতা

#দায়িত্বশীল
ন্যায্যতার এক বা একাধিক সংজ্ঞা যাতে পূরণ হয়, তা নিশ্চিত করার জন্য কোনো অ্যালগরিদমে সীমাবদ্ধতা প্রয়োগ করা। ন্যায্যতার সীমাবদ্ধতার উদাহরণগুলো হলো:

ন্যায্যতার মেট্রিক

#দায়িত্বশীল
#মেট্রিক

'ন্যায্যতা'-র একটি পরিমাপযোগ্য গাণিতিক সংজ্ঞা। সচরাচর ব্যবহৃত কিছু ন্যায্যতার পরিমাপক হলো:

অনেক ন্যায্যতার পরিমাপক পরস্পর বর্জনীয়; ন্যায্যতার পরিমাপকসমূহের অসামঞ্জস্যতা দেখুন।

জি

গোষ্ঠী আরোপ পক্ষপাত

#দায়িত্বশীল

কোনো একজন ব্যক্তির জন্য যা সত্য, তা সেই গোষ্ঠীর সকলের জন্যও সত্য—এই ধারণা পোষণ করা। তথ্য সংগ্রহের জন্য সুবিধাজনক নমুনা পদ্ধতি ব্যবহার করা হলে গোষ্ঠীগত আরোপণ পক্ষপাতের প্রভাব আরও বাড়তে পারে। একটি অ-প্রতিনিধিত্বমূলক নমুনায় এমন আরোপণ করা হতে পারে যা বাস্তবতাকে প্রতিফলিত করে না।

আরও দেখুন বহির্গোষ্ঠী সমজাতীয়তা পক্ষপাত এবং অন্তর্গোষ্ঠী পক্ষপাত । আরও তথ্যের জন্য, মেশিন লার্নিং ক্র্যাশ কোর্সে ‘ন্যায্যতা: পক্ষপাতের প্রকারভেদ’ দেখুন।

এইচ

ঐতিহাসিক পক্ষপাত

#দায়িত্বশীল

এক ধরনের পক্ষপাত যা বিশ্বে আগে থেকেই বিদ্যমান এবং একটি ডেটাসেটেও স্থান করে নিয়েছে। এই পক্ষপাতগুলো বিদ্যমান সাংস্কৃতিক গতানুগতিক ধারণা, জনসংখ্যাতাত্ত্বিক বৈষম্য এবং নির্দিষ্ট সামাজিক গোষ্ঠীর প্রতি কুসংস্কারকে প্রতিফলিত করার প্রবণতা রাখে।

উদাহরণস্বরূপ, এমন একটি ক্লাসিফিকেশন মডেলের কথা ভাবুন যা ভবিষ্যদ্বাণী করে যে কোনো ঋণ আবেদনকারী তার ঋণ পরিশোধে ব্যর্থ হবে কি না। এই মডেলটিকে দুটি ভিন্ন এলাকার স্থানীয় ব্যাংকগুলো থেকে ১৯৮০-এর দশকের ঐতিহাসিক ঋণখেলাপের তথ্যের উপর ভিত্তি করে প্রশিক্ষণ দেওয়া হয়েছিল। যদি কমিউনিটি ‘এ’-এর অতীতের আবেদনকারীদের ঋণখেলাপের সম্ভাবনা কমিউনিটি ‘বি’-এর আবেদনকারীদের তুলনায় ছয় গুণ বেশি হয়ে থাকে, তাহলে মডেলটি একটি ঐতিহাসিক পক্ষপাতিত্ব শিখতে পারে। এর ফলে মডেলটি কমিউনিটি ‘এ’-তে ঋণ অনুমোদন করার সম্ভাবনা কমিয়ে দেবে, এমনকি যদি সেই এলাকার উচ্চ ঋণখেলাপের হারের কারণ হওয়া ঐতিহাসিক পরিস্থিতিগুলো আর প্রাসঙ্গিক না-ও থাকে।

আরও তথ্যের জন্য 'ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের প্রকারভেদ' দেখুন।

আমি

অন্তর্নিহিত পক্ষপাত

#দায়িত্বশীল

নিজের মানসিক মডেল এবং স্মৃতির উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে কোনো সংযোগ বা অনুমান তৈরি করা। অন্তর্নিহিত পক্ষপাত নিম্নলিখিত বিষয়গুলিকে প্রভাবিত করতে পারে:

  • কীভাবে ডেটা সংগ্রহ ও শ্রেণীবদ্ধ করা হয়।
  • মেশিন লার্নিং সিস্টেমগুলো কীভাবে ডিজাইন ও ডেভেলপ করা হয়।

উদাহরণস্বরূপ, বিয়ের ছবি শনাক্ত করার জন্য একটি ক্লাসিফিকেশন মডেল তৈরি করার সময়, একজন প্রকৌশলী ছবিতে সাদা পোশাকের উপস্থিতিকে একটি বৈশিষ্ট্য হিসেবে ব্যবহার করতে পারেন। তবে, সাদা পোশাক কেবল নির্দিষ্ট কিছু যুগে এবং নির্দিষ্ট কিছু সংস্কৃতিতেই প্রচলিত ছিল।

আরও দেখুন নিশ্চিতকরণ পক্ষপাত

ন্যায্যতার মেট্রিক্সের অসামঞ্জস্যতা

#দায়িত্বশীল
#মেট্রিক

এই ধারণা যে ন্যায্যতার কিছু ধারণা পরস্পরবিরোধী এবং একই সাথে পূরণ করা সম্ভব নয়। ফলস্বরূপ, ন্যায্যতার পরিমাণ নির্ধারণের জন্য এমন কোনো একক সার্বজনীন পরিমাপক নেই যা সমস্ত এমএল (ML) সমস্যার ক্ষেত্রে প্রয়োগ করা যেতে পারে।

যদিও এটি হতাশাজনক মনে হতে পারে, ন্যায্যতার মেট্রিকগুলোর অসামঞ্জস্যতা এই ইঙ্গিত দেয় না যে ন্যায্যতার প্রচেষ্টাগুলো নিষ্ফল। বরং, এটি পরামর্শ দেয় যে একটি নির্দিষ্ট এমএল সমস্যার জন্য ন্যায্যতাকে প্রাসঙ্গিকভাবে সংজ্ঞায়িত করতে হবে, যার লক্ষ্য হবে এর ব্যবহারের ক্ষেত্রগুলোর জন্য নির্দিষ্ট ক্ষতি প্রতিরোধ করা।

ন্যায্যতার পরিমাপকগুলোর অসামঞ্জস্যতা সম্পর্কে আরও বিশদ আলোচনার জন্য "ন্যায্যতার (অ)সম্ভাব্যতা প্রসঙ্গে" দেখুন।

ব্যক্তিগত ন্যায্যতা

#দায়িত্বশীল
#মেট্রিক

ন্যায্যতার একটি পরিমাপক যা যাচাই করে দেখে যে একই রকম ব্যক্তিদের একইভাবে শ্রেণীবদ্ধ করা হয় কিনা। উদাহরণস্বরূপ, ব্রবডিংনাগিয়ান একাডেমি ব্যক্তিগত ন্যায্যতা নিশ্চিত করতে চাইতে পারে এই বিষয়টি নিশ্চিত করার মাধ্যমে যে, একই গ্রেড এবং প্রমিত পরীক্ষার স্কোর থাকা দুজন শিক্ষার্থীর ভর্তি হওয়ার সম্ভাবনা সমান।

মনে রাখবেন যে, ব্যক্তিগত ন্যায্যতা সম্পূর্ণরূপে নির্ভর করে আপনি 'সাদৃশ্য' (এই ক্ষেত্রে, গ্রেড এবং পরীক্ষার স্কোর) কীভাবে সংজ্ঞায়িত করেন তার উপর, এবং আপনার সাদৃশ্য পরিমাপকটি যদি কোনো গুরুত্বপূর্ণ তথ্য (যেমন একজন শিক্ষার্থীর পাঠ্যক্রমের কঠোরতা) বাদ দেয়, তবে আপনি নতুন ন্যায্যতার সমস্যা তৈরি করার ঝুঁকি নিতে পারেন।

ব্যক্তিগত ন্যায্যতা সম্পর্কে আরও বিশদ আলোচনার জন্য "সচেতনতার মাধ্যমে ন্যায্যতা" দেখুন।

গোষ্ঠীগত পক্ষপাত

#দায়িত্বশীল

নিজ গোষ্ঠী বা নিজস্ব বৈশিষ্ট্যের প্রতি পক্ষপাতিত্ব দেখানো। যদি পরীক্ষক বা মূল্যায়নকারীরা মেশিন লার্নিং ডেভেলপারের বন্ধু, পরিবার বা সহকর্মী হন, তাহলে গোষ্ঠীগত পক্ষপাতিত্ব পণ্যের পরীক্ষা বা ডেটাসেটকে অকার্যকর করে দিতে পারে।

অন্তর্গোষ্ঠী পক্ষপাত হলো গোষ্ঠী আরোপণ পক্ষপাতের একটি রূপ। বহির্গোষ্ঠী সমরূপতা পক্ষপাতও দেখুন।

আরও তথ্যের জন্য 'ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের প্রকারভেদ' দেখুন।

এন

অপ্রতিক্রিয়া পক্ষপাত

#দায়িত্বশীল

নির্বাচন পক্ষপাত দেখুন।

বহির্গোষ্ঠীর সমজাতীয়তার পক্ষপাত

#দায়িত্বশীল

মনোভাব, মূল্যবোধ, ব্যক্তিত্বের বৈশিষ্ট্য এবং অন্যান্য চারিত্রিক বৈশিষ্ট্যের তুলনা করার সময়, নিজ গোষ্ঠীর সদস্যদের চেয়ে ভিন্ন গোষ্ঠীর সদস্যদের বেশি সাদৃশ্যপূর্ণ হিসেবে দেখার প্রবণতা। নিজ গোষ্ঠী বলতে বোঝায় সেইসব ব্যক্তিদের যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন; ভিন্ন গোষ্ঠী বলতে বোঝায় সেইসব ব্যক্তিদের যাদের সাথে আপনি নিয়মিত যোগাযোগ করেন না। যদি আপনি ভিন্ন গোষ্ঠীর সদস্যদের সম্পর্কে বৈশিষ্ট্য প্রদান করতে বলে একটি ডেটাসেট তৈরি করেন, তবে সেই বৈশিষ্ট্যগুলো অংশগ্রহণকারীদের নিজ গোষ্ঠীর সদস্যদের জন্য তালিকাভুক্ত করা বৈশিষ্ট্যের তুলনায় কম সূক্ষ্ম এবং বেশি গতানুগতিক হতে পারে।

উদাহরণস্বরূপ, লিলিপুটিয়ানরা স্থাপত্যশৈলী, জানালা, দরজা এবং আকারের ছোটখাটো পার্থক্য উল্লেখ করে অন্য লিলিপুটিয়ানদের বাড়ির বিশদ বর্ণনা দিতে পারে। তবে, সেই একই লিলিপুটিয়ানরা হয়তো সহজভাবে ঘোষণা করতে পারে যে ব্রবডিংনাগিয়ানরা সবাই একই রকম বাড়িতে বাস করে।

বহির্গোষ্ঠী সমরূপতা পক্ষপাত হলো গোষ্ঠী আরোপণ পক্ষপাতের একটি রূপ।

আরও দেখুন গোষ্ঠীগত পক্ষপাত

পি

অংশগ্রহণের পক্ষপাত

#দায়িত্বশীল

অপ্রতিক্রিয়া পক্ষপাতের সমার্থক শব্দ। নির্বাচন পক্ষপাত দেখুন।

পোস্ট-প্রসেসিং

#দায়িত্বশীল
#মৌলিক বিষয়

মডেলটি চালানোর পর তার আউটপুট সমন্বয় করা। মডেলগুলোকে সরাসরি পরিবর্তন না করেই ন্যায্যতার সীমাবদ্ধতা আরোপ করতে পোস্ট-প্রসেসিং ব্যবহার করা যেতে পারে।

উদাহরণস্বরূপ, কোনো একটি বাইনারি ক্লাসিফিকেশন মডেলে পোস্ট-প্রসেসিং প্রয়োগ করার জন্য একটি ক্লাসিফিকেশন থ্রেশহোল্ড এমনভাবে নির্ধারণ করা যেতে পারে, যাতে কোনো একটি অ্যাট্রিবিউটের সমস্ত মানের জন্য ট্রু পজিটিভ রেট একই আছে কি না তা যাচাই করার মাধ্যমে সেই অ্যাট্রিবিউটের ক্ষেত্রে সুযোগের সমতা বজায় থাকে।

ভবিষ্যদ্বাণীমূলক সমতা

#দায়িত্বশীল
#মেট্রিক

একটি ন্যায্যতার পরিমাপক যা যাচাই করে যে, একটি প্রদত্ত শ্রেণিবিন্যাস মডেলের জন্য, বিবেচিত উপগোষ্ঠীগুলোর নির্ভুলতার হার সমতুল্য কিনা।

উদাহরণস্বরূপ, কলেজে ভর্তির পূর্বাভাস দেয় এমন একটি মডেল জাতীয়তার ক্ষেত্রে ভবিষ্যদ্বাণীমূলক সমতা পূরণ করবে, যদি এর নির্ভুলতার হার লিলিপুটিয়ান এবং ব্রবডিংনাগিয়ানদের জন্য একই হয়।

প্রেডিক্টিভ প্যারিটিকে কখনও কখনও প্রেডিক্টিভ রেট প্যারিটিও বলা হয়।

ভবিষ্যদ্বাণীমূলক সমতা সম্পর্কে আরও বিশদ আলোচনার জন্য "ন্যায্যতার সংজ্ঞার ব্যাখ্যা" (অনুচ্ছেদ ৩.২.১) দেখুন।

পূর্বাভাসমূলক হারের সমতা

#দায়িত্বশীল
#মেট্রিক

প্রেডিক্টিভ প্যারিটির অপর নাম।

প্রাক-প্রক্রিয়াকরণ

#দায়িত্বশীল
মডেলকে প্রশিক্ষণ দেওয়ার জন্য ডেটা ব্যবহার করার আগে তার প্রক্রিয়াকরণ। প্রিপ্রসেসিং একটি ইংরেজি টেক্সট কর্পাস থেকে ইংরেজি অভিধানে নেই এমন শব্দ বাদ দেওয়ার মতো সহজ হতে পারে, অথবা সংবেদনশীল অ্যাট্রিবিউটের সাথে সম্পর্কিত অ্যাট্রিবিউটগুলোকে যতটা সম্ভব বাদ দিয়ে ডেটা পয়েন্টগুলোকে পুনরায় প্রকাশ করার মতো জটিলও হতে পারে। প্রিপ্রসেসিং ফেয়ারনেস কনস্ট্রেইন্ট পূরণে সাহায্য করতে পারে।

উৎস

#দায়িত্বশীল

কোনো ডিজিটাল মিডিয়া কন্টেন্ট কীভাবে তৈরি বা পরিবর্তন করা হয়েছিল, তার বিশদ তথ্য।

প্রক্সি (সংবেদনশীল বৈশিষ্ট্য)

#দায়িত্বশীল
একটি সংবেদনশীল বৈশিষ্ট্যের বিকল্প হিসেবে ব্যবহৃত বৈশিষ্ট্য। উদাহরণস্বরূপ, কোনো ব্যক্তির পোস্টাল কোড তার আয়, জাতি বা নৃগোষ্ঠীর বিকল্প হিসেবে ব্যবহার করা যেতে পারে।

আর

রিপোর্টিং পক্ষপাত

#দায়িত্বশীল

মানুষ যে হারে কোনো কাজ, ফলাফল বা বৈশিষ্ট্য সম্পর্কে লেখে, তা বাস্তব জগতে সেগুলোর পুনরাবৃত্তির হার বা কোনো একটি বৈশিষ্ট্য কোনো নির্দিষ্ট শ্রেণীর ব্যক্তির ক্ষেত্রে কতটা প্রযোজ্য, তার প্রতিফলন নয়। রিপোর্টিং বায়াস সেই ডেটার গঠনকে প্রভাবিত করতে পারে, যা থেকে মেশিন লার্নিং সিস্টেমগুলো শেখে।

উদাহরণস্বরূপ, বইয়ের ক্ষেত্রে ‘হাসি’ শব্দটি ‘শ্বাস নেওয়া’ শব্দের চেয়ে বেশি প্রচলিত। একটি মেশিন লার্নিং মডেল যা বইয়ের সংগ্রহ থেকে হাসি এবং শ্বাস নেওয়ার আপেক্ষিক হার অনুমান করে, সম্ভবত নির্ধারণ করবে যে শ্বাস নেওয়ার চেয়ে হাসি বেশি প্রচলিত।

আরও তথ্যের জন্য 'ন্যায্যতা: মেশিন লার্নিং ক্র্যাশ কোর্সে পক্ষপাতের প্রকারভেদ' দেখুন।

এস

নমুনা পক্ষপাত

#দায়িত্বশীল

নির্বাচন পক্ষপাত দেখুন।

নির্বাচন পক্ষপাত

#দায়িত্বশীল

নমুনা থেকে প্রাপ্ত উপাত্তের ভিত্তিতে সিদ্ধান্তে যে ত্রুটি দেখা দেয়, তা এমন একটি নির্বাচন প্রক্রিয়ার কারণে ঘটে যা উপাত্তে পর্যবেক্ষণকৃত এবং অনিরীক্ষিত নমুনাগুলোর মধ্যে পদ্ধতিগত পার্থক্য তৈরি করে। নির্বাচন পক্ষপাতের নিম্নলিখিত রূপগুলো বিদ্যমান:

  • কভারেজ বায়াস : ডেটাসেটে প্রতিনিধিত্ব করা জনগোষ্ঠী সেই জনগোষ্ঠীর সাথে মেলে না, যাদের সম্পর্কে মেশিন লার্নিং মডেলটি পূর্বাভাস দিচ্ছে।
  • নমুনা পক্ষপাত : লক্ষ্য গোষ্ঠী থেকে এলোমেলোভাবে তথ্য সংগ্রহ করা হয় না।
  • অপ্রতিক্রিয়া পক্ষপাত ( অংশগ্রহণ পক্ষপাত নামেও পরিচিত): নির্দিষ্ট কিছু গোষ্ঠীর ব্যবহারকারীরা অন্যান্য গোষ্ঠীর ব্যবহারকারীদের তুলনায় ভিন্ন হারে সমীক্ষা থেকে নিজেদের বিরত রাখেন।

উদাহরণস্বরূপ, ধরুন আপনি এমন একটি মেশিন লার্নিং মডেল তৈরি করছেন যা কোনো সিনেমা দেখে মানুষের ভালো লাগার মাত্রা অনুমান করতে পারে। ট্রেনিং ডেটা সংগ্রহ করার জন্য, আপনি সিনেমাটি দেখানো থিয়েটারের সামনের সারির প্রত্যেককে একটি জরিপপত্র বিলি করেন। আপাতদৃষ্টিতে, ডেটাসেট সংগ্রহের জন্য এটিকে একটি যুক্তিসঙ্গত উপায় বলে মনে হতে পারে; তবে, এই ধরনের ডেটা সংগ্রহ নিম্নলিখিত ধরনের সিলেকশন বায়াস তৈরি করতে পারে:

  • কভারেজ বায়াস: যারা সিনেমাটি দেখার সিদ্ধান্ত নিয়েছে, এমন জনগোষ্ঠী থেকে নমুনা সংগ্রহ করার ফলে আপনার মডেলের পূর্বাভাসগুলো এমন ব্যক্তিদের ক্ষেত্রে প্রযোজ্য নাও হতে পারে, যারা সিনেমাটির প্রতি আগে থেকেই সেই স্তরের আগ্রহ প্রকাশ করেননি।
  • নমুনা পক্ষপাত: উদ্দিষ্ট জনগোষ্ঠী (সিনেমা হলে উপস্থিত সকল ব্যক্তি) থেকে দৈবচয়নের মাধ্যমে নমুনা সংগ্রহের পরিবর্তে, আপনি কেবল সামনের সারির ব্যক্তিদের মধ্য থেকে নমুনা সংগ্রহ করেছেন। এটা সম্ভব যে, সামনের সারিতে বসা ব্যক্তিরা অন্য সারির ব্যক্তিদের চেয়ে সিনেমাটির প্রতি বেশি আগ্রহী ছিলেন।
  • অপ্রতিক্রিয়া পক্ষপাত: সাধারণত, যাদের মতামত দৃঢ়, তারা মৃদু মতামতের মানুষদের তুলনায় ঐচ্ছিক সমীক্ষায় বেশি সাড়া দিয়ে থাকেন। যেহেতু চলচ্চিত্র সমীক্ষাটি ঐচ্ছিক, তাই প্রতিক্রিয়াগুলো স্বাভাবিক (ঘণ্টাকৃতির) বিন্যাসের চেয়ে দ্বিমুখী বিন্যাস গঠন করার সম্ভাবনা বেশি।

সংবেদনশীল বৈশিষ্ট্য

#দায়িত্বশীল
মানুষের এমন একটি বৈশিষ্ট্য, যাকে আইনগত, নৈতিক, সামাজিক বা ব্যক্তিগত কারণে বিশেষ বিবেচনা করা যেতে পারে।

U

unawareness (to a sensitive attribute)

#দায়িত্বশীল

A situation in which sensitive attributes are present, but not included in the training data. Because sensitive attributes are often correlated with other attributes of one's data, a model trained with unawareness about a sensitive attribute could still have disparate impact with respect to that attribute, or violate other fairness constraints .