শ্রেণীবিভাগ: যথার্থতা, স্মরণ, নির্ভুলতা, এবং সম্পর্কিত মেট্রিক্স

সত্য এবং মিথ্যা ইতিবাচক এবং নেতিবাচক মডেলগুলি মূল্যায়নের জন্য বেশ কয়েকটি দরকারী মেট্রিক্স গণনা করতে ব্যবহৃত হয়। কোন মূল্যায়ন মেট্রিকগুলি সবচেয়ে অর্থপূর্ণ তা নির্ভর করে নির্দিষ্ট মডেল এবং নির্দিষ্ট কাজ, বিভিন্ন ভুল শ্রেণীবিভাগের খরচ এবং ডেটাসেটটি ভারসাম্যপূর্ণ বা ভারসাম্যহীন কিনা।

এই বিভাগের সমস্ত মেট্রিক্স একটি নির্দিষ্ট থ্রেশহোল্ডে গণনা করা হয় এবং থ্রেশহোল্ড পরিবর্তন হলে পরিবর্তন হয়। খুব প্রায়ই, ব্যবহারকারী এই মেট্রিকগুলির মধ্যে একটিকে অপ্টিমাইজ করার জন্য প্রান্তিক টিউন করে।

নির্ভুলতা হল সমস্ত শ্রেণীবিভাগের অনুপাত যা সঠিক ছিল, তা ইতিবাচক বা নেতিবাচক। এটি গাণিতিকভাবে সংজ্ঞায়িত করা হয়:

Accuracy=correct classificationstotal classifications=TP+TNTP+TN+FP+FN

স্প্যাম শ্রেণীবিভাগের উদাহরণে, নির্ভুলতা সঠিকভাবে শ্রেণীবদ্ধ করা সমস্ত ইমেলের ভগ্নাংশ পরিমাপ করে।

একটি নিখুঁত মডেলের শূন্য মিথ্যা ইতিবাচক এবং শূন্য মিথ্যা নেতিবাচক এবং তাই 1.0 বা 100% এর নির্ভুলতা থাকবে।

কারণ এটি কনফিউশন ম্যাট্রিক্স (TP, FP, TN, FN) থেকে চারটি ফলাফলকে অন্তর্ভুক্ত করে, একটি ভারসাম্যপূর্ণ ডেটাসেট দেওয়া হয়, উভয় শ্রেণিতে একই সংখ্যক উদাহরণ সহ, নির্ভুলতা মডেল মানের একটি মোটা দানাদার পরিমাপ হিসাবে কাজ করতে পারে। এই কারণে, এটি প্রায়শই জেনেরিক বা অনির্দিষ্ট মডেলগুলির জন্য জেনেরিক বা অনির্দিষ্ট কার্য সম্পাদনের জন্য ব্যবহৃত ডিফল্ট মূল্যায়ন মেট্রিক।

যাইহোক, যখন ডেটাসেটটি ভারসাম্যহীন হয়, বা যেখানে এক ধরণের ভুল (FN বা FP) অন্যটির চেয়ে বেশি ব্যয়বহুল, যা বেশিরভাগ বাস্তব-বিশ্বের অ্যাপ্লিকেশনের ক্ষেত্রে হয়, এর পরিবর্তে অন্য মেট্রিকগুলির একটির জন্য অপ্টিমাইজ করা ভাল।

ভারী ভারসাম্যহীন ডেটাসেটগুলির জন্য, যেখানে একটি শ্রেণী খুব কমই দেখা যায়, বলুন 1% সময়ের, একটি মডেল যেটি সময়ের 100% নেতিবাচক ভবিষ্যদ্বাণী করে তা অকেজো হওয়া সত্ত্বেও নির্ভুলতার উপর 99% স্কোর করবে।

প্রত্যাহার, বা সত্য ইতিবাচক হার

সত্যিকারের পজিটিভ রেট (টিপিআর) , বা সমস্ত প্রকৃত ইতিবাচকের অনুপাত যা সঠিকভাবে ধনাত্মক হিসাবে শ্রেণীবদ্ধ করা হয়েছিল, এটি প্রত্যাহার হিসাবেও পরিচিত।

রিকলকে গাণিতিকভাবে সংজ্ঞায়িত করা হয়:

Recall (or TPR)=correctly classified actual positivesall actual positives=TPTP+FN

মিথ্যা নেতিবাচক হল প্রকৃত ইতিবাচক যা নেতিবাচক হিসাবে ভুল শ্রেণীবদ্ধ করা হয়েছিল, এই কারণেই তারা হরগুলিতে উপস্থিত হয়। স্প্যাম শ্রেণীবিভাগের উদাহরণে, রিকল স্প্যাম ইমেলের ভগ্নাংশ পরিমাপ করে যা সঠিকভাবে স্প্যাম হিসাবে শ্রেণীবদ্ধ করা হয়েছিল। এই কারণেই প্রত্যাহার করার আরেকটি নাম হল সনাক্তকরণের সম্ভাবনা : এটি "এই মডেলের দ্বারা স্প্যাম ইমেলের কোন ভগ্নাংশ সনাক্ত করা হয়েছে?" প্রশ্নের উত্তর দেয়।

একটি কাল্পনিক নিখুঁত মডেলের শূন্য মিথ্যা নেতিবাচক থাকবে এবং তাই 1.0 এর একটি প্রত্যাহার (টিপিআর), যা বলা যায়, 100% সনাক্তকরণ হার।

একটি ভারসাম্যহীন ডেটাসেটে যেখানে প্রকৃত ইতিবাচকের সংখ্যা খুবই, খুব কম, মোট 1-2টি উদাহরণ বলুন, মেট্রিক হিসাবে রিকল কম অর্থবহ এবং কম দরকারী।

মিথ্যা ইতিবাচক হার

মিথ্যা ইতিবাচক হার (FPR) হল সমস্ত প্রকৃত নেতিবাচকের অনুপাত যা ভুলভাবে ইতিবাচক হিসাবে শ্রেণীবদ্ধ করা হয়েছিল, যা মিথ্যা অ্যালার্মের সম্ভাবনা হিসাবেও পরিচিত। এটি গাণিতিকভাবে সংজ্ঞায়িত করা হয়:

FPR=incorrectly classified actual negativesall actual negatives=FPFP+TN

মিথ্যা ধনাত্মক হল প্রকৃত নেতিবাচক যেগুলিকে ভুল শ্রেণীবদ্ধ করা হয়েছিল, এই কারণেই তারা হরগুলিতে উপস্থিত হয়। স্প্যাম শ্রেণীবিভাগের উদাহরণে, FPR বৈধ ইমেলের ভগ্নাংশ পরিমাপ করে যেগুলিকে ভুলভাবে স্প্যাম হিসাবে শ্রেণীবদ্ধ করা হয়েছে, বা মডেলের মিথ্যা অ্যালার্মের হার।

একটি নিখুঁত মডেলের শূন্য মিথ্যা পজিটিভ থাকবে এবং সেইজন্য 0.0 এর FPR হবে, যা বলতে হবে, একটি 0% মিথ্যা অ্যালার্ম রেট।

একটি ভারসাম্যহীন ডেটাসেটে যেখানে প্রকৃত নেতিবাচকের সংখ্যা খুব, খুব কম, মোট 1-2টি উদাহরণ বলুন, FPR একটি মেট্রিক হিসাবে কম অর্থবহ এবং কম দরকারী।

যথার্থতা

যথার্থতা হল সমস্ত মডেলের ইতিবাচক শ্রেণীবিভাগের অনুপাত যা প্রকৃতপক্ষে ইতিবাচক। এটি গাণিতিকভাবে সংজ্ঞায়িত করা হয়:

Precision=correctly classified actual positiveseverything classified as positive=TPTP+FP

স্প্যাম শ্রেণীবিভাগের উদাহরণে, নির্ভুলতা স্প্যাম হিসাবে শ্রেণীবদ্ধ ইমেলের ভগ্নাংশ পরিমাপ করে যেগুলি আসলে স্প্যাম ছিল।

একটি অনুমানমূলক নিখুঁত মডেলের শূন্য মিথ্যা ইতিবাচক এবং তাই 1.0 এর নির্ভুলতা থাকবে।

একটি ভারসাম্যহীন ডেটাসেটে যেখানে প্রকৃত ধনাত্মক সংখ্যা খুবই কম, মোট 1-2টি উদাহরণ বলুন, নির্ভুলতা একটি মেট্রিক হিসাবে কম অর্থবহ এবং কম দরকারী।

মিথ্যা ইতিবাচক হ্রাসের সাথে যথার্থতা উন্নত হয়, যখন মিথ্যা নেতিবাচক হ্রাস পায় তখন প্রত্যাহার উন্নত হয়। কিন্তু পূর্ববর্তী বিভাগে দেখা গেছে, শ্রেণীবিন্যাস থ্রেশহোল্ড বাড়ানোর ফলে মিথ্যা ইতিবাচক সংখ্যা হ্রাস এবং মিথ্যা নেতিবাচক সংখ্যা বৃদ্ধির প্রবণতা রয়েছে, যখন প্রান্তিকতা হ্রাস করার বিপরীত প্রভাব রয়েছে। ফলস্বরূপ, নির্ভুলতা এবং প্রত্যাহার প্রায়শই একটি বিপরীত সম্পর্ক দেখায়, যেখানে তাদের একটির উন্নতি অন্যটিকে খারাপ করে।

এটি নিজে চেষ্টা করুন:

0 দ্বারা ভাগ করার সময় NaN বা "কোনও সংখ্যা নয়" প্রদর্শিত হয়, যা এই মেট্রিকের যে কোনো একটির সাথে ঘটতে পারে। যখন TP এবং FP উভয়ই 0 হয়, উদাহরণস্বরূপ, নির্ভুলতার সূত্রটির হর-এ 0 থাকে, যার ফলে NaN হয়। যদিও কিছু ক্ষেত্রে NaN নিখুঁত কর্মক্ষমতা নির্দেশ করতে পারে এবং 1.0 এর স্কোর দ্বারা প্রতিস্থাপিত হতে পারে, এটি এমন একটি মডেল থেকেও আসতে পারে যা কার্যত অকেজো। একটি মডেল যা কখনই ইতিবাচক ভবিষ্যদ্বাণী করে না, উদাহরণস্বরূপ, 0 টিপি এবং 0 এফপি থাকবে এবং এইভাবে এর নির্ভুলতার একটি গণনার ফলে NaN হবে।

মেট্রিক এবং ট্রেডঅফের পছন্দ

মডেলটি মূল্যায়ন করার সময় এবং একটি থ্রেশহোল্ড বেছে নেওয়ার সময় আপনি যে মেট্রিকগুলিকে অগ্রাধিকার দিতে চান তা নির্দিষ্ট সমস্যার খরচ, সুবিধা এবং ঝুঁকির উপর নির্ভর করে। স্প্যাম শ্রেণীবিভাগের উদাহরণে, এটি প্রায়শই স্প্যাম-লেবেলযুক্ত ইমেলগুলি প্রকৃতপক্ষে স্প্যাম কিনা তা নিশ্চিত করার চেষ্টা করে, কিছু ন্যূনতম নির্ভুলতার স্তরের উপরে, প্রত্যাহারকে অগ্রাধিকার দেওয়া, সমস্ত স্প্যাম ইমেলগুলিকে ধরা বা স্পষ্টতা প্রদান করা অর্থপূর্ণ।

মেট্রিক নির্দেশনা
নির্ভুলতা

সুষম ডেটাসেটের জন্য মডেল প্রশিক্ষণের অগ্রগতি/কভারজেন্সের মোটামুটি সূচক হিসাবে ব্যবহার করুন।

মডেল পারফরম্যান্সের জন্য, শুধুমাত্র অন্যান্য মেট্রিক্সের সাথে একত্রে ব্যবহার করুন।

ভারসাম্যহীন ডেটাসেটের জন্য এড়িয়ে চলুন। অন্য মেট্রিক ব্যবহার বিবেচনা করুন.

স্মরণ করুন
(সত্য ইতিবাচক হার)
মিথ্যা নেতিবাচক মিথ্যা ইতিবাচক তুলনায় আরো ব্যয়বহুল যখন ব্যবহার করুন.
মিথ্যা ইতিবাচক হার মিথ্যা ইতিবাচক মিথ্যা নেতিবাচক তুলনায় আরো ব্যয়বহুল যখন ব্যবহার করুন.
যথার্থতা ইতিবাচক ভবিষ্যদ্বাণী সঠিক হওয়ার জন্য যখন এটি খুবই গুরুত্বপূর্ণ তখন ব্যবহার করুন।

F1 স্কোর হল সুরেলা গড় (এক ধরনের গড়) নির্ভুলতা এবং স্মরণ।

গাণিতিকভাবে, এটি দ্বারা দেওয়া হয়:

F1=2precision * recallprecision + recall=2TP2TP + FP + FN

এই মেট্রিক নির্ভুলতা এবং স্মরণের গুরুত্বের ভারসাম্য বজায় রাখে এবং শ্রেণী-ভারসাম্যহীন ডেটাসেটের জন্য নির্ভুলতার চেয়ে পছন্দনীয়। যখন নির্ভুলতা এবং প্রত্যাহার উভয়ের নিখুঁত স্কোর 1.0 থাকে, তখন F1 এরও 1.0 এর নিখুঁত স্কোর থাকবে। আরও বিস্তৃতভাবে, যখন নির্ভুলতা এবং প্রত্যাহার মান কাছাকাছি হয়, তখন F1 তাদের মানের কাছাকাছি হবে। যখন নির্ভুলতা এবং প্রত্যাহার অনেক দূরে থাকে, তখন F1 যেটি খারাপ মেট্রিকের সাথে একই রকম হবে।

অনুশীলন: আপনার বোঝার পরীক্ষা করুন

একটি মডেল 5 TP, 6 TN, 3 FP, এবং 2 FN আউটপুট করে। প্রত্যাহার গণনা.
0.455
0.714
0.625
একটি মডেল 3 TP, 4 TN, 2 FP, এবং 1 FN আউটপুট করে। নির্ভুলতা গণনা করুন।
0.6
0.429
0.75
আপনি একটি বাইনারি ক্লাসিফায়ার তৈরি করছেন যা একটি বিপজ্জনক আক্রমণাত্মক প্রজাতির উপস্থিতি আছে কিনা তার জন্য পোকামাকড়ের ফাঁদের ফটোগুলি পরীক্ষা করে। যদি মডেলটি প্রজাতিটি সনাক্ত করে তবে কর্তব্যরত কীটবিজ্ঞানীকে (কীট বিজ্ঞানী) অবহিত করা হয়। এই পোকার প্রাথমিক সনাক্তকরণ একটি উপদ্রব প্রতিরোধের জন্য গুরুত্বপূর্ণ। একটি মিথ্যা অ্যালার্ম (ফলস ইতিবাচক) পরিচালনা করা সহজ: কীটতত্ত্ববিদ দেখেন যে ফটোটি ভুল শ্রেণীবদ্ধ করা হয়েছে এবং এটিকে এমনভাবে চিহ্নিত করে। একটি গ্রহণযোগ্য নির্ভুলতার স্তর অনুমান করে, এই মডেলটি কোন মেট্রিকের জন্য অপ্টিমাইজ করা উচিত?
স্মরণ করুন
যথার্থতা
মিথ্যা ইতিবাচক হার (FPR)