শ্রেণীবিভাগ: থ্রেশহোল্ডিং

লজিস্টিক রিগ্রেশন একটি সম্ভাব্যতা প্রদান করে। আপনি প্রত্যাবর্তিত সম্ভাব্যতা "যেমন আছে" ব্যবহার করতে পারেন (উদাহরণস্বরূপ, ব্যবহারকারী এই বিজ্ঞাপনটিতে ক্লিক করার সম্ভাবনা 0.00023) বা ফেরত সম্ভাব্যতাকে একটি বাইনারি মানতে রূপান্তর করতে পারেন (উদাহরণস্বরূপ, এই ইমেলটি স্প্যাম)।

একটি লজিস্টিক রিগ্রেশন মডেল যা একটি নির্দিষ্ট ইমেল বার্তার জন্য 0.9995 রিটার্ন করে তা ভবিষ্যদ্বাণী করছে যে এটি স্প্যাম হওয়ার সম্ভাবনা খুব বেশি। বিপরীতভাবে, একই লজিস্টিক রিগ্রেশন মডেলে 0.0003 এর পূর্বাভাস স্কোর সহ আরেকটি ইমেল বার্তা সম্ভবত স্প্যাম নয়। যাইহোক, 0.6 এর ভবিষ্যদ্বাণী স্কোর সহ একটি ইমেল বার্তার কী হবে? একটি বাইনারি বিভাগে একটি লজিস্টিক রিগ্রেশন মান ম্যাপ করার জন্য, আপনাকে অবশ্যই একটি শ্রেণিবিন্যাস থ্রেশহোল্ড সংজ্ঞায়িত করতে হবে (এটিকে সিদ্ধান্ত থ্রেশহোল্ডও বলা হয়)। সেই থ্রেশহোল্ডের উপরে একটি মান "স্প্যাম" নির্দেশ করে; নীচের একটি মান নির্দেশ করে "স্প্যাম নয়।" এটা অনুমান করা লোভনীয় যে শ্রেণীবিভাগের থ্রেশহোল্ড সর্বদা 0.5 হওয়া উচিত, কিন্তু থ্রেশহোল্ডগুলি সমস্যা-নির্ভর, এবং সেইজন্য মান যা আপনাকে অবশ্যই টিউন করতে হবে।

নিম্নলিখিত বিভাগগুলি একটি শ্রেণীবিন্যাস মডেলের ভবিষ্যদ্বাণীগুলির মূল্যায়ন করতে এবং সেইসাথে এই ভবিষ্যদ্বাণীগুলির উপর শ্রেণিবিন্যাসের থ্রেশহোল্ড পরিবর্তনের প্রভাব মূল্যায়ন করতে আপনি যে মেট্রিকগুলি ব্যবহার করতে পারেন সেগুলিকে ঘনিষ্ঠভাবে দেখে।