নিম্নলিখিত প্রশ্নগুলি আপনাকে মূল ML ধারণাগুলির আপনার বোঝার দৃঢ় করতে সাহায্য করে।
ভবিষ্যদ্বাণী করার ক্ষমতা
তত্ত্বাবধানে থাকা এমএল মডেলগুলিকে লেবেলযুক্ত উদাহরণ সহ ডেটাসেট ব্যবহার করে প্রশিক্ষণ দেওয়া হয়। মডেল শিখে কিভাবে বৈশিষ্ট্য থেকে লেবেল ভবিষ্যদ্বাণী করতে হয়। যাইহোক, একটি ডেটাসেটের প্রতিটি বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা নেই। কিছু ক্ষেত্রে, শুধুমাত্র কয়েকটি বৈশিষ্ট্য লেবেলের ভবিষ্যদ্বাণী হিসাবে কাজ করে। নীচের ডেটাসেটে, লেবেল হিসাবে দাম এবং বৈশিষ্ট্য হিসাবে অবশিষ্ট কলামগুলি ব্যবহার করুন৷

আপনি কোন তিনটি বৈশিষ্ট্য সম্ভবত একটি গাড়ির দামের জন্য সবচেয়ে বড় ভবিষ্যদ্বাণী বলে মনে করেন?
মেক_মডেল, বছর, মাইল।
একটি গাড়ির মেক/মডেল, বছর এবং মাইল এর দামের জন্য সবচেয়ে শক্তিশালী ভবিষ্যদ্বাণী হতে পারে।
রঙ, উচ্চতা, মেক_মডেল।
একটি গাড়ির উচ্চতা এবং রঙ একটি গাড়ির দামের জন্য শক্তিশালী ভবিষ্যদ্বাণী করে না।
টায়ার_সাইজ, হুইল_বেস, বছর।
টায়ারের আকার এবং চাকার ভিত্তি একটি গাড়ির দামের জন্য শক্তিশালী ভবিষ্যদ্বাণীকারী নয়।
মাইলস, গিয়ারবক্স, মেক_মডেল।
গিয়ারবক্স মূল্যের একটি প্রধান ভবিষ্যদ্বাণীকারী নয়।
তত্ত্বাবধানে এবং তত্ত্বাবধানহীন শিক্ষা
সমস্যার উপর ভিত্তি করে, আপনি হয় একটি তত্ত্বাবধানে বা তত্ত্বাবধানহীন পদ্ধতি ব্যবহার করবেন। উদাহরণস্বরূপ, আপনি যে মান বা বিভাগটি পূর্বাভাস দিতে চান তা যদি আপনি আগে থেকেই জানেন তবে আপনি তত্ত্বাবধানে শিক্ষা ব্যবহার করবেন। যাইহোক, যদি আপনি জানতে চান যে আপনার ডেটাসেটে কোনো বিভাগ বা সংশ্লিষ্ট উদাহরণের গ্রুপিং রয়েছে, তাহলে আপনি তত্ত্বাবধানহীন শিক্ষা ব্যবহার করবেন।
ধরুন আপনার কাছে একটি অনলাইন শপিং ওয়েবসাইটের জন্য ব্যবহারকারীদের একটি ডেটাসেট ছিল এবং এতে নিম্নলিখিত কলামগুলি রয়েছে:

আপনি যদি সাইটটি ভিজিট করা ব্যবহারকারীদের ধরন বুঝতে চান, তাহলে আপনি কি তত্ত্বাবধানে বা তত্ত্বাবধানহীন শিক্ষা ব্যবহার করবেন?
তত্ত্বাবধান করা শিক্ষা কারণ আমি ভবিষ্যদ্বাণী করার চেষ্টা করছি কোন ব্যবহারকারী কোন শ্রেণীর অন্তর্গত।
তত্ত্বাবধানে শেখার ক্ষেত্রে, ডেটাসেটে অবশ্যই সেই লেবেল থাকতে হবে যা আপনি ভবিষ্যদ্বাণী করার চেষ্টা করছেন। ডেটাসেটে, এমন কোনও লেবেল নেই যা ব্যবহারকারীর একটি বিভাগকে বোঝায়।
তত্ত্বাবধানহীন শিক্ষা।
যেহেতু আমরা মডেলটি সম্পর্কিত গ্রাহকদের ক্লাস্টার গ্রুপ করতে চাই, তাই আমরা তত্ত্বাবধানহীন শিক্ষা ব্যবহার করব। মডেল ব্যবহারকারীদের ক্লাস্টার করার পরে, আমরা প্রতিটি ক্লাস্টারের জন্য আমাদের নিজস্ব নাম তৈরি করব, উদাহরণস্বরূপ, "ছাড় প্রার্থী", "ডিল হান্টারস," "সার্ফার", "অনুগত" এবং "ওয়ান্ডারার্স"।
ধরুন আপনার কাছে নিম্নলিখিত কলাম সহ বাড়ির জন্য একটি শক্তি ব্যবহারের ডেটাসেট আছে:

একটি নবনির্মিত বাড়ির জন্য প্রতি বছর ব্যবহৃত কিলোওয়াট ঘন্টার পূর্বাভাস দিতে আপনি কোন ধরনের ML ব্যবহার করবেন?
তত্ত্বাবধানহীন শিক্ষা।
তত্ত্বাবধানহীন শিক্ষা লেবেলবিহীন উদাহরণ ব্যবহার করে। এই উদাহরণে, "প্রতি বছর ব্যবহৃত কিলোওয়াট ঘন্টা" হবে লেবেল কারণ এটি সেই মান যা আপনি মডেলটি ভবিষ্যদ্বাণী করতে চান৷
তত্ত্বাবধানে শিক্ষা।
লেবেলযুক্ত উদাহরণগুলিতে তত্ত্বাবধান করা শেখার ট্রেনগুলি। এই ডেটাসেটে "প্রতি বছর ব্যবহৃত কিলোওয়াট ঘন্টা" লেবেল হবে কারণ এটি সেই মান যা আপনি মডেলটি ভবিষ্যদ্বাণী করতে চান৷ বৈশিষ্ট্যগুলি হবে "বর্গ ফুটেজ," "অবস্থান," এবং "বছর নির্মিত।"
ধরুন আপনার কাছে নিম্নলিখিত কলামগুলির সাথে একটি ফ্লাইট ডেটাসেট ছিল:

আপনি যদি কোচ টিকিটের মূল্য ভবিষ্যদ্বাণী করতে চান, আপনি কি রিগ্রেশন বা শ্রেণীবিভাগ ব্যবহার করবেন?
শ্রেণীবিভাগ
একটি শ্রেণিবিন্যাস মডেলের আউটপুট একটি পৃথক মান, সাধারণত একটি শব্দ। এই ক্ষেত্রে, একটি কোচ টিকিটের মূল্য একটি সংখ্যাসূচক মান।
রিগ্রেশন
একটি রিগ্রেশন মডেলের আউটপুট একটি সংখ্যাসূচক মান।
ডেটাসেটের উপর ভিত্তি করে, আপনি কি একটি কোচের টিকিটের মূল্যকে "উচ্চ", "গড়" বা "নিম্ন" হিসাবে শ্রেণীবদ্ধ করার জন্য একটি শ্রেণিবিন্যাস মডেলকে প্রশিক্ষণ দিতে পারেন?
না। শ্রেণিবিন্যাস মডেল শুধুমাত্র দুটি বিভাগের পূর্বাভাস দেয়, যেমন spam
বা not_spam
। এই মডেলটিকে তিনটি বিভাগের পূর্বাভাস দিতে হবে।
শ্রেণীবিভাগ মডেল একাধিক বিভাগ ভবিষ্যদ্বাণী করতে পারেন. তাদের বলা হয় মাল্টিক্লাস ক্লাসিফিকেশন মডেল।
হ্যাঁ, কিন্তু আমাদের প্রথমে coach_ticket_cost
কলামের সাংখ্যিক মানগুলিকে শ্রেণীগত মানগুলিতে রূপান্তর করতে হবে৷
ডেটাসেট থেকে একটি শ্রেণীবিভাগ মডেল তৈরি করা সম্ভব। আপনি নিম্নলিখিত মত কিছু করতে হবে:
- প্রস্থান বিমানবন্দর থেকে গন্তব্য বিমানবন্দরে একটি টিকিটের গড় মূল্য খুঁজুন।
- থ্রেশহোল্ডগুলি নির্ধারণ করুন যা "উচ্চ", "গড়" এবং "নিম্ন" গঠন করবে।
- থ্রেশহোল্ডের সাথে পূর্বাভাসিত খরচের তুলনা করুন এবং মানটি যে বিভাগে পড়ে তা আউটপুট করুন।
না। একটি শ্রেণীবিভাগ মডেল তৈরি করা সম্ভব নয়। coach_ticket_cost
মানগুলি সাংখ্যিক নয় শ্রেণীগত৷
একটু পরিশ্রম করে, আপনি একটি শ্রেণীবিভাগ মডেল তৈরি করতে পারেন।
প্রশিক্ষণ এবং মূল্যায়ন
আমরা একটি মডেলকে প্রশিক্ষণ দেওয়ার পরে, আমরা লেবেলযুক্ত উদাহরণ সহ একটি ডেটাসেট ব্যবহার করে এটিকে মূল্যায়ন করি এবং লেবেলের প্রকৃত মানের সাথে মডেলের পূর্বাভাসিত মান তুলনা করি।
প্রশ্নের জন্য দুটি সেরা উত্তর নির্বাচন করুন।
যদি মডেলের ভবিষ্যদ্বাণীগুলি অনেক দূরে থাকে, তাহলে সেগুলিকে আরও ভাল করতে আপনি কী করতে পারেন?
একটি ভিন্ন প্রশিক্ষণ পদ্ধতির চেষ্টা করুন। উদাহরণস্বরূপ, আপনি যদি তত্ত্বাবধানে থাকা পদ্ধতি ব্যবহার করেন, তাহলে একটি তত্ত্বাবধানহীন পদ্ধতির চেষ্টা করুন।
একটি ভিন্ন প্রশিক্ষণ পদ্ধতি ভাল ভবিষ্যদ্বাণী তৈরি করবে না।
মডেলটিকে পুনরায় প্রশিক্ষণ দিন, তবে শুধুমাত্র সেই বৈশিষ্ট্যগুলি ব্যবহার করুন যা আপনি বিশ্বাস করেন যে লেবেলের জন্য সবচেয়ে শক্তিশালী ভবিষ্যদ্বাণী করার ক্ষমতা রয়েছে৷
কম বৈশিষ্ট্য সহ মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়া, কিন্তু যেটির ভবিষ্যদ্বাণী করার ক্ষমতা বেশি, এমন একটি মডেল তৈরি করতে পারে যা আরও ভাল ভবিষ্যদ্বাণী করে।
একটি বড় এবং আরও বৈচিত্র্যময় ডেটাসেট ব্যবহার করে মডেলটিকে পুনরায় প্রশিক্ষণ দিন।
আরও উদাহরণ সহ ডেটাসেটের উপর প্রশিক্ষিত মডেলগুলি এবং মানগুলির বিস্তৃত পরিসর আরও ভাল ভবিষ্যদ্বাণী তৈরি করতে পারে কারণ মডেলটিতে বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্কের জন্য একটি ভাল সাধারণীকৃত সমাধান রয়েছে।
আপনি এমন একটি মডেল ঠিক করতে পারবেন না যার ভবিষ্যদ্বাণী অনেক দূরে।
এমন একটি মডেল ঠিক করা সম্ভব যার ভবিষ্যদ্বাণী বন্ধ। বেশিরভাগ মডেলের একাধিক রাউন্ড প্রশিক্ষণের প্রয়োজন হয় যতক্ষণ না তারা দরকারী ভবিষ্যদ্বাণী করে।
আপনি এখন আপনার ML যাত্রায় পরবর্তী পদক্ষেপ নিতে প্রস্তুত:
মানুষ + এআই গাইডবুক । আপনি যদি ML ব্যবহার করার জন্য Googlers, শিল্প বিশেষজ্ঞ এবং একাডেমিক গবেষণা দ্বারা উপস্থাপিত পদ্ধতি, সেরা অনুশীলন এবং উদাহরণগুলির একটি সেট খুঁজছেন।
সমস্যা ফ্রেমিং । আপনি যদি ML মডেল তৈরি করতে এবং পথ ধরে সাধারণ ক্ষতি এড়াতে একটি ক্ষেত্র-পরীক্ষিত পদ্ধতির সন্ধান করছেন।
মেশিন লার্নিং ক্র্যাশ কোর্স । আপনি যদি ML সম্বন্ধে আরও শেখার জন্য একটি গভীর এবং হাতে-কলমে পদ্ধতির জন্য প্রস্তুত হন।