তত্ত্বাবধান করা শিক্ষা

তত্ত্বাবধানে শিক্ষার কাজগুলি সু-সংজ্ঞায়িত করা হয়েছে এবং বিভিন্ন পরিস্থিতিতে প্রয়োগ করা যেতে পারে-যেমন স্প্যাম সনাক্ত করা বা বৃষ্টিপাতের পূর্বাভাস দেওয়া।

ভিত্তিগত তত্ত্বাবধানে শেখার ধারণা

তত্ত্বাবধানে মেশিন লার্নিং নিম্নলিখিত মূল ধারণাগুলির উপর ভিত্তি করে:

  • ডেটা
  • মডেল
  • প্রশিক্ষণ
  • মূল্যায়ন করছে
  • অনুমান

ডেটা

ডেটা হল ML এর চালিকা শক্তি। ডেটা টেবিলে সংরক্ষিত শব্দ এবং সংখ্যার আকারে বা ছবি এবং অডিও ফাইলগুলিতে ধারণ করা পিক্সেল এবং তরঙ্গরূপের মান হিসাবে আসে। আমরা ডেটাসেটে সম্পর্কিত ডেটা সংরক্ষণ করি। উদাহরণস্বরূপ, আমাদের নিম্নলিখিতগুলির একটি ডেটাসেট থাকতে পারে:

  • বিড়ালের ছবি
  • হাউজিং দাম
  • আবহাওয়ার তথ্য

ডেটাসেটগুলি স্বতন্ত্র উদাহরণ দিয়ে গঠিত যাতে বৈশিষ্ট্য এবং একটি লেবেল থাকে। আপনি একটি স্প্রেডশীটে একটি একক সারির অনুরূপ একটি উদাহরণ মনে করতে পারেন। বৈশিষ্ট্যগুলি হল সেই মানগুলি যা একটি তত্ত্বাবধানে থাকা মডেল লেবেলের পূর্বাভাস দিতে ব্যবহার করে৷ লেবেল হল "উত্তর" বা যে মানটি আমরা মডেলটি ভবিষ্যদ্বাণী করতে চাই। একটি আবহাওয়া মডেল যা বৃষ্টিপাতের পূর্বাভাস দেয়, বৈশিষ্ট্যগুলি হতে পারে অক্ষাংশ , দ্রাঘিমাংশ , তাপমাত্রা , আর্দ্রতা , মেঘের আবরণ , বাতাসের দিক এবং বায়ুমণ্ডলীয় চাপ । লেবেল হবে বৃষ্টিপাতের পরিমাণ

যে উদাহরণগুলিতে বৈশিষ্ট্য এবং একটি লেবেল উভয়ই রয়েছে তাকে লেবেলযুক্ত উদাহরণ বলা হয়।

দুটি লেবেল উদাহরণ

স্থানধারক চিত্র।

বিপরীতে, লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে, কিন্তু কোনো লেবেল নেই। আপনি একটি মডেল তৈরি করার পরে, মডেল বৈশিষ্ট্য থেকে লেবেল ভবিষ্যদ্বাণী করে।

দুটি লেবেলবিহীন উদাহরণ

স্থানধারক চিত্র।

ডেটাসেটের বৈশিষ্ট্য

একটি ডেটাসেট এর আকার এবং বৈচিত্র্য দ্বারা চিহ্নিত করা হয়। আকার উদাহরণের সংখ্যা নির্দেশ করে। বৈচিত্র্য সেই উদাহরণগুলির কভার পরিসীমা নির্দেশ করে৷ ভাল ডেটাসেটগুলি উভয়ই বড় এবং অত্যন্ত বৈচিত্র্যময়।

কিছু ডেটাসেট বড় এবং বৈচিত্র্যময়। যাইহোক, কিছু ডেটাসেট বড় কিন্তু বৈচিত্র্য কম, এবং কিছু ছোট কিন্তু অত্যন্ত বৈচিত্র্যপূর্ণ। অন্য কথায়, একটি বড় ডেটাসেট যথেষ্ট বৈচিত্র্যের গ্যারান্টি দেয় না, এবং একটি ডেটাসেট যা অত্যন্ত বৈচিত্র্যপূর্ণ তা যথেষ্ট উদাহরণের গ্যারান্টি দেয় না।

উদাহরণস্বরূপ, একটি ডেটাসেটে 100 বছরের মূল্যের ডেটা থাকতে পারে, তবে শুধুমাত্র জুলাই মাসের জন্য। জানুয়ারিতে বৃষ্টিপাতের পূর্বাভাস দিতে এই ডেটাসেট ব্যবহার করলে খারাপ ভবিষ্যদ্বাণী তৈরি হবে। বিপরীতভাবে, একটি ডেটাসেট শুধুমাত্র কয়েক বছর কভার করতে পারে তবে প্রতি মাসে ধারণ করতে পারে। এই ডেটাসেটটি খারাপ ভবিষ্যদ্বাণী তৈরি করতে পারে কারণ এতে পরিবর্তনশীলতার জন্য যথেষ্ট বছর থাকে না।

আপনার বোঝার পরীক্ষা করুন

একটি ডেটাসেটের কোন গুণাবলী ML এর জন্য ব্যবহার করা আদর্শ হবে?
বড় আকার / উচ্চ বৈচিত্র্য
ডেটার অন্তর্নিহিত প্যাটার্নগুলি বোঝার জন্য একটি মেশিন লার্নিং সিস্টেমের জন্য অনেকগুলি উদাহরণ যা বিভিন্ন ব্যবহারের ক্ষেত্রে কভার করে। এই ধরণের ডেটাসেটে প্রশিক্ষিত একটি মডেল নতুন ডেটাতে ভাল ভবিষ্যদ্বাণী করার সম্ভাবনা বেশি।
বড় আকার / কম বৈচিত্র্য
মেশিন লার্নিং মডেলগুলি তাদের প্রশিক্ষণের জন্য ব্যবহৃত উদাহরণগুলির মতোই ভাল। একটি মডেল অভিনব ডেটাতে দরিদ্র ভবিষ্যদ্বাণী তৈরি করবে যা এটি কখনও প্রশিক্ষিত হয়নি।
ছোট আকার / উচ্চ বৈচিত্র্য
বেশিরভাগ মডেল একটি ছোট ডেটাসেটে নির্ভরযোগ্য নিদর্শন খুঁজে পায় না। একটি বৃহত্তর ডেটাসেট প্রদান করে ভবিষ্যদ্বাণীগুলির আস্থার অভাব হবে৷
ছোট আকার / কম বৈচিত্র্য
যদি আপনার ডেটাসেট ছোট হয় এবং খুব বেশি ভিন্নতা না থাকে, তাহলে আপনি মেশিন লার্নিং থেকে উপকৃত নাও হতে পারেন।

একটি ডেটাসেট এর বৈশিষ্ট্যগুলির সংখ্যা দ্বারাও চিহ্নিত করা যেতে পারে। উদাহরণস্বরূপ, কিছু আবহাওয়া ডেটাসেটে শত শত বৈশিষ্ট্য থাকতে পারে, স্যাটেলাইট চিত্র থেকে ক্লাউড কভারেজ মান পর্যন্ত। অন্যান্য ডেটাসেটে আর্দ্রতা, বায়ুমণ্ডলীয় চাপ এবং তাপমাত্রার মতো মাত্র তিন বা চারটি বৈশিষ্ট্য থাকতে পারে। আরও বৈশিষ্ট্য সহ ডেটাসেটগুলি একটি মডেলকে অতিরিক্ত নিদর্শনগুলি আবিষ্কার করতে এবং আরও ভাল ভবিষ্যদ্বাণী করতে সহায়তা করতে পারে। যাইহোক, আরও বৈশিষ্ট্যযুক্ত ডেটাসেটগুলি সর্বদা এমন মডেল তৈরি করে না যা আরও ভাল ভবিষ্যদ্বাণী করে কারণ কিছু বৈশিষ্ট্যের লেবেলের সাথে কোনও কার্যকারণ সম্পর্ক থাকতে পারে না।

মডেল

তত্ত্বাবধানে শেখার ক্ষেত্রে, একটি মডেল হল সংখ্যার জটিল সংগ্রহ যা নির্দিষ্ট ইনপুট বৈশিষ্ট্য নিদর্শন থেকে নির্দিষ্ট আউটপুট লেবেল মানগুলির মধ্যে গাণিতিক সম্পর্ককে সংজ্ঞায়িত করে। মডেলটি প্রশিক্ষণের মাধ্যমে এই নিদর্শনগুলি আবিষ্কার করে।

প্রশিক্ষণ

একটি তত্ত্বাবধানে মডেল ভবিষ্যদ্বাণী করতে পারে আগে, এটি প্রশিক্ষিত করা আবশ্যক. একটি মডেলকে প্রশিক্ষণ দিতে, আমরা মডেলটিকে লেবেলযুক্ত উদাহরণ সহ একটি ডেটাসেট দিই। মডেলের লক্ষ্য হল বৈশিষ্ট্যগুলি থেকে লেবেলগুলির পূর্বাভাস দেওয়ার জন্য সর্বোত্তম সমাধান বের করা৷ মডেলটি লেবেলের প্রকৃত মানের সাথে তার পূর্বাভাসিত মান তুলনা করে সর্বোত্তম সমাধান খুঁজে পায়। ভবিষ্যদ্বাণী করা এবং প্রকৃত মানগুলির মধ্যে পার্থক্যের উপর ভিত্তি করে - ক্ষতি হিসাবে সংজ্ঞায়িত - মডেলটি ধীরে ধীরে তার সমাধান আপডেট করে৷ অন্য কথায়, মডেলটি বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শিখেছে যাতে এটি অদেখা ডেটাতে সেরা ভবিষ্যদ্বাণী করতে পারে।

উদাহরণস্বরূপ, যদি মডেলটি 1.15 inches বৃষ্টির পূর্বাভাস দেয়, কিন্তু প্রকৃত মান ছিল .75 inches , মডেলটি তার সমাধানটি পরিবর্তন করে তাই এর পূর্বাভাস .75 inches কাছাকাছি। মডেলটি ডেটাসেটের প্রতিটি উদাহরণের দিকে নজর দেওয়ার পরে - কিছু ক্ষেত্রে, একাধিকবার - এটি এমন একটি সমাধানে পৌঁছে যা প্রতিটি উদাহরণের জন্য গড়ে সর্বোত্তম ভবিষ্যদ্বাণী করে৷

নিম্নলিখিত একটি মডেল প্রশিক্ষণ প্রদর্শন করে:

  1. মডেলটি একটি একক লেবেলযুক্ত উদাহরণ নেয় এবং একটি ভবিষ্যদ্বাণী প্রদান করে।

    ভবিষ্যদ্বাণী করা একটি মডেলের একটি চিত্র৷

    চিত্র 1 । একটি এমএল মডেল একটি লেবেলযুক্ত উদাহরণ থেকে একটি ভবিষ্যদ্বাণী করছে৷

  2. মডেলটি তার পূর্বাভাসিত মানটিকে প্রকৃত মানের সাথে তুলনা করে এবং এর সমাধান আপডেট করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীকে প্রকৃত মূল্যের সাথে তুলনা করে।

    চিত্র 2 । একটি ML মডেল তার পূর্বাভাসিত মান আপডেট করছে।

  3. মডেলটি ডেটাসেটের প্রতিটি লেবেলযুক্ত উদাহরণের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীর প্রক্রিয়াটি বাস্তব মানের সাথে পুনরাবৃত্তি করছে৷

    চিত্র 3 । প্রশিক্ষণ ডেটাসেটে প্রতিটি লেবেলযুক্ত উদাহরণের জন্য একটি ML মডেল তার ভবিষ্যদ্বাণী আপডেট করছে।

এইভাবে, মডেল ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সঠিক সম্পর্ক শিখে। এই ধীরে ধীরে বোঝার কারণেই বড় এবং বৈচিত্র্যময় ডেটাসেটগুলি আরও ভাল মডেল তৈরি করে। মডেলটি মানগুলির বিস্তৃত পরিসরের সাথে আরও ডেটা দেখেছে এবং বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্কের বোঝার পরিমার্জন করেছে৷

প্রশিক্ষণের সময়, এমএল অনুশীলনকারীরা ভবিষ্যদ্বাণী করতে মডেল ব্যবহার করে কনফিগারেশন এবং বৈশিষ্ট্যগুলিতে সূক্ষ্ম সমন্বয় করতে পারে। উদাহরণস্বরূপ, কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা রাখে। অতএব, এমএল অনুশীলনকারীরা প্রশিক্ষণের সময় মডেলটি কোন বৈশিষ্ট্যগুলি ব্যবহার করবে তা নির্বাচন করতে পারে। উদাহরণস্বরূপ, ধরুন একটি আবহাওয়া ডেটাসেটে একটি বৈশিষ্ট্য হিসাবে time_of_day রয়েছে। এই ক্ষেত্রে, একজন এমএল অনুশীলনকারী প্রশিক্ষণের time_of_day যোগ বা অপসারণ করতে পারেন যাতে মডেলটি এটির সাথে বা ছাড়া আরও ভাল ভবিষ্যদ্বাণী করে কিনা।

মূল্যায়ন করছে

আমরা একটি প্রশিক্ষিত মডেল মূল্যায়ন করি এটি কতটা ভালভাবে শিখেছে তা নির্ধারণ করতে। যখন আমরা একটি মডেল মূল্যায়ন করি, আমরা একটি লেবেলযুক্ত ডেটাসেট ব্যবহার করি, কিন্তু আমরা শুধুমাত্র মডেলটিকে ডেটাসেটের বৈশিষ্ট্যগুলি দেই। তারপরে আমরা লেবেলের প্রকৃত মানগুলির সাথে মডেলের ভবিষ্যদ্বাণীগুলির তুলনা করি৷

একটি চিত্র যা একটি প্রশিক্ষিত মডেলকে প্রকৃত মানগুলির সাথে তুলনা করে তার ভবিষ্যদ্বাণীগুলি দেখাচ্ছে৷

চিত্র 4 । প্রকৃত মানের সাথে তার পূর্বাভাস তুলনা করে একটি ML মডেলের মূল্যায়ন করা।

মডেলের ভবিষ্যদ্বাণীগুলির উপর নির্ভর করে, আমরা বাস্তব-বিশ্বের অ্যাপ্লিকেশনে মডেল স্থাপন করার আগে আরও প্রশিক্ষণ এবং মূল্যায়ন করতে পারি।

আপনার বোঝার পরীক্ষা করুন

ভবিষ্যদ্বাণী করার আগে কেন একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার?
ডেটাসেটের বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শেখার জন্য একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার।
একটি মডেল প্রশিক্ষিত করা প্রয়োজন হয় না. বেশিরভাগ কম্পিউটারে মডেল পাওয়া যায়।
একটি মডেলকে প্রশিক্ষিত করতে হবে তাই ভবিষ্যদ্বাণী করতে ডেটার প্রয়োজন হবে না।

অনুমান

একবার আমরা মডেলের মূল্যায়নের ফলাফলে সন্তুষ্ট হলে, লেবেলবিহীন উদাহরণে আমরা ভবিষ্যদ্বাণী করতে মডেলটিকে ব্যবহার করতে পারি, যাকে অনুমান বলা হয়। ওয়েদার অ্যাপের উদাহরণে, আমরা মডেলটিকে বর্তমান আবহাওয়ার অবস্থা যেমন তাপমাত্রা, বায়ুমণ্ডলীয় চাপ এবং আপেক্ষিক আর্দ্রতা দিব—এবং এটি বৃষ্টিপাতের পরিমাণের পূর্বাভাস দেবে।

,

তত্ত্বাবধানে শিক্ষার কাজগুলি সু-সংজ্ঞায়িত করা হয়েছে এবং বিভিন্ন পরিস্থিতিতে প্রয়োগ করা যেতে পারে-যেমন স্প্যাম সনাক্ত করা বা বৃষ্টিপাতের পূর্বাভাস দেওয়া।

ভিত্তিগত তত্ত্বাবধানে শেখার ধারণা

তত্ত্বাবধানে মেশিন লার্নিং নিম্নলিখিত মূল ধারণাগুলির উপর ভিত্তি করে:

  • ডেটা
  • মডেল
  • প্রশিক্ষণ
  • মূল্যায়ন করছে
  • অনুমান

ডেটা

ডেটা হল ML এর চালিকা শক্তি। ডেটা টেবিলে সংরক্ষিত শব্দ এবং সংখ্যার আকারে বা ছবি এবং অডিও ফাইলগুলিতে ধারণ করা পিক্সেল এবং তরঙ্গরূপের মান হিসাবে আসে। আমরা ডেটাসেটে সম্পর্কিত ডেটা সংরক্ষণ করি। উদাহরণস্বরূপ, আমাদের নিম্নলিখিতগুলির একটি ডেটাসেট থাকতে পারে:

  • বিড়ালের ছবি
  • হাউজিং দাম
  • আবহাওয়ার তথ্য

ডেটাসেটগুলি স্বতন্ত্র উদাহরণ দিয়ে গঠিত যাতে বৈশিষ্ট্য এবং একটি লেবেল থাকে। আপনি একটি স্প্রেডশীটে একটি একক সারির অনুরূপ একটি উদাহরণ মনে করতে পারেন। বৈশিষ্ট্যগুলি হল সেই মানগুলি যা একটি তত্ত্বাবধানে থাকা মডেল লেবেলের পূর্বাভাস দিতে ব্যবহার করে৷ লেবেল হল "উত্তর" বা যে মানটি আমরা মডেলটি ভবিষ্যদ্বাণী করতে চাই। একটি আবহাওয়া মডেল যা বৃষ্টিপাতের পূর্বাভাস দেয়, বৈশিষ্ট্যগুলি হতে পারে অক্ষাংশ , দ্রাঘিমাংশ , তাপমাত্রা , আর্দ্রতা , মেঘের আবরণ , বাতাসের দিক এবং বায়ুমণ্ডলীয় চাপ । লেবেল হবে বৃষ্টিপাতের পরিমাণ

যে উদাহরণগুলিতে বৈশিষ্ট্য এবং একটি লেবেল উভয়ই রয়েছে তাকে লেবেলযুক্ত উদাহরণ বলা হয়।

দুটি লেবেল উদাহরণ

স্থানধারক চিত্র।

বিপরীতে, লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে, কিন্তু কোনো লেবেল নেই। আপনি একটি মডেল তৈরি করার পরে, মডেল বৈশিষ্ট্য থেকে লেবেল ভবিষ্যদ্বাণী করে।

দুটি লেবেলবিহীন উদাহরণ

স্থানধারক চিত্র।

ডেটাসেটের বৈশিষ্ট্য

একটি ডেটাসেট এর আকার এবং বৈচিত্র্য দ্বারা চিহ্নিত করা হয়। আকার উদাহরণের সংখ্যা নির্দেশ করে। বৈচিত্র্য সেই উদাহরণগুলির কভার পরিসীমা নির্দেশ করে৷ ভাল ডেটাসেটগুলি উভয়ই বড় এবং অত্যন্ত বৈচিত্র্যময়।

কিছু ডেটাসেট বড় এবং বৈচিত্র্যময়। যাইহোক, কিছু ডেটাসেট বড় কিন্তু বৈচিত্র্য কম, এবং কিছু ছোট কিন্তু অত্যন্ত বৈচিত্র্যপূর্ণ। অন্য কথায়, একটি বড় ডেটাসেট যথেষ্ট বৈচিত্র্যের গ্যারান্টি দেয় না, এবং একটি ডেটাসেট যা অত্যন্ত বৈচিত্র্যপূর্ণ তা যথেষ্ট উদাহরণের গ্যারান্টি দেয় না।

উদাহরণস্বরূপ, একটি ডেটাসেটে 100 বছরের মূল্যের ডেটা থাকতে পারে, তবে শুধুমাত্র জুলাই মাসের জন্য। জানুয়ারিতে বৃষ্টিপাতের পূর্বাভাস দিতে এই ডেটাসেট ব্যবহার করলে খারাপ ভবিষ্যদ্বাণী তৈরি হবে। বিপরীতভাবে, একটি ডেটাসেট শুধুমাত্র কয়েক বছর কভার করতে পারে তবে প্রতি মাসে ধারণ করতে পারে। এই ডেটাসেটটি খারাপ ভবিষ্যদ্বাণী তৈরি করতে পারে কারণ এতে পরিবর্তনশীলতার জন্য যথেষ্ট বছর থাকে না।

আপনার বোঝার পরীক্ষা করুন

একটি ডেটাসেটের কোন গুণাবলী ML এর জন্য ব্যবহার করা আদর্শ হবে?
বড় আকার / উচ্চ বৈচিত্র্য
ডেটার অন্তর্নিহিত প্যাটার্নগুলি বোঝার জন্য একটি মেশিন লার্নিং সিস্টেমের জন্য অনেকগুলি উদাহরণ যা বিভিন্ন ব্যবহারের ক্ষেত্রে কভার করে। এই ধরণের ডেটাসেটে প্রশিক্ষিত একটি মডেল নতুন ডেটাতে ভাল ভবিষ্যদ্বাণী করার সম্ভাবনা বেশি।
বড় আকার / কম বৈচিত্র্য
মেশিন লার্নিং মডেলগুলি তাদের প্রশিক্ষণের জন্য ব্যবহৃত উদাহরণগুলির মতোই ভাল। একটি মডেল অভিনব ডেটাতে দরিদ্র ভবিষ্যদ্বাণী তৈরি করবে যা এটি কখনও প্রশিক্ষিত হয়নি।
ছোট আকার / উচ্চ বৈচিত্র্য
বেশিরভাগ মডেল একটি ছোট ডেটাসেটে নির্ভরযোগ্য নিদর্শন খুঁজে পায় না। একটি বৃহত্তর ডেটাসেট প্রদান করে ভবিষ্যদ্বাণীগুলির আস্থার অভাব হবে৷
ছোট আকার / কম বৈচিত্র্য
যদি আপনার ডেটাসেট ছোট হয় এবং খুব বেশি ভিন্নতা না থাকে, তাহলে আপনি মেশিন লার্নিং থেকে উপকৃত নাও হতে পারেন।

একটি ডেটাসেট এর বৈশিষ্ট্যগুলির সংখ্যা দ্বারাও চিহ্নিত করা যেতে পারে। উদাহরণস্বরূপ, কিছু আবহাওয়া ডেটাসেটে শত শত বৈশিষ্ট্য থাকতে পারে, স্যাটেলাইট চিত্র থেকে ক্লাউড কভারেজ মান পর্যন্ত। অন্যান্য ডেটাসেটে আর্দ্রতা, বায়ুমণ্ডলীয় চাপ এবং তাপমাত্রার মতো মাত্র তিন বা চারটি বৈশিষ্ট্য থাকতে পারে। আরও বৈশিষ্ট্য সহ ডেটাসেটগুলি একটি মডেলকে অতিরিক্ত নিদর্শনগুলি আবিষ্কার করতে এবং আরও ভাল ভবিষ্যদ্বাণী করতে সহায়তা করতে পারে। যাইহোক, আরও বৈশিষ্ট্যযুক্ত ডেটাসেটগুলি সর্বদা এমন মডেল তৈরি করে না যা আরও ভাল ভবিষ্যদ্বাণী করে কারণ কিছু বৈশিষ্ট্যের লেবেলের সাথে কোনও কার্যকারণ সম্পর্ক থাকতে পারে না।

মডেল

তত্ত্বাবধানে শেখার ক্ষেত্রে, একটি মডেল হল সংখ্যার জটিল সংগ্রহ যা নির্দিষ্ট ইনপুট বৈশিষ্ট্য নিদর্শন থেকে নির্দিষ্ট আউটপুট লেবেল মানগুলির মধ্যে গাণিতিক সম্পর্ককে সংজ্ঞায়িত করে। মডেলটি প্রশিক্ষণের মাধ্যমে এই নিদর্শনগুলি আবিষ্কার করে।

প্রশিক্ষণ

একটি তত্ত্বাবধানে মডেল ভবিষ্যদ্বাণী করতে পারে আগে, এটি প্রশিক্ষিত করা আবশ্যক. একটি মডেলকে প্রশিক্ষণ দিতে, আমরা মডেলটিকে লেবেলযুক্ত উদাহরণ সহ একটি ডেটাসেট দিই। মডেলের লক্ষ্য হল বৈশিষ্ট্যগুলি থেকে লেবেলগুলির পূর্বাভাস দেওয়ার জন্য সর্বোত্তম সমাধান বের করা৷ মডেলটি লেবেলের প্রকৃত মানের সাথে তার পূর্বাভাসিত মান তুলনা করে সর্বোত্তম সমাধান খুঁজে পায়। ভবিষ্যদ্বাণী করা এবং প্রকৃত মানগুলির মধ্যে পার্থক্যের উপর ভিত্তি করে - ক্ষতি হিসাবে সংজ্ঞায়িত - মডেলটি ধীরে ধীরে তার সমাধান আপডেট করে৷ অন্য কথায়, মডেলটি বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শিখেছে যাতে এটি অদেখা ডেটাতে সেরা ভবিষ্যদ্বাণী করতে পারে।

উদাহরণস্বরূপ, যদি মডেলটি 1.15 inches বৃষ্টির পূর্বাভাস দেয়, কিন্তু প্রকৃত মান ছিল .75 inches , মডেলটি তার সমাধানটি পরিবর্তন করে তাই এর পূর্বাভাস .75 inches কাছাকাছি। মডেলটি ডেটাসেটের প্রতিটি উদাহরণের দিকে নজর দেওয়ার পরে - কিছু ক্ষেত্রে, একাধিকবার - এটি এমন একটি সমাধানে পৌঁছে যা প্রতিটি উদাহরণের জন্য গড়ে সর্বোত্তম ভবিষ্যদ্বাণী করে৷

নিম্নলিখিত একটি মডেল প্রশিক্ষণ প্রদর্শন করে:

  1. মডেলটি একটি একক লেবেলযুক্ত উদাহরণ নেয় এবং একটি ভবিষ্যদ্বাণী প্রদান করে।

    ভবিষ্যদ্বাণী করা একটি মডেলের একটি চিত্র৷

    চিত্র 1 । একটি এমএল মডেল একটি লেবেলযুক্ত উদাহরণ থেকে একটি ভবিষ্যদ্বাণী করছে৷

  2. মডেলটি তার পূর্বাভাসিত মানটিকে প্রকৃত মানের সাথে তুলনা করে এবং এর সমাধান আপডেট করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীকে প্রকৃত মূল্যের সাথে তুলনা করে।

    চিত্র 2 । একটি ML মডেল তার পূর্বাভাসিত মান আপডেট করছে।

  3. মডেলটি ডেটাসেটের প্রতিটি লেবেলযুক্ত উদাহরণের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীর প্রক্রিয়াটি বাস্তব মানের সাথে পুনরাবৃত্তি করছে৷

    চিত্র 3 । প্রশিক্ষণ ডেটাসেটে প্রতিটি লেবেলযুক্ত উদাহরণের জন্য একটি ML মডেল তার ভবিষ্যদ্বাণী আপডেট করছে।

এইভাবে, মডেল ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সঠিক সম্পর্ক শিখে। এই ধীরে ধীরে বোঝার কারণেই বড় এবং বৈচিত্র্যময় ডেটাসেটগুলি আরও ভাল মডেল তৈরি করে। মডেলটি মানগুলির বিস্তৃত পরিসরের সাথে আরও ডেটা দেখেছে এবং বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্কের বোঝার পরিমার্জন করেছে৷

প্রশিক্ষণের সময়, এমএল অনুশীলনকারীরা ভবিষ্যদ্বাণী করতে মডেল ব্যবহার করে কনফিগারেশন এবং বৈশিষ্ট্যগুলিতে সূক্ষ্ম সমন্বয় করতে পারে। উদাহরণস্বরূপ, কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা রাখে। অতএব, এমএল অনুশীলনকারীরা প্রশিক্ষণের সময় মডেলটি কোন বৈশিষ্ট্যগুলি ব্যবহার করবে তা নির্বাচন করতে পারে। উদাহরণস্বরূপ, ধরুন একটি আবহাওয়া ডেটাসেটে একটি বৈশিষ্ট্য হিসাবে time_of_day রয়েছে। এই ক্ষেত্রে, একজন এমএল অনুশীলনকারী প্রশিক্ষণের time_of_day যোগ বা অপসারণ করতে পারেন যাতে মডেলটি এটির সাথে বা ছাড়া আরও ভাল ভবিষ্যদ্বাণী করে কিনা।

মূল্যায়ন করছে

আমরা একটি প্রশিক্ষিত মডেল মূল্যায়ন করি এটি কতটা ভালভাবে শিখেছে তা নির্ধারণ করতে। যখন আমরা একটি মডেল মূল্যায়ন করি, আমরা একটি লেবেলযুক্ত ডেটাসেট ব্যবহার করি, কিন্তু আমরা শুধুমাত্র মডেলটিকে ডেটাসেটের বৈশিষ্ট্যগুলি দেই। তারপরে আমরা লেবেলের প্রকৃত মানগুলির সাথে মডেলের ভবিষ্যদ্বাণীগুলির তুলনা করি৷

একটি চিত্র যা একটি প্রশিক্ষিত মডেলকে প্রকৃত মানগুলির সাথে তুলনা করে তার ভবিষ্যদ্বাণীগুলি দেখাচ্ছে৷

চিত্র 4 । প্রকৃত মানের সাথে তার পূর্বাভাস তুলনা করে একটি ML মডেলের মূল্যায়ন করা।

মডেলের ভবিষ্যদ্বাণীগুলির উপর নির্ভর করে, আমরা বাস্তব-বিশ্বের অ্যাপ্লিকেশনে মডেল স্থাপন করার আগে আরও প্রশিক্ষণ এবং মূল্যায়ন করতে পারি।

আপনার বোঝার পরীক্ষা করুন

ভবিষ্যদ্বাণী করার আগে কেন একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার?
ডেটাসেটের বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শেখার জন্য একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার।
একটি মডেল প্রশিক্ষিত করা প্রয়োজন হয় না. বেশিরভাগ কম্পিউটারে মডেল পাওয়া যায়।
একটি মডেলকে প্রশিক্ষিত করতে হবে তাই ভবিষ্যদ্বাণী করতে ডেটার প্রয়োজন হবে না।

অনুমান

একবার আমরা মডেলের মূল্যায়নের ফলাফলে সন্তুষ্ট হলে, লেবেলবিহীন উদাহরণে আমরা ভবিষ্যদ্বাণী করতে মডেলটিকে ব্যবহার করতে পারি, যাকে অনুমান বলা হয়। ওয়েদার অ্যাপের উদাহরণে, আমরা মডেলটিকে বর্তমান আবহাওয়ার অবস্থা যেমন তাপমাত্রা, বায়ুমণ্ডলীয় চাপ এবং আপেক্ষিক আর্দ্রতা দিব—এবং এটি বৃষ্টিপাতের পরিমাণের পূর্বাভাস দেবে।

,

তত্ত্বাবধানে শিক্ষার কাজগুলি সু-সংজ্ঞায়িত করা হয়েছে এবং বিভিন্ন পরিস্থিতিতে প্রয়োগ করা যেতে পারে-যেমন স্প্যাম সনাক্ত করা বা বৃষ্টিপাতের পূর্বাভাস দেওয়া।

ভিত্তিগত তত্ত্বাবধানে শেখার ধারণা

তত্ত্বাবধানে মেশিন লার্নিং নিম্নলিখিত মূল ধারণাগুলির উপর ভিত্তি করে:

  • ডেটা
  • মডেল
  • প্রশিক্ষণ
  • মূল্যায়ন করছে
  • অনুমান

ডেটা

ডেটা হল ML এর চালিকা শক্তি। ডেটা টেবিলে সংরক্ষিত শব্দ এবং সংখ্যার আকারে বা ছবি এবং অডিও ফাইলগুলিতে ধারণ করা পিক্সেল এবং তরঙ্গরূপের মান হিসাবে আসে। আমরা ডেটাসেটে সম্পর্কিত ডেটা সংরক্ষণ করি। উদাহরণস্বরূপ, আমাদের নিম্নলিখিতগুলির একটি ডেটাসেট থাকতে পারে:

  • বিড়ালের ছবি
  • হাউজিং দাম
  • আবহাওয়ার তথ্য

ডেটাসেটগুলি স্বতন্ত্র উদাহরণ দিয়ে গঠিত যাতে বৈশিষ্ট্য এবং একটি লেবেল থাকে। আপনি একটি স্প্রেডশীটে একটি একক সারির অনুরূপ একটি উদাহরণ মনে করতে পারেন। বৈশিষ্ট্যগুলি হল সেই মানগুলি যা একটি তত্ত্বাবধানে থাকা মডেল লেবেলের পূর্বাভাস দিতে ব্যবহার করে৷ লেবেল হল "উত্তর" বা যে মানটি আমরা মডেলটি ভবিষ্যদ্বাণী করতে চাই। একটি আবহাওয়া মডেল যা বৃষ্টিপাতের পূর্বাভাস দেয়, বৈশিষ্ট্যগুলি হতে পারে অক্ষাংশ , দ্রাঘিমাংশ , তাপমাত্রা , আর্দ্রতা , মেঘের আবরণ , বাতাসের দিক এবং বায়ুমণ্ডলীয় চাপ । লেবেল হবে বৃষ্টিপাতের পরিমাণ

যে উদাহরণগুলিতে বৈশিষ্ট্য এবং একটি লেবেল উভয়ই রয়েছে তাকে লেবেলযুক্ত উদাহরণ বলা হয়।

দুটি লেবেল উদাহরণ

স্থানধারক চিত্র।

বিপরীতে, লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে, কিন্তু কোনো লেবেল নেই। আপনি একটি মডেল তৈরি করার পরে, মডেল বৈশিষ্ট্য থেকে লেবেল ভবিষ্যদ্বাণী করে।

দুটি লেবেলবিহীন উদাহরণ

স্থানধারক চিত্র।

ডেটাসেটের বৈশিষ্ট্য

একটি ডেটাসেট এর আকার এবং বৈচিত্র্য দ্বারা চিহ্নিত করা হয়। আকার উদাহরণের সংখ্যা নির্দেশ করে। বৈচিত্র্য সেই উদাহরণগুলির কভার পরিসীমা নির্দেশ করে৷ ভাল ডেটাসেটগুলি উভয়ই বড় এবং অত্যন্ত বৈচিত্র্যময়।

কিছু ডেটাসেট বড় এবং বৈচিত্র্যময়। যাইহোক, কিছু ডেটাসেট বড় কিন্তু বৈচিত্র্য কম, এবং কিছু ছোট কিন্তু অত্যন্ত বৈচিত্র্যপূর্ণ। অন্য কথায়, একটি বড় ডেটাসেট যথেষ্ট বৈচিত্র্যের গ্যারান্টি দেয় না, এবং একটি ডেটাসেট যা অত্যন্ত বৈচিত্র্যপূর্ণ তা যথেষ্ট উদাহরণের গ্যারান্টি দেয় না।

উদাহরণস্বরূপ, একটি ডেটাসেটে 100 বছরের মূল্যের ডেটা থাকতে পারে, তবে শুধুমাত্র জুলাই মাসের জন্য। জানুয়ারিতে বৃষ্টিপাতের পূর্বাভাস দিতে এই ডেটাসেট ব্যবহার করলে খারাপ ভবিষ্যদ্বাণী তৈরি হবে। বিপরীতভাবে, একটি ডেটাসেট শুধুমাত্র কয়েক বছর কভার করতে পারে তবে প্রতি মাসে ধারণ করতে পারে। এই ডেটাসেটটি খারাপ ভবিষ্যদ্বাণী তৈরি করতে পারে কারণ এতে পরিবর্তনশীলতার জন্য যথেষ্ট বছর থাকে না।

আপনার বোঝার পরীক্ষা করুন

একটি ডেটাসেটের কোন গুণাবলী ML এর জন্য ব্যবহার করা আদর্শ হবে?
বড় আকার / উচ্চ বৈচিত্র্য
ডেটার অন্তর্নিহিত প্যাটার্নগুলি বোঝার জন্য একটি মেশিন লার্নিং সিস্টেমের জন্য অনেকগুলি উদাহরণ যা বিভিন্ন ব্যবহারের ক্ষেত্রে কভার করে। এই ধরণের ডেটাসেটে প্রশিক্ষিত একটি মডেল নতুন ডেটাতে ভাল ভবিষ্যদ্বাণী করার সম্ভাবনা বেশি।
বড় আকার / কম বৈচিত্র্য
মেশিন লার্নিং মডেলগুলি তাদের প্রশিক্ষণের জন্য ব্যবহৃত উদাহরণগুলির মতোই ভাল। একটি মডেল অভিনব ডেটাতে দরিদ্র ভবিষ্যদ্বাণী তৈরি করবে যা এটি কখনও প্রশিক্ষিত হয়নি।
ছোট আকার / উচ্চ বৈচিত্র্য
বেশিরভাগ মডেল একটি ছোট ডেটাসেটে নির্ভরযোগ্য নিদর্শন খুঁজে পায় না। একটি বৃহত্তর ডেটাসেট প্রদান করে ভবিষ্যদ্বাণীগুলির আস্থার অভাব হবে৷
ছোট আকার / কম বৈচিত্র্য
যদি আপনার ডেটাসেট ছোট হয় এবং খুব বেশি ভিন্নতা না থাকে, তাহলে আপনি মেশিন লার্নিং থেকে উপকৃত নাও হতে পারেন।

একটি ডেটাসেট এর বৈশিষ্ট্যগুলির সংখ্যা দ্বারাও চিহ্নিত করা যেতে পারে। উদাহরণস্বরূপ, কিছু আবহাওয়া ডেটাসেটে শত শত বৈশিষ্ট্য থাকতে পারে, স্যাটেলাইট চিত্র থেকে ক্লাউড কভারেজ মান পর্যন্ত। অন্যান্য ডেটাসেটে আর্দ্রতা, বায়ুমণ্ডলীয় চাপ এবং তাপমাত্রার মতো মাত্র তিন বা চারটি বৈশিষ্ট্য থাকতে পারে। আরও বৈশিষ্ট্য সহ ডেটাসেটগুলি একটি মডেলকে অতিরিক্ত নিদর্শনগুলি আবিষ্কার করতে এবং আরও ভাল ভবিষ্যদ্বাণী করতে সহায়তা করতে পারে। যাইহোক, আরও বৈশিষ্ট্যযুক্ত ডেটাসেটগুলি সর্বদা এমন মডেল তৈরি করে না যা আরও ভাল ভবিষ্যদ্বাণী করে কারণ কিছু বৈশিষ্ট্যের লেবেলের সাথে কোনও কার্যকারণ সম্পর্ক থাকতে পারে না।

মডেল

তত্ত্বাবধানে শেখার ক্ষেত্রে, একটি মডেল হল সংখ্যার জটিল সংগ্রহ যা নির্দিষ্ট ইনপুট বৈশিষ্ট্য নিদর্শন থেকে নির্দিষ্ট আউটপুট লেবেল মানগুলির মধ্যে গাণিতিক সম্পর্ককে সংজ্ঞায়িত করে। মডেলটি প্রশিক্ষণের মাধ্যমে এই নিদর্শনগুলি আবিষ্কার করে।

প্রশিক্ষণ

একটি তত্ত্বাবধানে মডেল ভবিষ্যদ্বাণী করতে পারে আগে, এটি প্রশিক্ষিত করা আবশ্যক. একটি মডেলকে প্রশিক্ষণ দিতে, আমরা মডেলটিকে লেবেলযুক্ত উদাহরণ সহ একটি ডেটাসেট দিই। মডেলের লক্ষ্য হল বৈশিষ্ট্যগুলি থেকে লেবেলগুলির পূর্বাভাস দেওয়ার জন্য সর্বোত্তম সমাধান বের করা৷ মডেলটি লেবেলের প্রকৃত মানের সাথে তার পূর্বাভাসিত মান তুলনা করে সর্বোত্তম সমাধান খুঁজে পায়। ভবিষ্যদ্বাণী করা এবং প্রকৃত মানগুলির মধ্যে পার্থক্যের উপর ভিত্তি করে - ক্ষতি হিসাবে সংজ্ঞায়িত - মডেলটি ধীরে ধীরে তার সমাধান আপডেট করে৷ অন্য কথায়, মডেলটি বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শিখেছে যাতে এটি অদেখা ডেটাতে সেরা ভবিষ্যদ্বাণী করতে পারে।

উদাহরণস্বরূপ, যদি মডেলটি 1.15 inches বৃষ্টির পূর্বাভাস দেয়, কিন্তু প্রকৃত মান ছিল .75 inches , মডেলটি তার সমাধানটি পরিবর্তন করে তাই এর পূর্বাভাস .75 inches কাছাকাছি। মডেলটি ডেটাসেটের প্রতিটি উদাহরণের দিকে নজর দেওয়ার পরে - কিছু ক্ষেত্রে, একাধিকবার - এটি এমন একটি সমাধানে পৌঁছে যা প্রতিটি উদাহরণের জন্য গড়ে সর্বোত্তম ভবিষ্যদ্বাণী করে৷

নিম্নলিখিত একটি মডেল প্রশিক্ষণ প্রদর্শন করে:

  1. মডেলটি একটি একক লেবেলযুক্ত উদাহরণ নেয় এবং একটি ভবিষ্যদ্বাণী প্রদান করে।

    ভবিষ্যদ্বাণী করা একটি মডেলের একটি চিত্র৷

    চিত্র 1 । একটি এমএল মডেল একটি লেবেলযুক্ত উদাহরণ থেকে একটি ভবিষ্যদ্বাণী করছে৷

  2. মডেলটি তার পূর্বাভাসিত মানটিকে প্রকৃত মানের সাথে তুলনা করে এবং এর সমাধান আপডেট করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীকে প্রকৃত মূল্যের সাথে তুলনা করে।

    চিত্র 2 । একটি ML মডেল তার পূর্বাভাসিত মান আপডেট করছে।

  3. মডেলটি ডেটাসেটের প্রতিটি লেবেলযুক্ত উদাহরণের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীর প্রক্রিয়াটি বাস্তব মানের সাথে পুনরাবৃত্তি করছে৷

    চিত্র 3 । প্রশিক্ষণ ডেটাসেটে প্রতিটি লেবেলযুক্ত উদাহরণের জন্য একটি ML মডেল তার ভবিষ্যদ্বাণী আপডেট করছে।

এইভাবে, মডেল ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সঠিক সম্পর্ক শিখে। এই ধীরে ধীরে বোঝার কারণেই বড় এবং বৈচিত্র্যময় ডেটাসেটগুলি আরও ভাল মডেল তৈরি করে। মডেলটি মানগুলির বিস্তৃত পরিসরের সাথে আরও ডেটা দেখেছে এবং বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্কের বোঝার পরিমার্জন করেছে৷

প্রশিক্ষণের সময়, এমএল অনুশীলনকারীরা ভবিষ্যদ্বাণী করতে মডেল ব্যবহার করে কনফিগারেশন এবং বৈশিষ্ট্যগুলিতে সূক্ষ্ম সমন্বয় করতে পারে। উদাহরণস্বরূপ, কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা রাখে। অতএব, এমএল অনুশীলনকারীরা প্রশিক্ষণের সময় মডেলটি কোন বৈশিষ্ট্যগুলি ব্যবহার করবে তা নির্বাচন করতে পারে। উদাহরণস্বরূপ, ধরুন একটি আবহাওয়া ডেটাসেটে একটি বৈশিষ্ট্য হিসাবে time_of_day রয়েছে। এই ক্ষেত্রে, একজন এমএল অনুশীলনকারী প্রশিক্ষণের time_of_day যোগ বা অপসারণ করতে পারেন যাতে মডেলটি এটির সাথে বা ছাড়া আরও ভাল ভবিষ্যদ্বাণী করে কিনা।

মূল্যায়ন করছে

আমরা একটি প্রশিক্ষিত মডেল মূল্যায়ন করি এটি কতটা ভালভাবে শিখেছে তা নির্ধারণ করতে। যখন আমরা একটি মডেল মূল্যায়ন করি, আমরা একটি লেবেলযুক্ত ডেটাসেট ব্যবহার করি, কিন্তু আমরা শুধুমাত্র মডেলটিকে ডেটাসেটের বৈশিষ্ট্যগুলি দেই। তারপরে আমরা লেবেলের প্রকৃত মানগুলির সাথে মডেলের ভবিষ্যদ্বাণীগুলির তুলনা করি৷

একটি চিত্র যা একটি প্রশিক্ষিত মডেলকে প্রকৃত মানগুলির সাথে তুলনা করে তার ভবিষ্যদ্বাণীগুলি দেখাচ্ছে৷

চিত্র 4 । প্রকৃত মানের সাথে তার পূর্বাভাস তুলনা করে একটি ML মডেলের মূল্যায়ন করা।

মডেলের ভবিষ্যদ্বাণীগুলির উপর নির্ভর করে, আমরা বাস্তব-বিশ্বের অ্যাপ্লিকেশনে মডেল স্থাপন করার আগে আরও প্রশিক্ষণ এবং মূল্যায়ন করতে পারি।

আপনার বোঝার পরীক্ষা করুন

ভবিষ্যদ্বাণী করার আগে কেন একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার?
ডেটাসেটের বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শেখার জন্য একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার।
একটি মডেল প্রশিক্ষিত করা প্রয়োজন হয় না. বেশিরভাগ কম্পিউটারে মডেল পাওয়া যায়।
একটি মডেলকে প্রশিক্ষিত করতে হবে তাই ভবিষ্যদ্বাণী করতে ডেটার প্রয়োজন হবে না।

অনুমান

একবার আমরা মডেলের মূল্যায়নের ফলাফলে সন্তুষ্ট হলে, লেবেলবিহীন উদাহরণে আমরা ভবিষ্যদ্বাণী করতে মডেলটিকে ব্যবহার করতে পারি, যাকে অনুমান বলা হয়। ওয়েদার অ্যাপের উদাহরণে, আমরা মডেলটিকে বর্তমান আবহাওয়ার অবস্থা যেমন তাপমাত্রা, বায়ুমণ্ডলীয় চাপ এবং আপেক্ষিক আর্দ্রতা দিব—এবং এটি বৃষ্টিপাতের পরিমাণের পূর্বাভাস দেবে।

,

তত্ত্বাবধানে শিক্ষার কাজগুলি সু-সংজ্ঞায়িত করা হয়েছে এবং বিভিন্ন পরিস্থিতিতে প্রয়োগ করা যেতে পারে-যেমন স্প্যাম সনাক্ত করা বা বৃষ্টিপাতের পূর্বাভাস দেওয়া।

ভিত্তিগত তত্ত্বাবধানে শেখার ধারণা

তত্ত্বাবধানে মেশিন লার্নিং নিম্নলিখিত মূল ধারণাগুলির উপর ভিত্তি করে:

  • ডেটা
  • মডেল
  • প্রশিক্ষণ
  • মূল্যায়ন করছে
  • অনুমান

ডেটা

ডেটা হল ML এর চালিকা শক্তি। ডেটা টেবিলে সংরক্ষিত শব্দ এবং সংখ্যার আকারে বা ছবি এবং অডিও ফাইলগুলিতে ধারণ করা পিক্সেল এবং তরঙ্গরূপের মান হিসাবে আসে। আমরা ডেটাসেটে সম্পর্কিত ডেটা সংরক্ষণ করি। উদাহরণস্বরূপ, আমাদের নিম্নলিখিতগুলির একটি ডেটাসেট থাকতে পারে:

  • বিড়ালের ছবি
  • হাউজিং দাম
  • আবহাওয়ার তথ্য

ডেটাসেটগুলি স্বতন্ত্র উদাহরণ দিয়ে গঠিত যাতে বৈশিষ্ট্য এবং একটি লেবেল থাকে। আপনি একটি স্প্রেডশীটে একটি একক সারির অনুরূপ একটি উদাহরণ মনে করতে পারেন। বৈশিষ্ট্যগুলি হল সেই মানগুলি যা একটি তত্ত্বাবধানে থাকা মডেল লেবেলের পূর্বাভাস দিতে ব্যবহার করে৷ লেবেল হল "উত্তর" বা যে মানটি আমরা মডেলটি ভবিষ্যদ্বাণী করতে চাই। একটি আবহাওয়া মডেল যা বৃষ্টিপাতের পূর্বাভাস দেয়, বৈশিষ্ট্যগুলি হতে পারে অক্ষাংশ , দ্রাঘিমাংশ , তাপমাত্রা , আর্দ্রতা , মেঘের আবরণ , বাতাসের দিক এবং বায়ুমণ্ডলীয় চাপ । লেবেল হবে বৃষ্টিপাতের পরিমাণ

যে উদাহরণগুলিতে বৈশিষ্ট্য এবং একটি লেবেল উভয়ই রয়েছে তাকে লেবেলযুক্ত উদাহরণ বলা হয়।

দুটি লেবেল উদাহরণ

স্থানধারক চিত্র।

বিপরীতে, লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে, কিন্তু কোনো লেবেল নেই। আপনি একটি মডেল তৈরি করার পরে, মডেল বৈশিষ্ট্য থেকে লেবেল ভবিষ্যদ্বাণী করে।

দুটি লেবেলবিহীন উদাহরণ

স্থানধারক চিত্র।

ডেটাসেটের বৈশিষ্ট্য

একটি ডেটাসেট এর আকার এবং বৈচিত্র্য দ্বারা চিহ্নিত করা হয়। আকার উদাহরণের সংখ্যা নির্দেশ করে। বৈচিত্র্য সেই উদাহরণগুলির কভার পরিসীমা নির্দেশ করে৷ ভাল ডেটাসেটগুলি উভয়ই বড় এবং অত্যন্ত বৈচিত্র্যময়।

কিছু ডেটাসেট বড় এবং বৈচিত্র্যময়। যাইহোক, কিছু ডেটাসেট বড় কিন্তু বৈচিত্র্য কম, এবং কিছু ছোট কিন্তু অত্যন্ত বৈচিত্র্যপূর্ণ। অন্য কথায়, একটি বড় ডেটাসেট যথেষ্ট বৈচিত্র্যের গ্যারান্টি দেয় না, এবং একটি ডেটাসেট যা অত্যন্ত বৈচিত্র্যপূর্ণ তা যথেষ্ট উদাহরণের গ্যারান্টি দেয় না।

উদাহরণস্বরূপ, একটি ডেটাসেটে 100 বছরের মূল্যের ডেটা থাকতে পারে, তবে শুধুমাত্র জুলাই মাসের জন্য। জানুয়ারিতে বৃষ্টিপাতের পূর্বাভাস দিতে এই ডেটাসেট ব্যবহার করলে খারাপ ভবিষ্যদ্বাণী তৈরি হবে। বিপরীতভাবে, একটি ডেটাসেট শুধুমাত্র কয়েক বছর কভার করতে পারে তবে প্রতি মাসে ধারণ করতে পারে। এই ডেটাসেটটি খারাপ ভবিষ্যদ্বাণী তৈরি করতে পারে কারণ এতে পরিবর্তনশীলতার জন্য যথেষ্ট বছর থাকে না।

আপনার বোঝার পরীক্ষা করুন

একটি ডেটাসেটের কোন গুণাবলী ML এর জন্য ব্যবহার করা আদর্শ হবে?
বড় আকার / উচ্চ বৈচিত্র্য
ডেটার অন্তর্নিহিত প্যাটার্নগুলি বোঝার জন্য একটি মেশিন লার্নিং সিস্টেমের জন্য অনেকগুলি উদাহরণ যা বিভিন্ন ব্যবহারের ক্ষেত্রে কভার করে। এই ধরণের ডেটাসেটে প্রশিক্ষিত একটি মডেল নতুন ডেটাতে ভাল ভবিষ্যদ্বাণী করার সম্ভাবনা বেশি।
বড় আকার / কম বৈচিত্র্য
মেশিন লার্নিং মডেলগুলি তাদের প্রশিক্ষণের জন্য ব্যবহৃত উদাহরণগুলির মতোই ভাল। একটি মডেল অভিনব ডেটাতে দরিদ্র ভবিষ্যদ্বাণী তৈরি করবে যা এটি কখনও প্রশিক্ষিত হয়নি।
ছোট আকার / উচ্চ বৈচিত্র্য
বেশিরভাগ মডেল একটি ছোট ডেটাসেটে নির্ভরযোগ্য নিদর্শন খুঁজে পায় না। একটি বৃহত্তর ডেটাসেট প্রদান করে ভবিষ্যদ্বাণীগুলির আস্থার অভাব হবে৷
ছোট আকার / কম বৈচিত্র্য
যদি আপনার ডেটাসেট ছোট হয় এবং খুব বেশি ভিন্নতা না থাকে, তাহলে আপনি মেশিন লার্নিং থেকে উপকৃত নাও হতে পারেন।

একটি ডেটাসেট এর বৈশিষ্ট্যগুলির সংখ্যা দ্বারাও চিহ্নিত করা যেতে পারে। উদাহরণস্বরূপ, কিছু আবহাওয়া ডেটাসেটে শত শত বৈশিষ্ট্য থাকতে পারে, স্যাটেলাইট চিত্র থেকে ক্লাউড কভারেজ মান পর্যন্ত। অন্যান্য ডেটাসেটে আর্দ্রতা, বায়ুমণ্ডলীয় চাপ এবং তাপমাত্রার মতো মাত্র তিন বা চারটি বৈশিষ্ট্য থাকতে পারে। আরও বৈশিষ্ট্য সহ ডেটাসেটগুলি একটি মডেলকে অতিরিক্ত নিদর্শনগুলি আবিষ্কার করতে এবং আরও ভাল ভবিষ্যদ্বাণী করতে সহায়তা করতে পারে। যাইহোক, আরও বৈশিষ্ট্যযুক্ত ডেটাসেটগুলি সর্বদা এমন মডেল তৈরি করে না যা আরও ভাল ভবিষ্যদ্বাণী করে কারণ কিছু বৈশিষ্ট্যের লেবেলের সাথে কোনও কার্যকারণ সম্পর্ক থাকতে পারে না।

মডেল

তত্ত্বাবধানে শেখার ক্ষেত্রে, একটি মডেল হল সংখ্যার জটিল সংগ্রহ যা নির্দিষ্ট ইনপুট বৈশিষ্ট্য নিদর্শন থেকে নির্দিষ্ট আউটপুট লেবেল মানগুলির মধ্যে গাণিতিক সম্পর্ককে সংজ্ঞায়িত করে। মডেলটি প্রশিক্ষণের মাধ্যমে এই নিদর্শনগুলি আবিষ্কার করে।

প্রশিক্ষণ

একটি তত্ত্বাবধানে মডেল ভবিষ্যদ্বাণী করতে পারে আগে, এটি প্রশিক্ষিত করা আবশ্যক. একটি মডেলকে প্রশিক্ষণ দিতে, আমরা মডেলটিকে লেবেলযুক্ত উদাহরণ সহ একটি ডেটাসেট দিই। মডেলের লক্ষ্য হল বৈশিষ্ট্যগুলি থেকে লেবেলগুলির পূর্বাভাস দেওয়ার জন্য সর্বোত্তম সমাধান বের করা৷ মডেলটি লেবেলের প্রকৃত মানের সাথে তার পূর্বাভাসিত মান তুলনা করে সর্বোত্তম সমাধান খুঁজে পায়। ভবিষ্যদ্বাণী করা এবং প্রকৃত মানগুলির মধ্যে পার্থক্যের উপর ভিত্তি করে - ক্ষতি হিসাবে সংজ্ঞায়িত - মডেলটি ধীরে ধীরে তার সমাধান আপডেট করে৷ অন্য কথায়, মডেলটি বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শিখেছে যাতে এটি অদেখা ডেটাতে সেরা ভবিষ্যদ্বাণী করতে পারে।

উদাহরণস্বরূপ, যদি মডেলটি 1.15 inches বৃষ্টির পূর্বাভাস দেয়, কিন্তু প্রকৃত মান ছিল .75 inches , মডেলটি তার সমাধানটি পরিবর্তন করে তাই এর পূর্বাভাস .75 inches কাছাকাছি। মডেলটি ডেটাসেটের প্রতিটি উদাহরণের দিকে নজর দেওয়ার পরে - কিছু ক্ষেত্রে, একাধিকবার - এটি এমন একটি সমাধানে পৌঁছে যা প্রতিটি উদাহরণের জন্য গড়ে সর্বোত্তম ভবিষ্যদ্বাণী করে৷

নিম্নলিখিত একটি মডেল প্রশিক্ষণ প্রদর্শন করে:

  1. মডেলটি একটি একক লেবেলযুক্ত উদাহরণ নেয় এবং একটি ভবিষ্যদ্বাণী প্রদান করে।

    ভবিষ্যদ্বাণী করা একটি মডেলের একটি চিত্র৷

    চিত্র 1 । একটি এমএল মডেল একটি লেবেলযুক্ত উদাহরণ থেকে একটি ভবিষ্যদ্বাণী করছে৷

  2. মডেলটি তার পূর্বাভাসিত মানটিকে প্রকৃত মানের সাথে তুলনা করে এবং এর সমাধান আপডেট করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীকে প্রকৃত মূল্যের সাথে তুলনা করে।

    চিত্র 2 । একটি ML মডেল তার পূর্বাভাসিত মান আপডেট করছে।

  3. মডেলটি ডেটাসেটের প্রতিটি লেবেলযুক্ত উদাহরণের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করে।

    একটি মডেলের একটি চিত্র যা তার ভবিষ্যদ্বাণীর প্রক্রিয়াটি বাস্তব মানের সাথে পুনরাবৃত্তি করছে৷

    চিত্র 3 । প্রশিক্ষণ ডেটাসেটে প্রতিটি লেবেলযুক্ত উদাহরণের জন্য একটি ML মডেল তার ভবিষ্যদ্বাণী আপডেট করছে।

এইভাবে, মডেল ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সঠিক সম্পর্ক শিখে। এই ধীরে ধীরে বোঝার কারণেই বড় এবং বৈচিত্র্যময় ডেটাসেটগুলি আরও ভাল মডেল তৈরি করে। মডেলটি মানগুলির বিস্তৃত পরিসরের সাথে আরও ডেটা দেখেছে এবং বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্কের বোঝার পরিমার্জন করেছে৷

প্রশিক্ষণের সময়, এমএল অনুশীলনকারীরা ভবিষ্যদ্বাণী করতে মডেল ব্যবহার করে কনফিগারেশন এবং বৈশিষ্ট্যগুলিতে সূক্ষ্ম সমন্বয় করতে পারে। উদাহরণস্বরূপ, কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা রাখে। অতএব, এমএল অনুশীলনকারীরা প্রশিক্ষণের সময় মডেলটি কোন বৈশিষ্ট্যগুলি ব্যবহার করবে তা নির্বাচন করতে পারে। উদাহরণস্বরূপ, ধরুন একটি আবহাওয়া ডেটাসেটে একটি বৈশিষ্ট্য হিসাবে time_of_day রয়েছে। এই ক্ষেত্রে, একজন এমএল অনুশীলনকারী প্রশিক্ষণের time_of_day যোগ বা অপসারণ করতে পারেন যাতে মডেলটি এটির সাথে বা ছাড়া আরও ভাল ভবিষ্যদ্বাণী করে কিনা।

মূল্যায়ন করছে

আমরা একটি প্রশিক্ষিত মডেল মূল্যায়ন করি এটি কতটা ভালভাবে শিখেছে তা নির্ধারণ করতে। যখন আমরা একটি মডেল মূল্যায়ন করি, আমরা একটি লেবেলযুক্ত ডেটাসেট ব্যবহার করি, কিন্তু আমরা শুধুমাত্র মডেলটিকে ডেটাসেটের বৈশিষ্ট্যগুলি দেই। তারপরে আমরা লেবেলের প্রকৃত মানগুলির সাথে মডেলের ভবিষ্যদ্বাণীগুলির তুলনা করি৷

একটি চিত্র যা একটি প্রশিক্ষিত মডেলকে প্রকৃত মানগুলির সাথে তুলনা করে তার ভবিষ্যদ্বাণীগুলি দেখাচ্ছে৷

চিত্র 4 । প্রকৃত মানের সাথে তার পূর্বাভাস তুলনা করে একটি ML মডেলের মূল্যায়ন করা।

মডেলের ভবিষ্যদ্বাণীগুলির উপর নির্ভর করে, আমরা বাস্তব-বিশ্বের অ্যাপ্লিকেশনে মডেল স্থাপন করার আগে আরও প্রশিক্ষণ এবং মূল্যায়ন করতে পারি।

আপনার বোঝার পরীক্ষা করুন

ভবিষ্যদ্বাণী করার আগে কেন একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার?
ডেটাসেটের বৈশিষ্ট্য এবং লেবেলের মধ্যে গাণিতিক সম্পর্ক শেখার জন্য একটি মডেলকে প্রশিক্ষণ দেওয়া দরকার।
একটি মডেল প্রশিক্ষিত করা প্রয়োজন হয় না. বেশিরভাগ কম্পিউটারে মডেল পাওয়া যায়।
একটি মডেলকে প্রশিক্ষিত করতে হবে তাই ভবিষ্যদ্বাণী করতে ডেটার প্রয়োজন হবে না।

অনুমান

একবার আমরা মডেলের মূল্যায়নের ফলাফলে সন্তুষ্ট হলে, লেবেলবিহীন উদাহরণে আমরা ভবিষ্যদ্বাণী করতে মডেলটিকে ব্যবহার করতে পারি, যাকে অনুমান বলা হয়। ওয়েদার অ্যাপের উদাহরণে, আমরা মডেলটিকে বর্তমান আবহাওয়ার অবস্থা যেমন তাপমাত্রা, বায়ুমণ্ডলীয় চাপ এবং আপেক্ষিক আর্দ্রতা দিব—এবং এটি বৃষ্টিপাতের পরিমাণের পূর্বাভাস দেবে।