সমস্যাটা বুঝুন

সমস্যাটি বুঝতে, নিম্নলিখিত কাজগুলি সম্পাদন করুন:

  • আপনি যে পণ্যটি বিকাশ করছেন বা রিফ্যাক্টর করছেন তার লক্ষ্যটি বলুন।
  • ভবিষ্যদ্বাণীমূলক এমএল, জেনারেটিভ এআই, বা নন-এমএল সমাধান ব্যবহার করে লক্ষ্যটি সর্বোত্তম সমাধান করা হয়েছে কিনা তা নির্ধারণ করুন।
  • আপনি যদি একটি ভবিষ্যদ্বাণীমূলক ML পদ্ধতি ব্যবহার করেন তবে আপনার কাছে একটি মডেলকে প্রশিক্ষণের জন্য প্রয়োজনীয় ডেটা রয়েছে তা যাচাই করুন।

লক্ষ্য বলুন

নন-এমএল পদে আপনার লক্ষ্য উল্লেখ করে শুরু করুন। লক্ষ্য হল প্রশ্নের উত্তর, "আমি কী অর্জন করার চেষ্টা করছি?"

নিম্নোক্ত সারণীতে কাল্পনিক অ্যাপের লক্ষ্য স্পষ্টভাবে বলা হয়েছে:

আবেদন গোল
আবহাওয়া অ্যাপ একটি ভৌগলিক অঞ্চলের জন্য ছয়-ঘণ্টার বৃদ্ধিতে বৃষ্টিপাত গণনা করুন।
ফ্যাশন অ্যাপ বিভিন্ন শার্ট ডিজাইন তৈরি করুন।
ভিডিও অ্যাপ দরকারী ভিডিও সুপারিশ.
মেইল অ্যাপ স্প্যাম সনাক্ত করুন.
আর্থিক অ্যাপ একাধিক সংবাদ সূত্র থেকে আর্থিক তথ্য সংক্ষিপ্ত করুন।
মানচিত্র অ্যাপ্লিকেশন ভ্রমণের সময় গণনা করুন।
ব্যাংকিং অ্যাপ প্রতারণামূলক লেনদেন চিহ্নিত করুন।
ডাইনিং অ্যাপ একটি রেস্টুরেন্টের মেনু দ্বারা রন্ধনপ্রণালী সনাক্ত করুন.
ইকমার্স অ্যাপ সহায়ক উত্তর সহ পর্যালোচনার উত্তর দিন।

এমএল এর জন্য পরিষ্কার ব্যবহার কেস

কেউ কেউ ML কে একটি সার্বজনীন টুল হিসাবে দেখেন যা সমস্ত সমস্যার জন্য প্রয়োগ করা যেতে পারে। বাস্তবে, এমএল একটি বিশেষ সরঞ্জাম যা শুধুমাত্র বিশেষ সমস্যার জন্য উপযুক্ত। আপনি একটি জটিল এমএল সমাধান বাস্তবায়ন করতে চান না যখন একটি সহজ নন-এমএল সমাধান কাজ করবে।

এমএল সিস্টেমগুলিকে দুটি বিস্তৃত বিভাগে ভাগ করা যেতে পারে: ভবিষ্যদ্বাণীমূলক এমএল এবং জেনারেটিভ এআই । নিম্নলিখিত সারণী তাদের সংজ্ঞায়িত বৈশিষ্ট্য তালিকাভুক্ত করে:

ইনপুট আউটপুট প্রশিক্ষণ কৌশল
ভবিষ্যদ্বাণীমূলক এমএল পাঠ্য
ছবি
শ্রুতি
ভিডিও
সংখ্যাসূচক
একটি ভবিষ্যদ্বাণী করে, উদাহরণস্বরূপ, একটি ইমেলকে স্প্যাম হিসাবে শ্রেণীবদ্ধ করা বা স্প্যাম নয়, আগামীকালের বৃষ্টিপাত অনুমান করা, বা একটি স্টকের দামের পূর্বাভাস দেওয়া৷ আউটপুট সাধারণত বাস্তবতার বিরুদ্ধে যাচাই করা যেতে পারে। সাধারণত একটি নির্দিষ্ট কাজ সম্পাদন করার জন্য তত্ত্বাবধানে থাকা, তত্ত্বাবধানহীন, বা শক্তিবৃদ্ধি শেখার মডেলকে প্রশিক্ষণ দিতে প্রচুর ডেটা ব্যবহার করে।
জেনারেটিভ এআই পাঠ্য
ছবি
শ্রুতি
ভিডিও
সংখ্যাসূচক
ব্যবহারকারীর অভিপ্রায়ের উপর ভিত্তি করে আউটপুট তৈরি করে, উদাহরণস্বরূপ, একটি নিবন্ধ সংক্ষিপ্ত করা, বা একটি অডিও ক্লিপ বা ছোট ভিডিও তৈরি করা। অনুপস্থিত ডেটা পূরণ করার জন্য একটি বড় ভাষা মডেল বা চিত্র জেনারেটরকে প্রশিক্ষণ দিতে সাধারণত প্রচুর লেবেলবিহীন ডেটা ব্যবহার করে। মডেলটি তারপরে এমন কাজগুলির জন্য ব্যবহার করা যেতে পারে যেগুলিকে ফিল-ইন-দ্য-ফাঁকা কাজ হিসাবে ফ্রেম করা যেতে পারে, বা শ্রেণীবিভাগের মতো কিছু নির্দিষ্ট কাজের জন্য লেবেলযুক্ত ডেটাতে প্রশিক্ষণ দিয়ে এটিকে সূক্ষ্ম-টিউন করা যেতে পারে।

এমএল সঠিক পদ্ধতির বিষয়টি নিশ্চিত করতে, প্রথমে যাচাই করুন যে আপনার বর্তমান নন-এমএল সমাধানটি অপ্টিমাইজ করা হয়েছে। আপনার যদি একটি নন-এমএল সমাধান বাস্তবায়িত না থাকে, তাহলে হিউরিস্টিক ব্যবহার করে ম্যানুয়ালি সমস্যাটি সমাধান করার চেষ্টা করুন।

নন-এমএল সমাধান হল আপনার সমস্যার জন্য ML একটি ভাল ব্যবহারের ক্ষেত্রে কিনা তা নির্ধারণ করতে আপনি যে বেঞ্চমার্ক ব্যবহার করবেন। একটি এমএল ওয়ানের সাথে একটি নন-এমএল পদ্ধতির তুলনা করার সময় নিম্নলিখিত প্রশ্নগুলি বিবেচনা করুন:

  • গুণমান এমএল সমাধান কতটা ভালো হতে পারে বলে আপনি মনে করেন? আপনি যদি মনে করেন যে একটি এমএল সমাধান শুধুমাত্র একটি ছোট উন্নতি হতে পারে, তাহলে এটি নির্দেশ করতে পারে যে বর্তমান সমাধানটি সর্বোত্তম।

  • খরচ এবং রক্ষণাবেক্ষণ । স্বল্প এবং দীর্ঘমেয়াদী উভয় ক্ষেত্রেই এমএল সমাধান কতটা ব্যয়বহুল? কিছু ক্ষেত্রে, গণনা সংস্থান এবং এমএল বাস্তবায়নের জন্য সময়ের পরিপ্রেক্ষিতে এটি উল্লেখযোগ্যভাবে বেশি খরচ করে। নিম্নলিখিত প্রশ্ন বিবেচনা করুন:

    • এমএল সমাধান কি খরচ বৃদ্ধির ন্যায্যতা দিতে পারে? মনে রাখবেন যে বড় সিস্টেমে ছোট উন্নতিগুলি সহজেই একটি ML সমাধান বাস্তবায়নের খরচ এবং রক্ষণাবেক্ষণকে ন্যায্যতা দিতে পারে।
    • সমাধান কত রক্ষণাবেক্ষণ প্রয়োজন হবে? অনেক ক্ষেত্রে, ML বাস্তবায়নের জন্য দীর্ঘমেয়াদী রক্ষণাবেক্ষণের প্রয়োজন।
    • আপনার পণ্যের কি ML দক্ষতা সহ লোকেদের প্রশিক্ষণ বা নিয়োগে সহায়তা করার সংস্থান আছে?

আপনার বোঝার চেক করুন

কেন একটি ML সমাধান বিশ্লেষণ করার আগে একটি নন-এমএল সমাধান বা হিউরিস্টিক থাকা গুরুত্বপূর্ণ?
একটি নন-এমএল সমাধান হল একটি ML সমাধান পরিমাপের মানদণ্ড।
নন-এমএল সলিউশন আপনাকে একটি ML সলিউশনের খরচ কত হবে তা নির্ধারণ করতে সাহায্য করে।

ভবিষ্যদ্বাণীমূলক ML এবং ডেটা

ডেটা হল ভবিষ্যদ্বাণীমূলক ML এর চালিকা শক্তি। ভাল ভবিষ্যদ্বাণী করার জন্য, আপনার এমন ডেটার প্রয়োজন যাতে ভবিষ্যদ্বাণী করার ক্ষমতা সহ বৈশিষ্ট্য রয়েছে৷ আপনার ডেটাতে নিম্নলিখিত বৈশিষ্ট্য থাকা উচিত:

  • প্রচুর । আপনার ডেটাসেটে যত বেশি প্রাসঙ্গিক এবং দরকারী উদাহরণ, আপনার মডেল তত ভালো হবে।

  • সামঞ্জস্যপূর্ণ এবং নির্ভরযোগ্য । ধারাবাহিকভাবে এবং নির্ভরযোগ্যভাবে সংগ্রহ করা ডেটা থাকা একটি ভাল মডেল তৈরি করবে। উদাহরণস্বরূপ, একটি ML-ভিত্তিক আবহাওয়া মডেল একই নির্ভরযোগ্য যন্ত্র থেকে বহু বছর ধরে সংগৃহীত ডেটা থেকে উপকৃত হবে।

  • বিশ্বস্ত । আপনার ডেটা কোথা থেকে আসবে তা বুঝুন। ডেটা কি আপনি নিয়ন্ত্রণ করেন এমন বিশ্বস্ত উত্স থেকে হবে, যেমন আপনার পণ্যের লগ, নাকি অন্য ML সিস্টেমের আউটপুটের মতো আপনার কাছে খুব বেশি অন্তর্দৃষ্টি নেই এমন উত্স থেকে হবে?

  • উপলব্ধ নিশ্চিত করুন যে সমস্ত ইনপুট সঠিক বিন্যাসে ভবিষ্যদ্বাণীর সময়ে উপলব্ধ। ভবিষ্যদ্বাণীর সময় নির্দিষ্ট বৈশিষ্ট্যের মানগুলি পাওয়া কঠিন হলে, আপনার ডেটাসেটগুলি থেকে সেই বৈশিষ্ট্যগুলি বাদ দিন।

  • সঠিক । বড় ডেটাসেটে, এটা অনিবার্য যে কিছু লেবেলে ভুল মান থাকবে, কিন্তু যদি লেবেলের একটি ছোট শতাংশের বেশি ভুল হয়, তাহলে মডেলটি খারাপ ভবিষ্যদ্বাণী তৈরি করবে।

  • প্রতিনিধি । ডেটাসেটগুলি যথাসম্ভব বাস্তব জগতের প্রতিনিধি হওয়া উচিত। অন্য কথায়, ডেটাসেটগুলিকে সঠিকভাবে ইভেন্ট, ব্যবহারকারীর আচরণ এবং/অথবা বাস্তব জগতের ঘটনাগুলিকে মডেল করা উচিত। যখন মডেলটিকে বাস্তব-বিশ্বের ভবিষ্যদ্বাণী করতে বলা হয় তখন অপ্রতিনিধিত্বহীন ডেটাসেটের প্রশিক্ষণ খারাপ কার্যক্ষমতার কারণ হতে পারে।

আপনি যদি প্রয়োজনীয় বিন্যাসে আপনার প্রয়োজনীয় ডেটা পেতে না পারেন তবে আপনার মডেলটি খারাপ ভবিষ্যদ্বাণী করবে।

ভবিষ্যদ্বাণী করার ক্ষমতা

একটি মডেল ভালো ভবিষ্যদ্বাণী করার জন্য, আপনার ডেটাসেটের বৈশিষ্ট্যগুলির ভবিষ্যদ্বাণী করার ক্ষমতা থাকা উচিত৷ একটি বৈশিষ্ট্য একটি লেবেলের সাথে যত বেশি সম্পর্কযুক্ত, এটির পূর্বাভাস দেওয়ার সম্ভাবনা তত বেশি।

কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা থাকবে। উদাহরণস্বরূপ, একটি আবহাওয়া ডেটাসেটে, cloud_coverage , temperature এবং dew_point মতো বৈশিষ্ট্যগুলি moon_phase বা day_of_week চেয়ে বৃষ্টির ভাল পূর্বাভাস দেয়। ভিডিও অ্যাপের উদাহরণের জন্য, আপনি অনুমান করতে পারেন যে video_description , length এবং views মতো বৈশিষ্ট্যগুলি একটি ভাল ভবিষ্যদ্বাণীকারী হতে পারে যেগুলি একজন ব্যবহারকারী দেখতে চান৷

সচেতন থাকুন যে একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা পরিবর্তন হতে পারে কারণ প্রসঙ্গ বা ডোমেন পরিবর্তন হয়। উদাহরণস্বরূপ, ভিডিও অ্যাপে, upload_date এর মতো একটি বৈশিষ্ট্য—সাধারণভাবে—লেবেলের সাথে দুর্বলভাবে সম্পর্কযুক্ত হতে পারে। যাইহোক, গেমিং ভিডিওর সাব-ডোমেনে, upload_date লেবেলের সাথে দৃঢ়ভাবে সম্পর্কযুক্ত হতে পারে।

কোন বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা আছে তা নির্ধারণ করা একটি সময়সাপেক্ষ প্রক্রিয়া হতে পারে। আপনি ম্যানুয়ালি একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা অন্বেষণ করতে পারেন একটি মডেলকে প্রশিক্ষণের সময় এটিকে সরিয়ে এবং যোগ করে৷ আপনি পিয়ারসন পারস্পরিক সম্পর্ক , সামঞ্জস্যপূর্ণ পারস্পরিক তথ্য (AMI) এবং শ্যাপলি মান এর মতো অ্যালগরিদম ব্যবহার করে একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণীমূলক শক্তি খুঁজে বের করতে স্বয়ংক্রিয়ভাবে করতে পারেন, যা একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণীমূলক শক্তি বিশ্লেষণের জন্য একটি সংখ্যাসূচক মূল্যায়ন প্রদান করে।

আপনার বোঝার চেক করুন

আপনার ডেটাসেটগুলি বিশ্লেষণ করার সময়, তিনটি মূল বৈশিষ্ট্য কী আপনার সন্ধান করা উচিত?
বাস্তব জগতের প্রতিনিধি।
সঠিক মান রয়েছে।
বৈশিষ্ট্যগুলির লেবেলের জন্য ভবিষ্যদ্বাণী করার ক্ষমতা রয়েছে৷
স্থানীয় মেশিনে লোড করার জন্য যথেষ্ট ছোট।
বিভিন্ন অপ্রত্যাশিত উত্স থেকে সংগৃহীত।

আপনার ডেটাসেটগুলি বিশ্লেষণ এবং প্রস্তুত করার বিষয়ে আরও নির্দেশনার জন্য, মেশিন লার্নিংয়ের জন্য ডেটা প্রস্তুতি এবং বৈশিষ্ট্য ইঞ্জিনিয়ারিং দেখুন।

ভবিষ্যদ্বাণী বনাম কর্ম

আপনি যদি ভবিষ্যদ্বাণীটিকে এমন একটি ক্রিয়াতে পরিণত করতে না পারেন যা ব্যবহারকারীদের সাহায্য করে তবে কোনও কিছুর ভবিষ্যদ্বাণী করার কোনও মূল্য নেই৷ অর্থাৎ, আপনার পণ্যটি মডেলের আউটপুট থেকে পদক্ষেপ নেওয়া উচিত।

উদাহরণ স্বরূপ, একটি মডেল যা ভবিষ্যদ্বাণী করে যে ব্যবহারকারী একটি ভিডিওকে উপযোগী মনে করবেন কিনা সেটিকে এমন একটি অ্যাপে ফিড করা উচিত যা দরকারী ভিডিওগুলি সুপারিশ করে৷ একটি মডেল যা ভবিষ্যদ্বাণী করে যে বৃষ্টি হবে কিনা একটি আবহাওয়া অ্যাপে খাওয়ানো উচিত।

আপনার বোঝার চেক করুন

নিম্নলিখিত পরিস্থিতির উপর ভিত্তি করে, ML ব্যবহার করা সমস্যাটির সর্বোত্তম পদ্ধতি কিনা তা নির্ধারণ করুন।

একটি বড় প্রতিষ্ঠানের একটি ইঞ্জিনিয়ারিং দল ইনকামিং ফোন কল পরিচালনার জন্য দায়ী।

লক্ষ্য : বর্তমান কল ভলিউম অনুযায়ী কলকারীদের কতক্ষণ অপেক্ষা করতে হবে তা জানানো।

তাদের কাছে কোন সমাধান নেই, কিন্তু তারা মনে করে একটি হিউরিস্টিক হবে হোল্ডে থাকা গ্রাহকদের বর্তমান সংখ্যাকে ফোনের উত্তর দিচ্ছেন এমন কর্মীদের সংখ্যা দিয়ে ভাগ করা এবং তারপর 10 মিনিট দ্বারা গুণ করা। যাইহোক, তারা জানে যে কিছু গ্রাহকের সমস্যা দুই মিনিটের মধ্যে সমাধান হয়ে গেছে, অন্যরা 45 মিনিট বা তার বেশি সময় নিতে পারে।

তাদের হিউরিস্টিক সম্ভবত তাদের একটি সুনির্দিষ্ট যথেষ্ট সংখ্যা পাবে না। তারা নিম্নলিখিত কলামগুলির সাথে একটি ডেটাসেট তৈরি করতে পারে: number_of_callcenter_phones , user_issue , time_to_resolve , call_time , time_on_hold

এমএল ব্যবহার করুন । ইঞ্জিনিয়ারিং দলের একটি স্পষ্টভাবে সংজ্ঞায়িত লক্ষ্য আছে। তাদের হিউরিস্টিক তাদের ব্যবহারের ক্ষেত্রে যথেষ্ট ভাল হবে না। ডেটাসেটে লেবেলের জন্য ভবিষ্যদ্বাণীমূলক বৈশিষ্ট্য রয়েছে বলে মনে হচ্ছে, time_on_hold
ML ব্যবহার করবেন না । যদিও তাদের একটি সুস্পষ্টভাবে সংজ্ঞায়িত লক্ষ্য রয়েছে, তাদের প্রথমে একটি নন-এমএল সমাধান বাস্তবায়ন এবং অপ্টিমাইজ করা উচিত। এছাড়াও, তাদের ডেটাসেটে ভবিষ্যদ্বাণী করার ক্ষমতা সহ যথেষ্ট বৈশিষ্ট্য রয়েছে বলে মনে হচ্ছে না।