এই কোর্সটি ডেটাসেটের গুণমান থেকে চিন্তাভাবনা থেকে ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণ পর্যন্ত অনেক সাধারণ ডেটা ফাঁদের মধ্য দিয়ে হেঁটেছে।
এমএল অনুশীলনকারীদের জিজ্ঞাসা করা উচিত:
- আমি আমার ডেটাসেটের বৈশিষ্ট্য এবং সেই ডেটা যে শর্তে সংগ্রহ করা হয়েছিল তা কতটা ভালভাবে বুঝতে পারি?
- আমার ডেটাতে কোন গুণমান বা পক্ষপাতের সমস্যা বিদ্যমান? বিভ্রান্তিকর কারণ উপস্থিত?
- এই নির্দিষ্ট ডেটাসেটগুলি ব্যবহার করার ফলে কোন সম্ভাব্য ডাউনস্ট্রিম সমস্যাগুলি দেখা দিতে পারে?
- ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাস করে এমন একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়: মডেলটিকে যে ডেটাসেটে প্রশিক্ষণ দেওয়া হয় তাতে কি সমস্ত প্রাসঙ্গিক ভেরিয়েবল থাকে?
তাদের ফলাফল যাই হোক না কেন, এমএল অনুশীলনকারীদের সর্বদা নিশ্চিতকরণের পক্ষপাতিত্বের জন্য নিজেদের পরীক্ষা করা উচিত, তারপরে তাদের অন্তর্দৃষ্টি এবং সাধারণ জ্ঞানের বিরুদ্ধে তাদের অনুসন্ধানগুলি পরীক্ষা করা উচিত এবং যেখানেই ডেটার সাথে সাংঘর্ষিক তা তদন্ত করা উচিত।
অতিরিক্ত পড়া
কায়রো, আলবার্তো। চার্টগুলি কীভাবে মিথ্যা বলে: ভিজ্যুয়াল তথ্য সম্পর্কে আরও স্মার্ট হওয়া। NY: WW Norton, 2019।
হাফ, ড্যারেল। পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায়। NY: WW Norton, 1954।
মনমোনিয়ার, মার্ক। মানচিত্র সহ কিভাবে মিথ্যা, 3য় সংস্করণ. শিকাগো: ইউ অফ শিকাগো পি, 2018।
জোন্স, বেন। ডেটা পিটফল এড়ানো। হোবোকেন, এনজে: উইলি, 2020।
হুইলান, চার্লস। নগ্ন পরিসংখ্যান: ডেটা থেকে ভীতি দূর করা। NY: WW Norton, 2013
,এই কোর্সটি ডেটাসেটের গুণমান থেকে চিন্তাভাবনা থেকে ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণ পর্যন্ত অনেক সাধারণ ডেটা ফাঁদের মধ্য দিয়ে হেঁটেছে।
এমএল অনুশীলনকারীদের জিজ্ঞাসা করা উচিত:
- আমি আমার ডেটাসেটের বৈশিষ্ট্য এবং সেই ডেটা যে শর্তে সংগ্রহ করা হয়েছিল তা কতটা ভালভাবে বুঝতে পারি?
- আমার ডেটাতে কোন গুণমান বা পক্ষপাতের সমস্যা বিদ্যমান? বিভ্রান্তিকর কারণ উপস্থিত?
- এই নির্দিষ্ট ডেটাসেটগুলি ব্যবহার করার ফলে কোন সম্ভাব্য ডাউনস্ট্রিম সমস্যাগুলি দেখা দিতে পারে?
- ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাস করে এমন একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়: মডেলটিকে যে ডেটাসেটে প্রশিক্ষণ দেওয়া হয় তাতে কি সমস্ত প্রাসঙ্গিক ভেরিয়েবল থাকে?
তাদের ফলাফল যাই হোক না কেন, এমএল অনুশীলনকারীদের সর্বদা নিশ্চিতকরণের পক্ষপাতিত্বের জন্য নিজেদের পরীক্ষা করা উচিত, তারপরে তাদের অন্তর্দৃষ্টি এবং সাধারণ জ্ঞানের বিরুদ্ধে তাদের অনুসন্ধানগুলি পরীক্ষা করা উচিত এবং যেখানেই ডেটার সাথে সাংঘর্ষিক তা তদন্ত করা উচিত।
অতিরিক্ত পড়া
কায়রো, আলবার্তো। চার্টগুলি কীভাবে মিথ্যা বলে: ভিজ্যুয়াল তথ্য সম্পর্কে আরও স্মার্ট হওয়া। NY: WW Norton, 2019।
হাফ, ড্যারেল। পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায়। NY: WW Norton, 1954।
মনমোনিয়ার, মার্ক। মানচিত্র সহ কিভাবে মিথ্যা, 3য় সংস্করণ. শিকাগো: ইউ অফ শিকাগো পি, 2018।
জোন্স, বেন। ডেটা পিটফল এড়ানো। হোবোকেন, এনজে: উইলি, 2020।
হুইলান, চার্লস। নগ্ন পরিসংখ্যান: ডেটা থেকে ভীতি দূর করা। NY: WW Norton, 2013
,এই কোর্সটি ডেটাসেটের গুণমান থেকে চিন্তাভাবনা থেকে ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণ পর্যন্ত অনেক সাধারণ ডেটা ফাঁদের মধ্য দিয়ে হেঁটেছে।
এমএল অনুশীলনকারীদের জিজ্ঞাসা করা উচিত:
- আমি আমার ডেটাসেটের বৈশিষ্ট্য এবং সেই ডেটা যে শর্তে সংগ্রহ করা হয়েছিল তা কতটা ভালভাবে বুঝতে পারি?
- আমার ডেটাতে কোন গুণমান বা পক্ষপাতের সমস্যা বিদ্যমান? বিভ্রান্তিকর কারণ উপস্থিত?
- এই নির্দিষ্ট ডেটাসেটগুলি ব্যবহার করার ফলে কোন সম্ভাব্য ডাউনস্ট্রিম সমস্যাগুলি দেখা দিতে পারে?
- ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাস করে এমন একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়: মডেলটিকে যে ডেটাসেটে প্রশিক্ষণ দেওয়া হয় তাতে কি সমস্ত প্রাসঙ্গিক ভেরিয়েবল থাকে?
তাদের ফলাফল যাই হোক না কেন, এমএল অনুশীলনকারীদের সর্বদা নিশ্চিতকরণের পক্ষপাতিত্বের জন্য নিজেদের পরীক্ষা করা উচিত, তারপরে তাদের অন্তর্দৃষ্টি এবং সাধারণ জ্ঞানের বিরুদ্ধে তাদের অনুসন্ধানগুলি পরীক্ষা করা উচিত এবং যেখানেই ডেটার সাথে সাংঘর্ষিক তা তদন্ত করা উচিত।
অতিরিক্ত পড়া
কায়রো, আলবার্তো। চার্টগুলি কীভাবে মিথ্যা বলে: ভিজ্যুয়াল তথ্য সম্পর্কে আরও স্মার্ট হওয়া। NY: WW Norton, 2019।
হাফ, ড্যারেল। পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায়। NY: WW Norton, 1954।
মনমোনিয়ার, মার্ক। মানচিত্র সহ কিভাবে মিথ্যা, 3য় সংস্করণ. শিকাগো: ইউ অফ শিকাগো পি, 2018।
জোন্স, বেন। ডেটা পিটফল এড়ানো। হোবোকেন, এনজে: উইলি, 2020।
হুইলান, চার্লস। নগ্ন পরিসংখ্যান: ডেটা থেকে ভীতি দূর করা। NY: WW Norton, 2013
,এই কোর্সটি ডেটাসেটের গুণমান থেকে চিন্তাভাবনা থেকে ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণ পর্যন্ত অনেক সাধারণ ডেটা ফাঁদের মধ্য দিয়ে হেঁটেছে।
এমএল অনুশীলনকারীদের জিজ্ঞাসা করা উচিত:
- আমি আমার ডেটাসেটের বৈশিষ্ট্য এবং সেই ডেটা যে শর্তে সংগ্রহ করা হয়েছিল তা কতটা ভালভাবে বুঝতে পারি?
- আমার ডেটাতে কোন গুণমান বা পক্ষপাতের সমস্যা বিদ্যমান? বিভ্রান্তিকর কারণ উপস্থিত?
- এই নির্দিষ্ট ডেটাসেটগুলি ব্যবহার করার ফলে কোন সম্ভাব্য ডাউনস্ট্রিম সমস্যাগুলি দেখা দিতে পারে?
- ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাস করে এমন একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়: মডেলটিকে যে ডেটাসেটে প্রশিক্ষণ দেওয়া হয় তাতে কি সমস্ত প্রাসঙ্গিক ভেরিয়েবল থাকে?
তাদের ফলাফল যাই হোক না কেন, এমএল অনুশীলনকারীদের সর্বদা নিশ্চিতকরণের পক্ষপাতিত্বের জন্য নিজেদের পরীক্ষা করা উচিত, তারপরে তাদের অন্তর্দৃষ্টি এবং সাধারণ জ্ঞানের বিরুদ্ধে তাদের অনুসন্ধানগুলি পরীক্ষা করা উচিত এবং যেখানেই ডেটার সাথে সাংঘর্ষিক তা তদন্ত করা উচিত।
অতিরিক্ত পড়া
কায়রো, আলবার্তো। চার্টগুলি কীভাবে মিথ্যা বলে: ভিজ্যুয়াল তথ্য সম্পর্কে আরও স্মার্ট হওয়া। NY: WW Norton, 2019।
হাফ, ড্যারেল। পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায়। NY: WW Norton, 1954।
মনমোনিয়ার, মার্ক। মানচিত্র সহ কিভাবে মিথ্যা, 3য় সংস্করণ. শিকাগো: ইউ অফ শিকাগো পি, 2018।
জোন্স, বেন। ডেটা পিটফল এড়ানো। হোবোকেন, এনজে: উইলি, 2020।
হুইলান, চার্লস। নগ্ন পরিসংখ্যান: ডেটা থেকে ভীতি দূর করা। NY: WW Norton, 2013