সারসংক্ষেপ

এই কোর্সটি ডেটাসেটের গুণমান থেকে চিন্তাভাবনা থেকে ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণ পর্যন্ত অনেক সাধারণ ডেটা ফাঁদের মধ্য দিয়ে হেঁটেছে।

এমএল অনুশীলনকারীদের জিজ্ঞাসা করা উচিত:

  • আমি আমার ডেটাসেটের বৈশিষ্ট্য এবং সেই ডেটা যে শর্তে সংগ্রহ করা হয়েছিল তা কতটা ভালভাবে বুঝতে পারি?
  • আমার ডেটাতে কোন গুণমান বা পক্ষপাতের সমস্যা বিদ্যমান? বিভ্রান্তিকর কারণ উপস্থিত?
  • এই নির্দিষ্ট ডেটাসেটগুলি ব্যবহার করার ফলে কোন সম্ভাব্য ডাউনস্ট্রিম সমস্যাগুলি দেখা দিতে পারে?
  • ভবিষ্যদ্বাণী বা শ্রেণিবিন্যাস করে এমন একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়: মডেলটিকে যে ডেটাসেটে প্রশিক্ষণ দেওয়া হয় তাতে কি সমস্ত প্রাসঙ্গিক ভেরিয়েবল থাকে?

তাদের ফলাফল যাই হোক না কেন, এমএল অনুশীলনকারীদের সর্বদা নিশ্চিতকরণের পক্ষপাতিত্বের জন্য নিজেদের পরীক্ষা করা উচিত, তারপরে তাদের অন্তর্দৃষ্টি এবং সাধারণ জ্ঞানের বিরুদ্ধে তাদের অনুসন্ধানগুলি পরীক্ষা করা উচিত এবং যেখানেই ডেটার সাথে সাংঘর্ষিক তা তদন্ত করা উচিত।

হিসেবে চিহ্নিত করুন

অতিরিক্ত পড়া

কায়রো, আলবার্তো। চার্টগুলি কীভাবে মিথ্যা বলে: ভিজ্যুয়াল তথ্য সম্পর্কে আরও স্মার্ট হওয়া। NY: WW Norton, 2019।

হাফ, ড্যারেল। পরিসংখ্যানের সাথে কীভাবে মিথ্যা বলা যায়। NY: WW Norton, 1954।

মনমোনিয়ার, মার্ক। মানচিত্র সহ কিভাবে মিথ্যা, 3য় সংস্করণ. শিকাগো: ইউ অফ শিকাগো পি, 2018।

জোন্স, বেন। ডেটা পিটফল এড়ানো। হোবোকেন, এনজে: উইলি, 2020।

হুইলান, চার্লস। নগ্ন পরিসংখ্যান: ডেটা থেকে ভীতি দূর করা। NY: WW Norton, 2013