مجموعه داده ها، تعمیم و برازش بیش از حد

مقدمه

این ماژول با یک سوال اصلی شروع می شود. یکی از پاسخ های زیر را انتخاب کنید:

اگر بخواهید یکی از زمینه های زیر را در پروژه یادگیری ماشین خود اولویت بندی کنید، کدامیک بیشترین تأثیر را خواهد داشت؟
استفاده از یک تابع زیان هوشمندانه تر برای آموزش مدل خود
بهبود کیفیت مجموعه داده شما

و در اینجا یک سوال مهم تر وجود دارد:

حدس بزنید: در پروژه یادگیری ماشینی خود، معمولاً چقدر زمان برای آماده سازی و تبدیل داده ها صرف می کنید؟
کمتر از نیمی از زمان پروژه
بیش از نیمی از زمان پروژه

در این ماژول، درباره ویژگی‌های مجموعه داده‌های یادگیری ماشین، و نحوه آماده‌سازی داده‌های خود برای اطمینان از نتایج با کیفیت در هنگام آموزش و ارزیابی مدل، اطلاعات بیشتری کسب خواهید کرد.