Set data, generalisasi, dan overfit

Pengantar

Modul ini dimulai dengan pertanyaan utama. Pilih salah satu jawaban berikut:

Jika Anda harus memprioritaskan untuk memperbaiki salah satu area berikut dalam project machine learning Anda, yang akan memberikan dampak?
Menerapkan fungsi kerugian yang lebih cerdas untuk melatih model Anda
Meningkatkan kualitas set data Anda

Dan inilah pertanyaan yang jauh lebih penting:

Coba tebak: Dalam project machine learning Anda, berapa lama waktu yang biasanya Anda habiskan untuk persiapan dan transformasi data?
Kurang dari setengah waktu proyek
Lebih dari setengah waktu proyek

Dalam modul ini, Anda akan mempelajari lebih lanjut karakteristik machine learning {i>dataset<i}, dan cara mempersiapkan data Anda untuk memastikan hasil yang berkualitas tinggi. melatih dan mengevaluasi model Anda.