Set data, generalisasi, dan overfitting: Uji Pengetahuan Anda

  1. Dari pilihan berikut ini, manakah yang merupakan contoh {i>dataset

  2. Anda bersiap untuk melatih model untuk memprediksi harga promo mobil bekas menggunakan set data yang berisi fitur berikut: year, model, dan mileage. Saat Anda memeriksa {i>dataset<i}, Anda menemukan bahwa nilai jarak tempuh hilang untuk 150 dari 2.500 contoh. Manakah dari opsi berikut yang merupakan tindakan wajar yang dapat diambil? (Pilih semua yang sesuai)

    Pilih sebanyak mungkin jawaban yang Anda inginkan.

  3. Anda sedang melatih model rekomendasi film layanan streaming untuk memprediksi apakah pengguna akan menikmati film tertentu atau tidak. Manakah dari berikut ini yang akan menjadi label {i>proxy

    Pilih sebanyak mungkin jawaban yang Anda inginkan.

  4. Benar atau Salah: Melatih model Anda hingga mencapai nilai kerugian yang rendah pada data pengujian Anda adalah cara yang baik untuk mencegah overfitting.

  5. Isi bagian yang kosong dalam kalimat berikut:
    Regularisasi meningkatkan kemampuan model Anda untuk melakukan generalisasi terhadap data baru dengan memberikan sanksi terhadap ___ selama pelatihan.