Melintasi lebih dari satu?
Sebelum Anda menonton video atau membaca dokumentasi, selesaikan
latihan ini yang mempelajari penggunaan persilangan fitur secara berlebihan.
Tugas 1: Jalankan model sebagaimana mestinya, dengan semua fitur produk silang yang diberikan. Apakah ada hal yang tidak terduga dalam cara model menyesuaikan data?
Apa masalahnya?
Tugas 2: Cobalah menghapus berbagai fitur produk silang untuk meningkatkan performa (meskipun hanya sedikit). Mengapa menghapus fitur dapat
meningkatkan performa?
(Jawaban muncul tepat di bawah latihan.)
Klik ikon plus untuk jawaban Tugas 1.
Anehnya, batas keputusan model terlihat agak aneh. Secara khusus, ada wilayah di kiri atas yang mengarah ke warna biru, meskipun tidak ada dukungan yang terlihat untuk hal itu dalam data.
Perhatikan ketebalan relatif dari lima baris yang berjalan dari INPUT ke OUTPUT.
Garis ini menunjukkan bobot relatif dari lima fitur tersebut.
Garis yang berasal dari X1 dan X2 jauh lebih tebal daripada
garis yang berasal dari persilangan fitur. Jadi, persilangan fitur berkontribusi jauh lebih sedikit terhadap model daripada fitur normal (tidak silang).
Klik ikon plus untuk jawaban Tugas 2.
Menghapus semua persilangan fitur akan memberikan model yang lebih wajar (tidak ada lagi batas melengkung yang menjurus ke overfit) dan membuat kerugian pengujian menyatu.
Setelah 1.000 iterasi, kerugian pengujian akan menjadi nilai yang sedikit lebih rendah daripada saat persilangan fitur sedang dijalankan (meskipun hasil Anda mungkin sedikit berbeda, bergantung pada set data).
Data dalam latihan ini pada dasarnya adalah data linear ditambah derau.
Jika kita menggunakan model yang terlalu rumit, seperti model dengan terlalu banyak persilangan, kita memberikan kesempatan untuk menyesuaikan dengan derau dalam data pelatihan, sering kali dengan mengorbankan membuat model berperforma buruk pada data pengujian.