Jaringan neural

Anda mungkin ingat dari Latihan persilangan fitur di Modul data kategoris, bahwa masalah klasifikasi berikut adalah nonlinear:

Gambar 1. Bidang koordinat Kartesius, dibagi menjadi empat
      kuadran, masing-masing berisi titik-titik acak 
dalam bentuk yang menyerupai
      persegi. Titik-titik di kuadran kanan atas dan kiri bawah berwarna biru,
      dan titik-titik di kuadran kiri atas dan kanan bawah berwarna oranye.
Gambar 1. Masalah klasifikasi nonlinear. {i>Function<i} linear tidak bisa pisahkan semua titik biru dari titik oranye dengan rapi.

"Nonlinear" berarti Anda tidak dapat memprediksi label secara akurat dengan label model bentuk \(b + w_1x_1 + w_2x_2\). Dengan kata lain, "permukaan keputusan" bukanlah garis.

Namun, jika kita melakukan persilangan fitur pada fitur $x_1$ dan $x_2$, kita bisa kemudian merepresentasikan hubungan nonlinier antara kedua fitur menggunakan model linear: $b + w_1x_1 + w_2x_2 + w_3x_3$ di mana $x_3$ adalah persilangan fitur antara $x_1$ dan $x_2$:

Gambar 2. Bidang koordinat Kartesius yang sama berwarna biru dan oranye
      titik-titik seperti pada Gambar 1.  Namun, kali ini kurva hiperbolik putih
      diplot di atas {i>grid<i}, yang memisahkan titik-titik biru di kanan atas
      dan kuadran kiri bawah (sekarang diarsir dengan latar belakang biru) dari
      titik oranye di kuadran kiri atas dan kanan bawah (sekarang
      diarsir dengan latar belakang oranye).
Gambar 2. Dengan menambahkan persilangan fitur, x1x2, model linear dapat mempelajari bentuk hiperbolik yang memisahkan titik biru dari titik oranye.

Sekarang perhatikan {i>dataset<i} berikut ini:

Gambar 3. Bidang koordinat Kartesius, yang dibagi menjadi empat kuadran.
      Gugus lingkaran titik biru berpusat pada asal
      dan dikelilingi oleh lingkaran titik oranye.
Gambar 3. Masalah klasifikasi nonlinear yang lebih sulit.

Anda mungkin juga ingat Latihan silang fitur yang menentukan persilangan fitur yang tepat untuk menyesuaikan model linear dengan data ini membutuhkan lebih banyak usaha dan eksperimen.

Tetapi bagaimana jika Anda tidak perlu melakukan semua eksperimen itu sendiri? Jaringan neural adalah kelompok arsitektur model yang dirancang untuk menemukan nonlinear pola yang berbeda dalam data. Selama pelatihan jaringan neural, model secara otomatis mempelajari persilangan fitur yang optimal untuk dijalankan pada data input guna meminimalkan kerugian.

Di bagian berikut, kita akan melihat lebih dekat cara kerja jaringan neural.