Mengubah Data Angka

Anda mungkin perlu menerapkan dua jenis transformasi ke data numerik:

  • Normalisasi - mengubah data numerik ke skala yang sama dengan data numerik lainnya.
  • Bucketing - mengubah data numerik (biasanya berkelanjutan) ke data kategoris.

Mengapa Menormalisasi Fitur Angka?

Kami sangat menyarankan untuk menormalkan set data yang memiliki fitur numerik yang mencakup rentang yang sangat berbeda (misalnya usia dan pendapatan). Jika fitur yang berbeda memiliki rentang yang berbeda, penurunan gradien dapat "pantulan" dan memperlambat konvergensi. Pengoptimal seperti Adagrad dan Adam melindungi dari masalah ini dengan membuat kecepatan pembelajaran efektif yang terpisah untuk setiap fitur.

Kami juga merekomendasikan untuk menormalisasi satu fitur numerik yang mencakup rentang luas, seperti "populasi kota." Jika Anda tidak menormalisasi fitur "pengisian kota" , melatih model dapat menghasilkan error NaN. Sayangnya, pengoptimal seperti Adagrad dan Adam tidak dapat mencegah error NaN ketika terdapat berbagai nilai dalam satu fitur.