Menangani Data Kategori: Uji Pengetahuan Anda

  1. Manakah dari hal-hal berikut ini yang merupakan contoh data kategorik? (Pilih semua yang sesuai)

    Pilih sebanyak mungkin jawaban yang Anda inginkan.

  2. Benar atau Salah: Label mesin umumnya dianggap lebih diminati daripada label yang diberikan oleh penilai manusia.

  3. Anda melatih model pada set data pelatihan yang menyertakan fitur eye_color, yang dapat berupa salah satu dari enam nilai berikut: amber, blue, brown, gray, green, hazel.
    Manakah dari berikut ini yang merupakan encoding valid untuk nilai eye_color dari blue? (Pilih semua yang sesuai)

    Pilih sebanyak mungkin jawaban yang Anda inginkan.

  4. Manakah dari skenario berikut yang masuk akal untuk menerapkan {i>hashing

  5. Anda melakukan persilangan fitur dari dua fitur kategori berikut:

    • apple_color, yang menggunakan salah satu dari empat nilai ini: green, red, white, atau yellow
    • apple_texture, yang menggunakan salah satu dari dua nilai berikut: crisp atau mushy

    Berapa banyak entri dalam vektor persilangan fitur yang dihasilkan?