Proses untuk Persiapan Data dan Rekayasa Fitur

Seperti Apa Prosesnya?

Seperti yang disebutkan sebelumnya, kursus ini berfokus pada pembuatan set data dan transformasi data Anda.

Pembuatan set data terdiri dari tugas-tugas berikut: 1. Kumpulkan data mentah.  2. Identifikasi sumber fitur dan label. 3. Pilih strategi pengambilan sampel.
4. Memisahkan data. Transformasi data terdiri dari tugas-tugas berikut:
1. Pelajari dan bersihkan data Anda. 2. Melakukan rekayasa
fitur.

Perlu diingat:

  • Gambar ini menunjukkan proses standar, yang mungkin tidak ideal untuk setiap project. Kursus ini berlaku terutama untuk regresi linear dan jaringan neural.
  • Proses yang ditampilkan tidak selalu berurutan. Misalnya, Anda dapat membagi data setelah mengubahnya. Anda mungkin perlu mengumpulkan lebih banyak data. Anda mungkin perlu mengubah set fitur, bahkan setelah pelatihan dimulai, saat Anda mempelajari secara empiris apa yang berhasil dan apa yang tidak.

Berapa Lama Waktu yang Diperlukan?

Untuk pertanyaan berikut, klik panah yang diinginkan untuk memeriksa jawaban Anda:

menebak: Dalam project machine learning Anda, berapa banyak waktu yang biasanya akan Anda habiskan untuk persiapan dan transformasi data?
Lebih dari separuh waktu project
Benar: Anda akan menghabiskan sebagian besar waktu pada project machine learning untuk membuat set data dan mengubah data.
Kurang dari setengah waktu project
Rencanakan untuk lebih banyak! Biasanya, 80% waktu di project machine learning dihabiskan untuk membuat set data dan mengubah data.