Saat menerapkan model, mulailah dengan cara yang sederhana. Sebagian besar pekerjaan di ML adalah pada data sehingga menjalankan pipeline penuh untuk model yang kompleks lebih sulit daripada melakukan iterasi pada model itu sendiri. Setelah menyiapkan pipeline data dan menerapkan model sederhana yang menggunakan beberapa fitur, Anda dapat melakukan iterasi menciptakan model yang lebih baik.
Model sederhana memberikan dasar yang baik, meskipun pada akhirnya Anda tidak meluncurkannya. Faktanya, menggunakan model yang sederhana mungkin lebih baik dari yang Anda kira. Memulai dengan mudah membantu Anda menentukan apakah model yang kompleks dapat dibenarkan atau tidak.
Latih model Anda sendiri versus menggunakan model yang sudah dilatih
Model terlatih tersedia untuk berbagai kasus penggunaan dan menawarkan banyak keunggulannya. Namun, model terlatih hanya akan benar-benar berfungsi ketika label dan fitur yang benar-benar cocok dengan {i>dataset<i} Anda. Misalnya, jika model terlatih menggunakan 25 fitur dan {i>dataset<i} Anda hanya menyertakan 24 di antaranya, model kemungkinan besar akan membuat prediksi yang buruk.
Umumnya, praktisi ML menggunakan subbagian input yang cocok dari terlatih untuk fine-tuning atau transfer learning. Jika model terlatih tidak tersedia untuk kasus penggunaan spesifik Anda, pertimbangkan menggunakan subbagian dari model terlatih saat melatih model Anda sendiri.
Untuk informasi tentang model terlatih, lihat
Pemantauan
Selama {i>problem-framing<i}, pertimbangkan infrastruktur pemantauan dan peringatan yang kebutuhan solusi ML.
Deployment model
Dalam beberapa kasus, model yang baru dilatih mungkin lebih buruk daripada model yang saat ini produksi. Jika ya, Anda harus mencegah data itu dirilis ke dalam production dan mendapatkan pemberitahuan bahwa deployment otomatis Anda gagal.
Diferensiasi performa pelatihan dan penayangan
Jika salah satu fitur masuk yang digunakan untuk inferensi memiliki nilai yang berada di luar rentang distribusi data yang digunakan dalam pelatihan, Anda perlu diberi tahu karena kemungkinan model akan membuat prediksi yang buruk. Misalnya, jika dilatih untuk memprediksi suhu kota khatulistiwa di permukaan laut, maka sistem penayangan akan memperingatkan Anda tentang data yang masuk dengan garis lintang dan bujur, dan/atau ketinggian di luar rentang tempat model dilatih. Sebaliknya, sistem penayangan akan memperingatkan Anda jika model membuat prediksi yang berada di luar rentang distribusi yang terlihat selama pelatihan.
Server inferensi
Jika Anda menyediakan inferensi melalui sistem RPC, Anda perlu memantau Server RPC Anda sendiri dan mendapatkan pemberitahuan jika berhenti menyediakan inferensi.