Jika memulai project machine learning (ML) baru, Anda mungkin bertanya-tanya apakah pelatihan manual adalah satu-satunya opsi untuk membuat model machine learning. Dengan pelatihan manual, Anda menulis kode menggunakan framework ML untuk membuat model. Selama proses ini, Anda memilih algoritma yang akan dijelajahi dan menyesuaikan hyperparameter secara iteratif untuk menemukan model yang tepat.
Tentu saja, pelatihan model bukan satu-satunya hal yang perlu Anda pertimbangkan. Dalam prakteknya, membangun model machine learning dari prototipe hingga produksi melibatkan tugas berulang dan keterampilan khusus. ML eksploratif sederhana alur kerja terlihat seperti ini:
Tugas berulang - Alur kerja ML dapat melibatkan pekerjaan dan eksperimen berulang. Misalnya, selama pengembangan model, Anda biasanya perlu mengeksplorasi berbagai kombinasi algoritma dan hyperparameter untuk mengidentifikasi model yang paling tepat. Dengan pelatihan manual, Anda menulis kode khusus untuk melatih model, lalu menyesuaikan kode untuk menjalankan eksperimen dengan berbagai algoritma dan hyperparameter ML untuk menemukan model terbaik. Untuk project kecil atau eksplorasi, proses manual ini mungkin tidak menjadi masalah, tetapi untuk project yang lebih besar, tugas berulang ini dapat memakan waktu.
Keahlian Khusus - Mengembangkan model ML secara manual memerlukan keahlian khusus. Dalam praktiknya, tidak semua tim yang berencana mengembangkan model machine learning mungkin memiliki keterampilan ini. Jika sebuah tim tidak memiliki data scientist khusus, melakukan pekerjaan ini secara manual bahkan mungkin tidak memungkinkan.
Untungnya, langkah-langkah tertentu dalam pengembangan model dapat diotomatiskan untuk mengurangi beban pekerjaan berulang dan kebutuhan akan keterampilan khusus. Mengotomatiskan tugas ini adalah subjek modul tentang machine learning otomatis (AutoML).
Apa itu AutoML?
AutoML adalah proses mengotomatiskan tugas tertentu dalam alur kerja machine learning. Anda dapat menganggap AutoML sebagai serangkaian alat dan teknologi yang membuat pembuatan model machine learning lebih cepat dan lebih mudah diakses oleh lebih banyak pengguna. Meskipun otomatisasi dapat membantu di seluruh alur kerja ML, tugas yang sering dikaitkan dengan AutoML adalah tugas yang disertakan dalam siklus pengembangan model yang ditampilkan dalam Gambar 1. Tugas berulang ini mencakup:
- Data Engineering
- Rekayasa fitur.
- Pilihan fitur.
- Pelatihan
- Mengidentifikasi algoritma ML yang tepat.
- Memilih hyperparameter terbaik.
- Analisis
- Mengevaluasi metrik yang dihasilkan selama pelatihan berdasarkan set data pengujian dan validasi.
Dengan AutoML, Anda dapat berfokus pada masalah dan data ML, bukan pada pemilihan fitur, penyesuaian hyperparameter, dan pemilihan algoritma yang tepat.