Latihan 7a: Masalah Anda, Dirumuskan sebagai Masalah ML
Tulis atau klik kotak centang untuk menemukan solusi teknis terbaik
untuk masalah Anda. Masalah kita terbingkai dengan baik sebagai:
yang memprediksi atau menghasilkan:
Jika solusi Anda paling baik dibingkai sebagai ML prediktif, lihat
pertanyaan berikut. Jika solusi Anda dibingkai sebagai
AI generatif, lihat
MakerSuite—IDE berbasis browser yang memungkinkan Anda bereksperimen dengan berbagai perintah
untuk membuat prototipe dengan cepat menggunakan model bahasa generatif.
Latihan 7b: Menyampaikan Masalah Anda sebagai Masalah yang Lebih Sederhana
Saat pertama kali memulai, formulasi masalah yang lebih sederhana lebih mudah untuk dipertimbangkan
dan diimplementasikan. Ambil soal yang Anda berikan dan nyatakan sebagai klasifikasi
biner atau masalah regresi unidimensi (atau keduanya).
Latihan 8: Mendesain Data Anda untuk Model
Tuliskan data yang Anda inginkan untuk digunakan oleh model ML prediktif untuk membuat prediksi.
Kiat-kiat untuk Sukses
Satu baris membentuk satu bagian data yang menjadi dasar pembuatan prediksi.
Hanya sertakan informasi yang tersedia pada saat prediksi dibuat.
Setiap input dapat berupa daftar skalar atau 1D dari bilangan bulat, float, atau byte
(termasuk string).
Jika suatu struktur memiliki struktur yang berbeda dengan daftar skalar atau 1D, Anda
dapat mempertimbangkan apakah input tersebut adalah representasi terbaik untuk data Anda.
Contoh:
Jika sebuah sel merepresentasikan dua atau beberapa hal yang berbeda secara semantik dalam daftar
1D, Anda mungkin ingin memisahkannya menjadi input yang terpisah.
Jika sel merepresentasikan buffering protokol bertingkat, Anda dapat meratakan setiap kolom buffering protokol bertingkat.
Pengecualian: data audio, gambar, dan video, dengan sel yang merupakan blob byte.
Latihan 9: Dari Mana Data berasal
Tuliskan dari mana masing-masing input berasal.
Nilai jumlah pekerjaan yang akan dilakukan untuk mengembangkan pipeline data guna membuat setiap
kolom untuk satu baris.
Kiat-kiat untuk Sukses
Kapan contoh output tersedia untuk tujuan pelatihan?
Jika contoh output sulit diperoleh, Anda dapat
mengunjungi kembali Latihan 5 (Menggunakan Output), dan memeriksa apakah Anda dapat
memanfaatkan output yang berbeda untuk model Anda.
Pastikan semua input Anda (kecuali output) tersedia pada waktu penayangan (saat prediksi dibuat), dalam format yang sama persis dengan yang Anda tulis.
Jika sulit untuk mendapatkan semua input Anda pada waktu penayangan dalam format yang sama persis, sebaiknya tinjau kembali Latihan 8 (Mendesain data Anda untuk model) untuk mempertimbangkan kembali input, atau Latihan 5 untuk mempertimbangkan kembali kapan penayangan dapat dilakukan.
Latihan 10: Input yang Diperoleh dengan Mudah
Di antara input yang Anda cantumkan di Latihan 8, pilih 1-3 input yang mudah
diperoleh, dan yang Anda yakini akan memberikan hasil awal yang wajar.
Kiat-kiat untuk Sukses
Dalam Latihan 6, Anda mencantumkan sekumpulan heuristik yang dapat Anda gunakan. Input mana yang akan berguna untuk menerapkan heuristik tersebut?
Pertimbangkan biaya teknis untuk mengembangkan pipeline data untuk menyiapkan input, dan manfaat yang diharapkan dari memiliki setiap input dalam model.
Fokus pada input yang bisa didapatkan dari satu sistem dengan pipeline
sederhana. Sebaiknya mulailah dengan infrastruktur minimum
saat pertama kali dimulai.
Cetak atau simpan
Klik tombol di bawah untuk mencetak atau menyimpan respons sebagai .pdf.