Uji Pemahaman Anda

Pertanyaan berikut membantu Anda memperkuat pemahaman tentang konsep ML inti.

Kemampuan prediktif

Model ML tersupervisi dilatih menggunakan set data dengan contoh berlabel. Model mempelajari cara memprediksi label dari fitur. Namun, tidak semua fitur dalam set data memiliki kekuatan prediktif. Dalam beberapa kasus, hanya beberapa fitur yang berfungsi sebagai prediktor label. Dalam set data di bawah, gunakan harga sebagai label dan kolom lainnya sebagai fitur.

Contoh atribut mobil yang diberi label.

Menurut Anda, tiga fitur mana yang kemungkinan merupakan prediktor terbesar untuk harga mobil?
Make_model, year, miles.
Tire_size, wheel_base, year.
Miles, gearbox, make_model.
Warna, tinggi, make_model.

Supervised learning dan unsupervised learning

Berdasarkan masalahnya, Anda akan menggunakan pendekatan yang diawasi atau tidak diawasi. Misalnya, jika Anda sudah mengetahui nilai atau kategori yang ingin diprediksi sebelumnya, Anda akan menggunakan pembelajaran dengan pengawasan. Namun, jika ingin mempelajari apakah set data Anda berisi segmentasi atau pengelompokan contoh terkait, Anda akan menggunakan pembelajaran tanpa pengawasan.

Misalkan Anda memiliki set data pengguna untuk situs belanja online, dan set data tersebut berisi kolom berikut:

Gambar baris atribut pelanggan.

Jika ingin memahami jenis pengguna yang mengunjungi situs, apakah Anda akan menggunakan supervised learning atau unsupervised learning?
Pemelajaran dengan pengawasan karena saya mencoba memprediksi class yang menjadi kategori pengguna.
Unsupervised learning.

Misalkan Anda memiliki set data penggunaan energi untuk rumah dengan kolom berikut:

Gambar baris atribut rumah.

Jenis ML apa yang akan Anda gunakan untuk memprediksi kilowatt jam yang digunakan per tahun untuk rumah yang baru dibangun?
Supervised learning.
Unsupervised learning.

Misalkan Anda memiliki set data penerbangan dengan kolom berikut:

Gambar baris data penerbangan.

Jika ingin memprediksi biaya tiket bus, apakah Anda akan menggunakan regresi atau klasifikasi?
Klasifikasi
Regresi
Berdasarkan set data, dapatkah Anda melatih model klasifikasi untuk mengklasifikasikan biaya tiket kelas ekonomi sebagai "tinggi", "rata-rata", atau "rendah"?
Ya, tetapi kita harus mengonversi nilai numerik di kolom coach_ticket_cost menjadi nilai kategoris terlebih dahulu.
Tidak. Model klasifikasi hanya memprediksi dua kategori, seperti spam atau not_spam. Model ini harus memprediksi tiga kategori.
Tidak. Anda tidak dapat membuat model klasifikasi. Nilai coach_ticket_cost bersifat numerik, bukan kategoris.

Melatih dan mengevaluasi

Setelah melatih model, kita mengevaluasinya menggunakan set data dengan contoh berlabel dan membandingkan nilai prediksi model dengan nilai sebenarnya dari label.

Pilih dua jawaban terbaik untuk pertanyaan tersebut.

Jika prediksi model sangat jauh dari yang diharapkan, apa yang dapat Anda lakukan untuk meningkatkannya?
Coba pendekatan pelatihan yang berbeda. Misalnya, jika Anda menggunakan pendekatan yang diawasi, coba pendekatan yang tidak diawasi.
Anda tidak dapat memperbaiki model yang prediksinya jauh dari akurat.
Latih ulang model, tetapi hanya gunakan fitur yang Anda yakini memiliki kekuatan prediktif terkuat untuk label.
Latih ulang model menggunakan set data yang lebih besar dan lebih beragam.

Sekarang Anda siap untuk mengambil langkah berikutnya dalam perjalanan ML:

  • Buku Panduan People + AI. Jika Anda mencari serangkaian metode, praktik terbaik, dan contoh yang disajikan oleh karyawan Google, pakar industri, dan riset akademis untuk menggunakan ML.

  • Framing Masalah. Jika Anda mencari pendekatan yang telah diuji di lapangan untuk membuat model ML dan menghindari perangkap umum selama prosesnya.

  • Kursus Singkat Machine Learning. Jika Anda sudah siap untuk pendekatan mendalam dan langsung untuk mempelajari ML lebih lanjut.