Uji Pemahaman Anda
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Pertanyaan berikut membantu Anda memperkuat pemahaman tentang konsep ML inti.
Kemampuan prediktif
Model ML terpantau dilatih menggunakan set data dengan contoh berlabel. Model
mempelajari cara memprediksi label dari fitur. Namun, tidak semua fitur dalam set data memiliki kekuatan prediktif. Dalam beberapa kasus, hanya beberapa fitur yang berfungsi sebagai
prediktor label. Dalam set data di bawah, gunakan harga sebagai label
dan kolom lainnya sebagai fitur.
Menurut Anda, tiga fitur mana yang kemungkinan merupakan prediktor terbesar untuk harga mobil?
Make_model, year, miles.
Merek/model, tahun, dan jarak tempuh mobil kemungkinan merupakan salah satu prediktor terkuat untuk harganya.
Warna, tinggi, make_model.
Tinggi dan warna mobil bukanlah prediktor yang kuat untuk harga mobil.
Miles, gearbox, make_model.
Kotak roda gigi bukan merupakan prediktor utama harga.
Tire_size, wheel_base, year.
Ukuran ban dan jarak sumbu roda bukanlah prediktor kuat untuk harga mobil.
Supervised learning dan unsupervised learning
Berdasarkan masalahnya, Anda akan menggunakan pendekatan yang diawasi atau tidak diawasi.
Misalnya, jika Anda mengetahui nilai atau kategori yang ingin diprediksi sebelumnya,
Anda akan menggunakan pembelajaran dengan pengawasan. Namun, jika ingin mempelajari apakah set data Anda
berisi segmentasi atau pengelompokan contoh terkait, Anda akan menggunakan
pembelajaran tanpa pengawasan.
Misalkan Anda memiliki set data pengguna untuk situs belanja online, dan set data tersebut berisi kolom berikut:
Jika ingin memahami jenis pengguna yang mengunjungi situs, apakah Anda akan menggunakan supervised learning atau unsupervised learning?
Unsupervised learning.
Karena kita ingin model mengelompokkan grup pelanggan terkait, kita akan menggunakan pembelajaran tanpa pengawasan. Setelah model mengelompokkan pengguna,
kita akan membuat nama sendiri untuk setiap cluster, misalnya,
"pencari diskon", "pemburu promo", "penjelajah", "setia",
dan "pengembara".
Pemelajaran dengan pengawasan karena saya mencoba memprediksi class
yang menjadi kategori pengguna.
Dalam supervised learning, set data harus berisi label yang Anda coba prediksi. Dalam set data, tidak ada label yang merujuk ke
kategori pengguna.
Misalkan Anda memiliki set data penggunaan energi untuk rumah dengan kolom berikut:
Jenis ML apa yang akan Anda gunakan untuk memprediksi kilowatt jam yang digunakan per tahun untuk rumah yang baru dibangun?
Pembelajaran yang diawasi.
Supervised learning dilatih pada contoh berlabel. Dalam set data ini,
"kilowatt hour yang digunakan per tahun" akan menjadi label karena ini adalah
nilai yang ingin Anda prediksi oleh model. Fiturnya adalah
"luas persegi”, "lokasi”, dan "tahun dibangun”.
Unsupervised learning.
Unsupervised learning menggunakan contoh tidak berlabel. Dalam contoh ini,
"kilowatt hour yang digunakan per tahun" akan menjadi label karena ini adalah
nilai yang Anda inginkan untuk diprediksi oleh model.
Misalkan Anda memiliki set data penerbangan dengan kolom berikut:
Jika ingin memprediksi biaya tiket pesawat, apakah Anda akan menggunakan regresi atau klasifikasi?
Regresi
Output model regresi adalah nilai numerik.
Klasifikasi
Output model klasifikasi adalah nilai diskret,
biasanya berupa kata. Dalam hal ini, biaya tiket pesawat adalah
nilai numerik.
Berdasarkan set data, dapatkah Anda melatih model klasifikasi
untuk mengklasifikasikan biaya tiket pesawat sebagai
"tinggi", "rata-rata", atau "rendah"?
Ya, tetapi kita harus mengonversi nilai numerik di kolom airplane_ticket_cost
menjadi nilai kategoris terlebih dahulu.
Anda dapat membuat model klasifikasi dari set data.
Anda akan melakukan hal seperti berikut:
- Temukan biaya rata-rata tiket dari bandara keberangkatan ke bandara tujuan.
- Tentukan nilai minimum yang akan menjadi "tinggi", "sedang",
dan "rendah".
- Bandingkan biaya yang diprediksi dengan nilai minimum dan tampilkan kategori yang mencakup nilai tersebut.
Tidak. Anda tidak dapat membuat model klasifikasi. Nilai
airplane_ticket_cost
bersifat numerik, bukan kategoris.
Dengan sedikit usaha, Anda dapat membuat model klasifikasi.
Tidak. Model klasifikasi hanya memprediksi dua kategori, seperti
spam
atau not_spam
. Model ini harus memprediksi
tiga kategori.
Model klasifikasi dapat memprediksi beberapa kategori. Model ini disebut
model klasifikasi multiclass.
Melatih dan mengevaluasi
Setelah melatih model, kita mengevaluasinya menggunakan set data dengan contoh berlabel
dan membandingkan nilai prediksi model dengan nilai sebenarnya dari label.
Pilih dua jawaban terbaik untuk pertanyaan tersebut.
Jika prediksi model sangat jauh dari yang diharapkan, apa yang dapat Anda lakukan untuk meningkatkannya?
Latih ulang model, tetapi hanya gunakan fitur yang Anda yakini memiliki kekuatan prediktif terkuat untuk label.
Melatih ulang model dengan lebih sedikit fitur, tetapi memiliki kemampuan prediksi yang lebih baik, dapat menghasilkan model yang membuat prediksi yang lebih baik.
Anda tidak dapat memperbaiki model yang prediksinya jauh dari akurat.
Anda dapat memperbaiki model yang prediksinya salah. Sebagian besar model memerlukan beberapa putaran pelatihan hingga membuat prediksi yang berguna.
Latih ulang model menggunakan set data yang lebih besar dan lebih beragam.
Model yang dilatih pada set data dengan lebih banyak contoh dan rentang nilai yang lebih luas dapat menghasilkan prediksi yang lebih baik karena model memiliki solusi umum yang lebih baik untuk hubungan antara fitur dan label.
Coba pendekatan pelatihan yang berbeda. Misalnya, jika Anda menggunakan pendekatan yang diawasi, coba pendekatan yang tidak diawasi.
Pendekatan pelatihan yang berbeda tidak akan menghasilkan prediksi yang lebih baik.
Sekarang Anda siap untuk mengambil langkah berikutnya dalam perjalanan ML:
Buku Panduan People + AI. Jika Anda
mencari serangkaian metode, praktik terbaik, dan contoh yang disajikan oleh
karyawan Google, pakar industri, dan riset akademis untuk menggunakan ML.
Framing Masalah. Jika Anda mencari
pendekatan yang telah diuji di lapangan untuk membuat model ML dan menghindari perangkap umum
selama prosesnya.
Kursus Singkat Machine Learning. Jika Anda
sudah siap untuk pendekatan mendalam dan langsung untuk mempelajari ML lebih lanjut.
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-07-27 UTC.
[null,null,["Terakhir diperbarui pada 2025-07-27 UTC."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]