理解度を確認する
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
以下の質問は、ML のコアコンセプトの理解を深めるのに役立ちます。
予測力
教師あり ML モデルは、ラベル付きの例を含むデータセットを使用してトレーニングされます。モデルは、特徴からラベルを予測する方法を学習します。ただし、データセット内のすべての特徴に予測力が備わっているわけではありません。場合によっては、ラベルの予測子として機能するのは一部の特徴のみです。次のデータセットでは、price をラベルとして、残りの列を特徴として使用します。
自動車の価格を最も予測できると思われる機能は、次の中から 3 つ選んでください。
Make_model、年、マイル数。
車のメーカー/モデル、年式、走行距離は、価格を予測するうえで最も重要な要素です。
Color、height、make_model。
車の高さと色は、車の価格を予測する強い指標ではありません。
マイル、ギアボックス、make_model。
ギアボックスは価格の主要な予測因子ではありません。
Tire_size、wheel_base、year。
タイヤサイズとホイールベースは、車の価格を予測するうえで有力な指標ではありません。
教師あり学習と教師なし学習
問題に応じて、教師ありまたは教師なしのアプローチを使用します。たとえば、予測する値またはカテゴリが事前にわかっている場合は、教師あり学習を使用します。ただし、データセットに関連するサンプルのセグメンテーションやグループ化が含まれているかどうかを学習する場合は、教師なし学習を使用します。
オンライン ショッピング ウェブサイトのユーザーのデータセットがあり、次の列が含まれているとします。
サイトにアクセスするユーザーの種類を把握したい場合、教師あり学習と教師なし学習のどちらを使用しますか?
教師なし学習。
関連する顧客のグループをモデルでクラスタリングするため、教師なし学習を使用します。モデルがユーザーをクラスタ化した後、各クラスタに独自の名前を作成します(「割引を求める人」、「お買い得を求める人」、「サーファー」、「ロイヤル」、「放浪者」など)。
教師あり学習。ユーザーがどのクラスに属しているかを予測しようとしているため。
教師あり学習では、データセットに予測しようとしているラベルが含まれている必要があります。データセットに、ユーザーのカテゴリを参照するラベルがない。
家屋のエネルギー使用量のデータセットに次の列があるとします。
新築住宅で年間に使用されるキロワット時を予測するには、どのタイプの ML を使用すればよいですか。
教師あり学習。
教師あり学習は、ラベル付きのサンプルでトレーニングします。このデータセットでは、モデルに予測させる値である「年間使用電力量」がラベルになります。特徴量は「面積」、「場所」、「築年数」です。
教師なし学習。
教師なし学習では、ラベルのないサンプルを使用します。この例では、モデルに予測させる値であるため、「年間使用電力量」がラベルになります。
次のような列を含むフライト データセットがあるとします。
航空券の費用を予測する場合、回帰分析と分類のどちらを使用しますか?
分類
分類モデルの出力は離散値(通常は単語)です。この場合、航空券の費用は数値です。
データセットに基づいて、航空券の費用を「高」、「平均」、「低」に分類する分類モデルをトレーニングできますか?
はい。ただし、まず airplane_ticket_cost
列の数値をカテゴリ値に変換する必要があります。
このデータセットから分類モデルを作成できます。次のようにします。
- 出発地の空港から目的地の空港までの航空券の平均価格を確認します。
- 「高」、「平均」、「低」を構成するしきい値を決定します。
- 予測された費用をしきい値と比較し、値が属するカテゴリを出力します。
いいえ。分類モデルを作成することはできません。airplane_ticket_cost
値はカテゴリではなく数値です。
少し手間をかけて、分類モデルを作成できます。
いいえ。分類モデルは、spam
や not_spam
などの 2 つのカテゴリのみを予測します。このモデルでは、3 つのカテゴリを予測する必要があります。
分類モデルは複数のカテゴリを予測できます。これらはマルチクラス分類モデルと呼ばれます。
トレーニングと評価
モデルをトレーニングしたら、ラベル付きの例を含むデータセットを使用してモデルを評価し、モデルの予測値とラベルの実際の値を比較します。
質問に最も適切な回答を 2 つ選択してください。
モデルの予測が大きく外れている場合、予測を改善するにはどうすればよいですか。
モデルを再トレーニングしますが、ラベルの予測力が最も高いと思われる特徴のみを使用します。
特徴の数は少ないが予測力が優れたモデルを再トレーニングすると、より正確な予測を行うモデルを生成できます。
予測が大きく外れているモデルは修正できません。
予測が外れたモデルは修正できます。ほとんどのモデルでは、有用な予測を行うまで複数回のトレーニングが必要です。
より大規模で多様なデータセットを使用してモデルを再トレーニングします。
サンプル数が多く、値の範囲が広いデータセットでトレーニングされたモデルは、特徴とラベルの関係に対する一般化されたソリューションが優れているため、より優れた予測を生成できます。
別のトレーニング方法を試します。たとえば、教師あり学習アプローチを使用した場合は、教師なし学習アプローチを試します。
別のトレーニング方法では、より良い予測は得られません。
これで、ML の次のステップに進む準備が整いました。
People + AI ガイドブック。Google 社員、業界の専門家、学術研究によって提示された ML の使用方法、ベスト プラクティス、例を探している場合。
問題のフレーミング。ML モデルを作成して、その過程でよくある問題を回避するための実証済みのアプローチをお探しの場合。
ML 集中講座。ML について詳しく学び、実践的なアプローチを試す準備ができている。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-07-27 UTC。
[null,null,["最終更新日 2025-07-27 UTC。"],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]