理解度を確認する

以下の質問は、ML のコアコンセプトの理解を深めるのに役立ちます。

予測力

教師あり ML モデルは、ラベル付きの例を含むデータセットを使用してトレーニングされます。モデルは、特徴からラベルを予測する方法を学習します。ただし、データセット内のすべての特徴に予測力が備わっているわけではありません。場合によっては、ラベルの予測子として機能するのは一部の特徴のみです。次のデータセットでは、price をラベルとして、残りの列を特徴として使用します。

自動車の属性のラベル付きの例。

自動車の価格を最も予測できると思われる機能は、次の中から 3 つ選んでください。
マイル、ギアボックス、メーカー モデル。
Color、height、make_model。
Make_model、年、マイル数。
Tire_size、wheel_base、year。

教師あり学習と教師なし学習

問題に応じて、教師ありまたは教師なしのアプローチを使用します。たとえば、予測する値またはカテゴリが事前にわかっている場合は、教師あり学習を使用します。ただし、データセットに関連するサンプルのセグメンテーションやグループ化が含まれているかどうかを学習する場合は、教師なし学習を使用します。

オンライン ショッピング ウェブサイトのユーザーのデータセットがあり、次の列が含まれているとします。

顧客属性の行の画像。

サイトにアクセスするユーザーの種類を把握したい場合、教師あり学習と教師なし学習のどちらを使用しますか。
教師あり学習。ユーザーがどのクラスに属しているかを予測しようとしているため。
教師なし学習。

家屋のエネルギー使用量のデータセットに次の列があるとします。

家の属性の行の画像。

新築住宅で年間に使用されるキロワット時を予測するには、どのタイプの ML を使用すればよいですか。
教師なし学習。
教師あり学習。

次のような列を含むフライト データセットがあるとします。

フライトデータの行の画像。

バスのチケットの費用を予測する場合、回帰と分類のどちらを使用しますか。
分類
回帰
データセットに基づいて、バスのチケットの費用を「高」、「平均」、「低」に分類する分類モデルをトレーニングできますか?
いいえ。分類モデルを作成することはできません。coach_ticket_cost 値はカテゴリではなく数値です。
はい。ただし、まず coach_ticket_cost 列の数値をカテゴリ値に変換する必要があります。
いいえ。分類モデルは、spamnot_spam などの 2 つのカテゴリのみを予測します。このモデルでは、3 つのカテゴリを予測する必要があります。

トレーニングと評価

モデルをトレーニングしたら、ラベル付きの例を含むデータセットを使用してモデルを評価し、モデルの予測値とラベルの実際の値を比較します。

質問に最も適切な回答を 2 つ選択してください。

モデルの予測が大きく外れている場合、予測を改善するにはどうすればよいですか。
モデルを再トレーニングしますが、ラベルに対して最も予測力が強いと思われる特徴のみを使用します。
予測が大きく外れているモデルは修正できません。
より大規模で多様なデータセットを使用してモデルを再トレーニングします。
別のトレーニング方法を試します。たとえば、教師あり学習アプローチを使用した場合は、教師なし学習アプローチを試します。

これで、ML の次のステップに進む準備が整いました。

  • People + AI ガイドブック。Google 社員、業界の専門家、学術研究によって提示された ML の使用方法、ベスト プラクティス、例を探している場合。

  • 問題のフレーミング。ML モデルを作成して、その過程でよくある問題を回避するための実証済みのアプローチをお探しの場合。

  • ML 集中講座。ML について詳しく学び、実践的なアプローチを試す準備ができている。