ML 担当者は、評価、クリーニング、変革にはるかに多くの時間を費やしている モデルの構築よりもはるかに優れています。 データが非常に重要であるため、このコースでは 3 つのユニット全体でこのトピックを取り上げています。
- 数値データを操作する(このユニット)
- カテゴリデータの操作
- データセット、一般化、過学習
このユニットでは、 数値データ つまり 整数値または浮動小数点値で 関数を呼び出せますつまり、加算的、カウント可能、順序付けられ、 といった具合です次のユニットでは カテゴリデータ: カテゴリのように振る舞う数値を含めることができる3 つ目のユニットでは トレーニング時と評価時に高品質な結果を確実に得られるよう、データを準備すること 必要があります。
数値データの例としては、次のようなものが挙げられます。
- 温度
- 重量
- 自然保護区で越冬するシカの数
一方、米国の郵便番号は、 5 桁または 9 桁の数字であるため、数字のように動作したり、 数学的関係です郵便番号 40004(ケンタッキー州ネルソン郡) 郵便番号 20002(ワシントン D.C.)の数量の 2 倍にならないようにする必要があります。これらの数字は カテゴリ、特に地理的エリアを表す 作成します。