カテゴリデータには、 指定可能な値のセット。例:
- 国立公園に生息するさまざまな種類の動物
- 特定の都市の通りの名前
- メールが迷惑メールかどうか
- 住宅の外装を塗装する色
- ビニングされた数値については、数値 Data モジュール
数値はカテゴリデータにもなる
真の数値データ 大きくすることができますたとえば、 面積に基づいて住宅の価値を予測するモデルです。 なお、住宅価格の評価に役立つモデルは、一般的に 特徴を活用できますとはいえ、他の条件がすべて同じなら、200 平方メートルの家は 100 平方メートルの一戸建ての住宅の約 2 倍の価値があります メートルです。
多くの場合、整数値を含む特徴を 数値データではなくカテゴリデータを使用しますたとえば、 値を整数にします。あなたが代理人を務めるのは、 数値で表す場合は、モデルに 数値関係を見つけるには 異なる場合がありますすなわち、モデルにトレーニングで 郵便番号 20004 を郵便番号の 2 倍(または半分)の信号強度として扱う 10002。郵便番号をカテゴリデータとして表現すると、 郵便番号を別々に重み付けします
エンコード
エンコードとは、カテゴリまたはその他のデータを数値ベクトルに変換することを意味します。
基づいてモデルをトレーニングできますこの変換が必要なのは、モデルによって
浮動小数点値でのみトレーニングするトレーニングできない文字列や
"dog"
または "maple"
。このモジュールでは
いくつかあります。