カテゴリデータの操作

カテゴリデータには、 指定可能な値のセット。例:

  • 国立公園に生息するさまざまな種類の動物
  • 特定の都市の通りの名前
  • メールが迷惑メールかどうか
  • 住宅の外装を塗装する色
  • ビニングされた数値については、数値 Data モジュール

数値はカテゴリデータにもなる

真の数値データ 大きくすることができますたとえば、 面積に基づいて住宅の価値を予測するモデルです。 なお、住宅価格の評価に役立つモデルは、一般的に 特徴を活用できますとはいえ、他の条件がすべて同じなら、200 平方メートルの家は 100 平方メートルの一戸建ての住宅の約 2 倍の価値があります メートルです。

多くの場合、整数値を含む特徴を 数値データではなくカテゴリデータを使用しますたとえば、 値を整数にします。あなたが代理人を務めるのは、 数値で表す場合は、モデルに 数値関係を見つけるには 異なる場合がありますすなわち、モデルにトレーニングで 郵便番号 20004 を郵便番号の 2 倍(または半分)の信号強度として扱う 10002。郵便番号をカテゴリデータとして表現すると、 郵便番号を別々に重み付けします

エンコード

エンコードとは、カテゴリまたはその他のデータを数値ベクトルに変換することを意味します。 基づいてモデルをトレーニングできますこの変換が必要なのは、モデルによって 浮動小数点値でのみトレーニングするトレーニングできない文字列や "dog" または "maple"。このモジュールでは いくつかあります。