2024 年 8 月に、機械学習集中講座の改良された新しいバージョンがリリースされます。今後の情報にご注目ください。
特徴断面の概要
特徴クロスにより、非線形データに適合させるためのモデルを確実に実現できるか。確認するには、このエクササイズをお試しください。
タスク: 次の 3 つの入力特徴の重み付けを変更して、手動で青い点とオレンジ色の点を分離するモデルを作成してみます。
体重を手動で変更するには:
- FEATURES を OUTPUT に接続する行をクリックします。入力フォームが表示されます。
- その入力フォームに浮動小数点値を入力します。
- Enter キーを押します。
なお、この演習のインターフェースには [ステップ] ボタンがありません。この演習では、モデルを繰り返しトレーニングすることはありません。モデルの重みは手動で最終的に入力します。
(解答はエクササイズのすぐ下に表示されます)。
回答のプラスアイコンをクリックします。
- w1: 0
- w2 = 0
- x1x2 = 1(または任意の正の値)
特徴クロスに負の値を入力すると、モデルは青い点とオレンジ色の点を分離しますが、予測は完全に間違っています。つまり、青い点はオレンジ色、オレンジ色の点は青いと予測されます。
複雑な特徴クロスが複雑
それでは、高度な特徴クロスの組み合わせを使用してみましょう。このプレイグラウンド エクササイズのデータセットは、ダーツゲームのノイズの多いブルアイのようなもので、中央に青い点、外側のリングにオレンジ色の点があります。
プラスアイコンをクリックすると、モデルの可視化の説明が表示されます。
各プレイグラウンド エクササイズには、モデルの現在の状態が可視化されます。例えば、次のような視覚化があります。
モデルの可視化については、次の点に注意してください。
- 各軸は特定の対象物を表します。迷惑メールと迷惑メール以外のケースでは、特徴は単語カウントとメールの受信者数になります。
- 各ドットは、メールなど、データの 1 つの例の特徴値をプロットします。
- ドットの色は、この例が属するクラスを表します。たとえば、青い点は迷惑メール以外のメールを示し、オレンジ色の点は迷惑メールを表します。
- 背景色は、その色の例がどこにあるかの予測モデルです。青い点を囲む青い背景は、モデルがその例を正しく予測していることを意味します。逆に、背景が青い点の場合は、モデルが誤って予測しています。
- 背景の青とオレンジは拡大縮小されます。たとえば、可視化の左側は無地の青ですが、可視化の中央で徐々に白くなっています。色の強さは、モデルの推測の信頼度を示唆するものと考えることができます。つまり、青が点灯しているということは、モデルの信頼度が非常に高いことを意味します。青色であれば、モデルの信頼度が低いことを意味します。(図で示したモデルの可視化では、予測がうまくいっていません)。
ビジュアリゼーションを使用して、モデルの進行状況を判断します。(「優良 - 青い点のほとんどが青い背景」または「または青い点はオレンジ色の背景にあります。)プレイグラウンドには、色だけでなく、モデルの現在の損失も数値で表示されます。(減少は減少ではなく増加しています。)
タスク 1: 指定されたとおりにこの線形モデルを実行する。さまざまな学習率の設定を試して、改善が必要かどうか確認するために、1 ~ 2 分かけます。線形モデルは、このデータセットに対して効果的な結果を生み出すことができますか?
タスク 2: x1x2 などのサービス横断的な機能を追加して、パフォーマンスを最適化してみる
- 最も役に立つ機能はどれですか?
- 得られる最善のパフォーマンスは何か。
タスク 3: モデルが良い状態になったら、モデルの出力サーフェス(背景色を表示)を調べます。
- 線形モデルのようですか?
- モデルをどのように記述しますか?
(解答はエクササイズのすぐ下に表示されます)。
タスク 1 の解答の横にあるプラスアイコンをクリックします。
いいえ。線形モデルでは、このデータセットを効果的にモデル化することはできません。学習率を減らすと損失が減少しますが、損失は許容できない高い値で収束します。
タスク 2 の回答については、プラスアイコンをクリックします。
Playground のデータセットはランダムに生成されます。したがって、Google の回答が必ずしもお客様のご意見と正確に一致するとは限りません。実行間でデータセットを再生成した場合、実際の結果は常に以前の実行と必ずしも一致しません。ただし、次のようにすると、よりよい結果が得られます。
-
x12 と x22 の両方を特徴クロスとして使用する。(特徴クロスとして x1x2 を追加しただけでは効果がありません)。
-
学習率を 0.001 まで下げる。
タスク 3 の回答を開くには、プラスアイコンをクリックします。
モデル出力サーフェスが線形モデルのように見えません。むしろ、楕円形に見えます。