データをクラスタ化する手順は次のとおりです。
- データを準備する。
- 類似度指標を作成します。
- クラスタリング アルゴリズムを実行する。
- 結果を解釈し、クラスタリングを調整する。
このページでは、この手順について簡単に紹介します。この後のモジュールで できます。
データの準備
他の ML 問題と同様に、特徴データの正規化、スケーリング、変換が必要 そのデータでモデルをトレーニングまたは微調整しますまた、 使用する場合は、準備したデータで計算が正確に 類似性を検出します。
類似度指標を作成
クラスタリング アルゴリズムでデータをグループ化する前に、その類似度を知る必要があります。 説明します。サンプル間の類似度は、 類似度指標を作成します。そのためには、類似度の指標を 分析できます
クラスタリング アルゴリズムを実行する
クラスタリング アルゴリズムは、データのクラスタとの類似性指標を使用します。 このコースでは K 平均法を使用します。
結果を解釈して調整
クラスタリングではグラウンド トゥルースが生成されたり含まれたりしないためユーザーが 検証できるため、結果を元のモデルとの 期待値を理解する必要があります。結果に 品質が低い場合は、前の 3 つのステップを試してください。続行 ニーズを満たす品質が得られるまで反復処理を行います。