クラスタリング ワークフロー

データをクラスタ化する手順は次のとおりです。

  1. データを準備する。
  2. 類似度指標を作成します。
  3. クラスタリング アルゴリズムを実行する。
  4. 結果を解釈し、クラスタリングを調整する。

このページでは、この手順について簡単に紹介します。この後のモジュールで できます。

データの準備

他の ML 問題と同様に、特徴データの正規化、スケーリング、変換が必要 そのデータでモデルをトレーニングまたは微調整しますまた、 使用する場合は、準備したデータで計算が正確に 類似性を検出します。

類似度指標を作成

クラスタリング アルゴリズムでデータをグループ化する前に、その類似度を知る必要があります。 説明します。サンプル間の類似度は、 類似度指標を作成します。そのためには、類似度の指標を 分析できます

クラスタリング アルゴリズムを実行する

クラスタリング アルゴリズムは、データのクラスタとの類似性指標を使用します。 このコースでは K 平均法を使用します。

結果を解釈して調整

クラスタリングではグラウンド トゥルースが生成されたり含まれたりしないためユーザーが 検証できるため、結果を元のモデルとの 期待値を理解する必要があります。結果に 品質が低い場合は、前の 3 つのステップを試してください。続行 ニーズを満たす品質が得られるまで反復処理を行います。