自動機械学習(AutoML)

新しい機械学習(ML)プロジェクトを開始する際、 手動トレーニングが唯一の選択肢となる場合はあり 手動トレーニングでは、ML フレームワークを使用してコードを記述し、モデルを作成します。イベント中 このプロセスでは、探索して反復的に調整するアルゴリズムを選択します。 適切なモデルを見つけます。

もちろん、考慮すべきことはモデルのトレーニングだけではありません。イン プロトタイプから本番環境まで ML モデルを構築し、 反復的なタスクと専門的なスキルが伴います。単純な探索的 ML 次のようになります。

図 1. シンプルな ML ワークフロー。
図 1. シンプルな ML データ探索ワークフロー。

反復作業 - ML ワークフローでは、反復作業と 必要があります。たとえば、モデル開発では、一般的に次のことを行う必要があります。 アルゴリズムとハイパーパラメータのさまざまな組み合わせを試して、 決定します。手動トレーニングでは、トレーニング データ用に特殊なコードを記述し、 モデルをトレーニングしてからコードを調整して、さまざまな ML でテストを実施する ハイパーパラメータをチューニングして最適なモデルを見つけます。小規模または探索的 問題にはならないかもしれませんが 大規模なプロジェクトの場合は 時間がかかる可能性があります。

専門的なスキル - ML モデルを手動で開発するには、専門的なスキル、 学びました。実際には、ML モデルの開発を計画しているすべてのチームが スキルを身につけているかもしれません。チームに専任のデータサイエンティストがいない場合は この作業を手動で行うことは現実的でない可能性があります。

幸い、モデル開発の特定のステップを自動化することで、 反復作業の負担や専門スキルの必要性がなくなります。これらを自動化することで AutoML に関するこのモジュールのテーマです。

AutoML とは

AutoML は、Google Cloud で ML ワークフローの特定のタスクを実行できます AutoML は、プロダクトを実際に構築するための より速く、より幅広いユーザー グループが利用しやすい形で ML モデルを作成できます。 自動化は ML ワークフロー全体で役立ちますが、 モデル開発サイクルに含まれるものも 示しています。繰り返し行うタスクには、次のようなものがあります。

  • データ エンジニアリング <ph type="x-smartling-placeholder">
      </ph>
    • 特徴量エンジニアリング
    • 特徴を選択する。
  • トレーニング <ph type="x-smartling-placeholder">
      </ph>
    • 適切な ML アルゴリズムの特定。
    • 最適なハイパーパラメータを選択する。
  • 分析 <ph type="x-smartling-placeholder">
      </ph>
    • トレーニング中に生成された指標を、テストと検証に基づいて評価する 検証用データセットです。

AutoML を使用すると、特徴ではなく ML の問題とデータに集中できる モデルの選択、ハイパーパラメータの調整、適切なアルゴリズムの選択など、多岐にわたります。