データトラップ

学習目標

このモジュールで学ぶ内容は、次のとおりです。

  • 未加工データセットや処理済みデータセットの潜在的な問題を調査する 問題に集中できます
  • バイアス、無効な推論、正当化を特定する。
  • データ分析で一般的な問題(相関、 関連性、関連性がありません。
  • よくある問題、誤解、 誤解を招くような表示やデザインの 選択は避けられます

ML に対するモチベーション

モデル アーキテクチャや他のダウンストリーム モデル作業ほど華やかではありませんが、 データ探索、文書化、前処理は、 説明しますML の実務担当者は、Nitya Sambasivan 他が呼び出された データカスケード 2021 年の ACM 論文に記載 次の点を深く理解していない

  • データが収集される条件
  • データの品質、特性、制限
  • データで表示できる情報とできない情報

不良データでモデルをトレーニングすると 非常にコストがかかるため 出力の品質が低いときにのみ、出力に問題があった 説明します同様に データの限界を把握できなければ データを収集する際のバイアス、相関関係と因果関係の取り違えを 期待が高すぎる結果や期待外れの結果を 信頼の喪失となります。

このコースでは、ML やデータ アナリストが、 実務担当者が仕事の中で遭遇することがあります。