学習目標
このモジュールで学ぶ内容は、次のとおりです。
- 未加工データセットや処理済みデータセットの潜在的な問題を調査する 問題に集中できます
- バイアス、無効な推論、正当化を特定する。
- データ分析で一般的な問題(相関、 関連性、関連性がありません。
- よくある問題、誤解、 誤解を招くような表示やデザインの 選択は避けられます
ML に対するモチベーション
モデル アーキテクチャや他のダウンストリーム モデル作業ほど華やかではありませんが、 データ探索、文書化、前処理は、 説明しますML の実務担当者は、Nitya Sambasivan 他が呼び出された データカスケード 2021 年の ACM 論文に記載 次の点を深く理解していない
- データが収集される条件
- データの品質、特性、制限
- データで表示できる情報とできない情報
不良データでモデルをトレーニングすると 非常にコストがかかるため 出力の品質が低いときにのみ、出力に問題があった 説明します同様に データの限界を把握できなければ データを収集する際のバイアス、相関関係と因果関係の取り違えを 期待が高すぎる結果や期待外れの結果を 信頼の喪失となります。
このコースでは、ML やデータ アナリストが、 実務担当者が仕事の中で遭遇することがあります。