Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

データトラップ

学習目標

このモジュールで学ぶ内容は、次のとおりです。

未加工データセットや処理済みデータセットの潜在的な問題を調査する問題に集中できます
バイアス、無効な推論、正当化を特定する。
データ分析で一般的な問題（相関、関連性、関連性がありません。
よくある問題、誤解、誤解を招くような表示やデザインの選択は避けられます

ML に対するモチベーション

モデルアーキテクチャや他のダウンストリームモデル作業ほど華やかではありませんが、データ探索、文書化、前処理は、説明しますML の実務担当者は、Nitya Sambasivan 他が呼び出されたデータカスケード 2021 年の ACM 論文に記載次の点を深く理解していない

データが収集される条件
データの品質、特性、制限
データで表示できる情報とできない情報

不良データでモデルをトレーニングすると非常にコストがかかるため出力の品質が低いときにのみ、出力に問題があった説明します同様にデータの限界を把握できなければデータを収集する際のバイアス、相関関係と因果関係の取り違えを期待が高すぎる結果や期待外れの結果を信頼の喪失となります。

このコースでは、ML やデータアナリストが、実務担当者が仕事の中で遭遇することがあります。

データの品質と解釈

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2024-07-26 UTC。