このページは Cloud Translation API によって翻訳されました。 公平性: 知識をテストする パスウェイに戻る 正誤問題: 過去のバイアスは、古いデータでモデルをトレーニングしたときに発生する。 True False エンジニアは回帰モデルをトレーニングし、世界中のレシピウェブサイトからスクレイピングしたさまざまな特徴データ(1 人分量、材料、調理手法など)に基づいて食事のカロリー含有量を予測しています。次のデータの問題のうち、さらなる調査が必要となる潜在的なバイアスの原因はどれですか? 正しいと思われる解答をすべて選択してください。 40,000 のトレーニング サンプルのうち約 4,000 に、特徴「サービング サイズ」の値が欠けていました。 約 5,000 件のトレーニング サンプルはインペリアル単位(オンス、ポンドなど)で測定し、他の 35,000 件のサンプルはメートル単位(グラム、リットルなど)で測定しました。 40,000 個のトレーニング用サンプルのうち約 100 個で、正しくない可能性が高い成分値がありました(例:100 スティックのバター)。 一部の人気の食事については、他の一般的な食事と比較してトレーニング データで過小評価されていました(例: ドーサのトレーニング サンプルは 200 件だが、ピザについては 10 件のみ)。 皮肉検出モデルは、成人(18 歳以上)から送信された 40,000 件のメッセージと未成年(18 歳未満)から送信された 40,000 件のメッセージを含む 80,000 件のテキスト メッセージでトレーニングされました。次に、大人から 1 万件、未成年者から 1 万件という 20,000 件のメッセージのテストセットでモデルを評価しました。次の混同行列は、各グループの結果を示しています(陽性の予測は「皮肉」の分類を意味し、陰性の予測は「皮肉ではない」の分類を意味します)。 大人 真陽性(TP): 512 偽陽性(FP): 51 偽陰性(FN): 36 真陰性(TN): 9401 適合率 = TP /(TP + FP)= 0.909 再現率 = TP /(TP + FN)= 0.934 未成年者 真陽性(TP): 2,147 偽陽性(FP): 96 偽陰性(FN): 2,177 真陰性(TN): 5,580 適合率 = TP /(TP + FP)= 0.957 再現率 = TP /(TP + FN)= 0.497 モデルのテストセットのパフォーマンスに関する以下の説明のうち、正しいものはどれですか。 正しいと思われる解答をすべて選択してください。 このモデルは、未成年のサンプルよりも成人のサンプルのほうが優れたパフォーマンスを発揮します。 大人から送信された 10,000 件のメッセージはクラス不均衡なデータセットです。 未成年者が送信した 10,000 件のメッセージはクラス不均衡なデータセットです。 未成年者が送信するメッセージの約 50% は、誤って「皮肉」に分類されています。 このモデルは、未成年者の皮肉なメッセージの約 50% を「皮肉的」に分類できません。 上記の皮肉検出モデルのテストセットにおけるサブグループのパフォーマンスの差異の説明として考えられる仮説は、次のうちどれですか。 正しいと思われる解答をすべて選択してください。 このモデルは「皮肉的」な予測を過度に行っています。その結果、未成年者を分類する際のエラーが増えることになります。テストセットには未成年者からの皮肉なメッセージが多いため。 このモデルは、大人のものよりも未成年者のネガティブな(皮肉的ではない)例で評価されたため、未成年者の誤差が多くなりました。 未成年のテキスト メッセージの皮肉はわかりにくいため、モデルによってフラグが付けられる可能性が低くなります。 大人が発信する実際の皮肉なメッセージは、未成年者が発信するよりもはるかに少ないです。よりクラスバランスの取れた大人のメッセージ セットでモデルが評価された場合、そのサブグループの再現率が低下する可能性があります。 エンジニアは、上記の皮肉モデルの再トレーニングに取り組んでおり、年齢属性における皮肉検出精度の不整合に対処していますが、このモデルはすでに本番環境にリリースされています。次の暫定的な戦略のうち、モデルの予測の誤差を軽減するのに役立つものはどれですか。 モデルの使用を、未成年者から送信されたテキスト メッセージに制限します。 モデルの出力を調整し、モデルが最初に予測した内容に関係なく、未成年者から送信されたすべてのテキスト メッセージに対して「皮肉」が返されるようにします。 未成年から送信されたテキスト メッセージに対してモデルが「皮肉ではない」と予測した場合は、モデルが代わりに「わからない」という値を返すように出力を調整します。 解答を送信 error_outline テストの採点中にエラーが発生しました。もう一度お試しください。