公平性: 知識をテストする

  1. 正誤問題: 過去のバイアスは、古いデータでモデルをトレーニングしたときに発生する。

  2. エンジニアは回帰モデルをトレーニングし、世界中のレシピウェブサイトからスクレイピングしたさまざまな特徴データ(1 人分量、材料、調理手法など)に基づいて食事のカロリー含有量を予測しています。次のデータの問題のうち、さらなる調査が必要となる潜在的なバイアスの原因はどれですか?

    正しいと思われる解答をすべて選択してください。

  3. 皮肉検出モデルは、成人(18 歳以上)から送信された 40,000 件のメッセージと未成年(18 歳未満)から送信された 40,000 件のメッセージを含む 80,000 件のテキスト メッセージでトレーニングされました。次に、大人から 1 万件、未成年者から 1 万件という 20,000 件のメッセージのテストセットでモデルを評価しました。次の混同行列は、各グループの結果を示しています(陽性の予測は「皮肉」の分類を意味し、陰性の予測は「皮肉ではない」の分類を意味します)。

    大人

    真陽性(TP): 512 偽陽性(FP): 51
    偽陰性(FN): 36 真陰性(TN): 9401
    適合率 = TP /(TP + FP)= 0.909
    再現率 = TP /(TP + FN)= 0.934

    未成年者

    真陽性(TP): 2,147 偽陽性(FP): 96
    偽陰性(FN): 2,177 真陰性(TN): 5,580
    適合率 = TP /(TP + FP)= 0.957
    再現率 = TP /(TP + FN)= 0.497

    モデルのテストセットのパフォーマンスに関する以下の説明のうち、正しいものはどれですか。

    正しいと思われる解答をすべて選択してください。

  4. 上記の皮肉検出モデルのテストセットにおけるサブグループのパフォーマンスの差異の説明として考えられる仮説は、次のうちどれですか。

    正しいと思われる解答をすべて選択してください。

  5. エンジニアは、上記の皮肉モデルの再トレーニングに取り組んでおり、年齢属性における皮肉検出精度の不整合に対処していますが、このモデルはすでに本番環境にリリースされています。次の暫定的な戦略のうち、モデルの予測の誤差を軽減するのに役立つものはどれですか。