公平性:偏誤的類型

機器學習 (ML) 模型本來就不是最終目標,機器學習從業人員 將訓練範例的資料集提供給模型 相關處理和彙整資料,都可能會導致模型 容易出現偏誤的預測結果

建構模型時,請務必瞭解常見的人類偏誤, 資料清單,方便您主動採取相關措施來降低 效果。

回報偏誤

歷來偏誤

自動化偏誤

選取偏誤

選擇偏誤是指 資料集範例的選擇方式無法反映資料集的樣本 和現實世界的分佈情形選取偏誤可能有多種不同形式 包括涵蓋率偏誤、非回應偏誤,以及抽樣偏誤。

涵蓋偏誤

非回應偏誤

取樣偏誤

團體歸因偏誤

團體歸因偏誤 傾向將個人的特質放大到整個團體 所屬的機構。團體歸因偏誤通常出現在以下兩個層面 表單。

內團體偏誤

外團體同質性偏誤

隱性偏誤

確認偏誤

實驗者偏誤

練習:隨堂測驗

以下類型可能造成何種偏誤 與上述的大學招生模型 英吋 簡介
歷來偏誤
我們根據學生過往的記錄訓練入學模型 20 年。如果這項資料中出現弱勢族群 以免模型重現到相同的歷史不平等現象 對新學生資料進行預測
內團體偏誤
我們只用現任大專院校的學生訓練招生模型。 誰可能有不自覺地偏好承認學生 它們來自類似機構的背景 可能影響了他們規劃資料或特徵工程的方式 然後用於訓練模型
確認偏誤
我們只用現任大專院校的學生訓練招生模型。 他們對哪類所需的 是否與電腦科學計劃的成功相關他們可以 誤將資料收錄或以功能製作 模型肯定了這些現有信念
自動化偏誤
自動化偏誤可能說明招生委員會選擇哪些原因 使用機器學習模型製定入學決策他們的 認為自動化系統能帶來比 人類決策然而,自動化偏誤無法提供 任何深入分析資訊,說明模型預測結果出現偏差的原因。