本頁面由 Cloud Translation API 翻譯而成。

公平性：偏誤的類型

機器學習 (ML) 模型本來就不是最終目標，機器學習從業人員將訓練範例的資料集提供給模型相關處理和彙整資料，都可能會導致模型容易出現偏誤的預測結果

建構模型時，請務必瞭解常見的人類偏誤，資料清單，方便您主動採取相關措施來降低效果。

回報偏誤

定義

報表偏誤是指出現頻率不高的在資料集中擷取的事件、屬性和/或結果時，不會能準確反映實際展示頻率這類偏誤可能會因為大家較傾向於記錄不尋常或特別令人難忘影片。

按一下 chevron_right 範例。
範例

情緒分析模型經過訓練，可預測書籍是否評論為正面或負面，提交熱門網站的連結訓練資料集反映了極端意見 (評論者喜歡或討厭某本書)，因為使用者較不可能提交書籍有些人沒有給予嚴苛的迴響身為因此，模型無法準確預測以更不雅的用語描述書籍的評論。

按一下 chevron_left 的定義。

歷來偏誤

定義

歷來偏誤是在歷來資料造成反映當時世界存在的不平等現象

按一下 chevron_right 範例
範例

城市中的 1960 年代資料集含有本土價格資料反映歧視性借貸做法十年前。

按一下 chevron_left 的定義。

自動化偏誤

定義

自動化偏誤往往偏向追求結果、自動化系統和非自動化系統產生的指標任何系統的錯誤率。

按一下 chevron_right 範例
範例

任職於供應鏈製造商的機器學習從業人員很積極部署新的「突破性」訓練編碼器-解碼器模型等弱點，直到工廠主管指出模型精確度和喚回度都比那些數據低 15% 以提供人類檢查工具

按一下 chevron_left 的定義。

選取偏誤

選擇偏誤是指資料集範例的選擇方式無法反映資料集的樣本和現實世界的分佈情形選取偏誤可能有多種不同形式包括涵蓋率偏誤、非回應偏誤，以及抽樣偏誤。

涵蓋偏誤

定義

涵蓋範圍偏誤只有在未選取具有代表性的時尚風格

按一下 chevron_right 範例
範例

模型經過訓練，可預測新產品日後的銷售量系統會對曾經購買廣告的消費者進行手機問卷調查原先選擇購買競爭對手產品的消費者進而未受試者的調查結果呈現的符記

按一下 chevron_left 的定義。

非回應偏誤

定義

非回應偏誤 (又稱 「參與性偏誤」) 資料收集的參與機會出現落差，因此沒有代表性上傳資料集之後，您可以運用 AutoML 自動完成部分資料準備工作

按一下 chevron_right 範例
範例

模型經過訓練，可預測新產品日後的銷售量系統會對曾經購買廣告的消費者進行手機問卷調查並向有意購買競爭對手產品的消費者樣本產品。購買競爭對手產品的消費者，比購買者多 80% 使用者拒絕填寫問卷調查，而他們的資料是樣本中代表的弱勢族群

按一下 chevron_left 的定義。

取樣偏誤

定義

取樣偏誤：不用於收集資料

按一下 chevron_right 範例
範例

模型經過訓練，可預測新產品日後的銷售量系統會對曾經購買廣告的消費者進行手機問卷調查並向有意購買競爭對手產品的消費者樣本產品。問卷調查員並非隨機指定消費者選擇前 200 名回覆電子郵件的消費者對這項產品的興趣程度高於平均值購物者。

按一下 chevron_left 的定義。

團體歸因偏誤

團體歸因偏誤 傾向將個人的特質放大到整個團體所屬的機構。團體歸因偏誤通常出現在以下兩個層面表單。

內團體偏誤

定義

「群組內偏誤」是您也擁有自己的群組可分享的資訊

按一下 chevron_right 範例
範例

兩名機器學習從業人員訓練了軟體開發人員會預先認定申請者和兩人都參加過同一個電腦科學學院也較適合這個職務

按一下 chevron_left 的定義。

外團體同質性偏誤

定義

外部團體同質性偏誤經常是您不對某些群體的刻板印象，形成，或將其特性視為更統一的樣子。

按一下 chevron_right 範例
範例

兩名機器學習從業人員訓練了軟體開發人員可能會預先認為所有申請者未參加電腦科學學院的學生沒有參加足以讓這個角色具備足夠的專業知識

按一下 chevron_left 的定義。

隱性偏誤

定義

隱性偏誤是發生假設的情況進行預先闢謠介入措施但不一定適用

按一下 chevron_right 範例
範例

機器學習從業人員訓練手勢辨識模型時，會使用頭部搖動表示某人正在回答「否」這個字。但在某些國家/地區，我們真的是一副標示「是」。

按一下 chevron_left 的定義。

確認偏誤

定義

模型建構工具時發生「確認偏誤」無意識地處理資料的方式，證明自己既有的看法和假設

按一下 chevron_right 範例
範例

機器學習從業人員正在建構可預測積極策略的模型根據各種特徵 (身高、體重、品種、環境)。專業執業人員與非常活潑的玩具貴賓狗進行攻擊。收錄模型的訓練資料時以免從業人員無意識地捨棄所提供的功能但也沒有明顯的證據

按一下 chevron_left 的定義。

實驗者偏誤

定義

實驗者偏誤是指模型製作工具會持續訓練模型，直到模型產生符合原本的假設

按一下 chevron_right 範例
範例

機器學習從業人員正在建構可預測積極策略的模型根據各種特徵 (身高、體重、品種、環境)。專業執業人員與非常活潑的玩具貴賓狗進行攻擊。訓練模型在預測期間玩具貴賓狗相對可愛，從業人員模型會再多次產生結果就會增加一些暴力圖案

按一下 chevron_left 的定義。

練習：隨堂測驗

以下類型可能造成何種偏誤與上述的大學招生模型英吋簡介

歷來偏誤

我們根據學生過往的記錄訓練入學模型 20 年。如果這項資料中出現弱勢族群以免模型重現到相同的歷史不平等現象對新學生資料進行預測

內團體偏誤

我們只用現任大專院校的學生訓練招生模型。誰可能有不自覺地偏好承認學生它們來自類似機構的背景可能影響了他們規劃資料或特徵工程的方式然後用於訓練模型

確認偏誤

我們只用現任大專院校的學生訓練招生模型。他們對哪類所需的是否與電腦科學計劃的成功相關他們可以誤將資料收錄或以功能製作模型肯定了這些現有信念

自動化偏誤

自動化偏誤可能說明招生委員會選擇哪些原因使用機器學習模型製定入學決策他們的認為自動化系統能帶來比人類決策然而，自動化偏誤無法提供任何深入分析資訊，說明模型預測結果出現偏差的原因。

簡介 (5 分鐘)

找出偏誤 (10 分鐘)

公平性：偏誤的類型

回報偏誤

定義

範例

歷來偏誤

定義

範例

自動化偏誤

定義

範例

選取偏誤

涵蓋偏誤

定義

範例

非回應偏誤

定義

範例

取樣偏誤

定義

範例

團體歸因偏誤

內團體偏誤

定義

範例

外團體同質性偏誤

定義

範例

隱性偏誤

定義

範例

確認偏誤

定義

範例

實驗者偏誤

定義

範例

練習：隨堂測驗