機器學習 (ML) 模型本身並非客觀的。機器學習專家會將訓練範例資料集提供給模型進行訓練,而人為提供和策劃這類資料,可能會導致模型的預測結果出現偏差。
建構模型時,請務必瞭解資料中可能遭到竄改的常見人類偏誤,以便您主動採取相關步驟來減輕影響程度。
回報偏誤
-
定義
報表偏誤是指在資料集中擷取的事件、屬性和/或結果的頻率無法準確反映實際頻率。這種偏誤可能會是因為員工往往著重記錄異常或特別令人印象深刻的事,並假設一般不需要記錄這種情況。
-
範例
情緒分析模型經過訓練,能根據使用者在熱門網站上提交的內容資料庫,預測書籍評論的正面或負面。訓練資料集中的大多數評論都反映極端意見 (評論者對書籍的喜愛或厭惡程度),因為如果讀者對書籍沒有強烈反應,就比較不太可能提交書籍評論。因此,模型較難正確預測使用較含蓄用語描述書籍的評論情緒。
按一下定義的 chevron_left。
歷史偏誤
-
定義
如果歷來資料反映當時世界存在的不公平現象,就會產生歷來偏誤。
自動化偏誤
-
定義
自動化偏誤是指傾向認為自動化系統產生的結果,優於非自動化系統產生的結果,但忽略這些系統各自的錯誤率。
-
範例
齒輪製造商的機器學習專家急於部署訓練出來的「突破性」新模型,以便找出齒輪瑕疵,直到工廠主管指出,模型的精確度和回傳率都比人工檢查員低 15%。
按一下定義的 chevron_left。
選擇偏誤
如果選擇的資料集範例無法反映實際分佈情形,就會產生選擇偏誤。選擇偏誤的形式很多,包括涵蓋偏誤、非回應偏誤和抽樣偏誤。
涵蓋偏誤
-
定義
如果未選取具有代表性的資料,就會產生涵蓋偏誤。
-
範例
模型經過訓練後,能根據已購買產品的消費者抽樣調查,預測新產品日後的銷量。我們並未對選擇購買競爭產品的消費者進行調查,因此這群人並未列入訓練資料。
按一下定義的 chevron_left。
無回應偏誤
-
定義
如果資料收集過程中出現參與落差,導致資料最終不具代表性,就會產生無反應偏誤 (也稱為參與偏誤)。
-
範例
訓練模型時,我們會根據電話調查結果,預測新產品的未來銷售量。這項調查針對購買該產品的消費者樣本,以及購買競爭產品的消費者樣本進行。購買競爭產品的消費者拒絕完成問卷的可能性高出 80%,因此在樣本中所占比例偏低。
按一下 chevron_left 即可查看定義。
取樣偏誤
-
定義
如未在資料收集過程中妥善進行隨機取樣,就會發生取樣偏誤。
-
範例
訓練模型時,我們會根據電話調查結果,針對購買該產品的消費者樣本和購買競爭產品的消費者樣本,預測新產品的未來銷售量。調查人員並未隨機鎖定消費者,而是選擇了回覆電子郵件的前 200 位消費者,這些消費者可能比一般購買者更熱衷於產品。
按一下 chevron_left 即可查看定義。
團體歸因偏誤
團體歸因偏誤是指傾向將個人的特質放大到整個所屬團體。團體歸因偏誤通常出現在下列兩種形式中。
內團體偏誤
-
定義
內團體偏誤是指偏好您所屬群組的成員,或與您相同的特徵。
-
範例
兩位機器學習從業人員為軟體開發人員訓練履歷篩選模型時,會傾向認為與他們就讀相同電腦科學學院的應徵者,更適合擔任該職務。
按一下定義的 chevron_left。
外團體同質性偏誤
-
定義
外團體同質性偏誤是指對非我同類的群體成員抱持刻板印象,或認為其都有某些特徵。
-
範例
兩名機器學習從業人員訓練軟體開發人員的履歷篩選模型,認為未參加電腦科學學院的所有申請者都不具備充分的專業知識。
按一下定義的 chevron_left。
隱性偏誤
-
定義
如果根據不一定更廣泛適用的自身思考模式和個人經驗來提出假設,就會產生隱性偏誤。
確認偏誤
-
定義
確認偏誤是指模型建構者在處理資料時,會無意識地挑選能支持自己看法和假設的資料。
-
範例
一位機器學習專家正在建構模型,根據各種特徵 (身高、體重、品種、環境) 預測狗的攻擊性。這位實驗者在孩童時期曾與一隻過度活躍的玩具貴賓犬發生不愉快的遭遇,自此便將該品種與攻擊行為聯想在一起。收錄模型的訓練資料時,從業人員無意間捨棄為小型狗提供可用性證據的特徵。
按一下定義的 chevron_left。
實驗者偏誤
-
定義
如果模型建構者持續訓練模型,直到輸出結果符合其原始假設,就會發生實驗者偏誤。
-
範例
一位機器學習專家正在建構模型,根據各種特徵 (身高、體重、品種、環境) 預測狗的攻擊性。這位實踐者在孩童時期曾與一隻過度活躍的玩具貴賓犬發生不愉快的遭遇,自此之後,她就將這種犬種與攻擊行為聯想在一起。當訓練完成的模型預測大多數玩具貴賓犬都比較溫馴時,研究人員又再訓練了幾次模型,直到模型產生結果顯示較小的貴賓犬比較暴力。
按一下定義的 chevron_left。