機器學習詞彙表:公平性

本頁包含公平性詞彙表。如要查看所有詞彙詞彙,請按這裡

A

屬性

#fairness

feature 的同義詞。

在機器學習公平性中,屬性通常是指與個人相關的特徵。

自動化偏誤

#fairness

即使自動化決策系統發生錯誤,人工決策者還是偏好自動化決策系統提供的建議,而非透過自動化功能產生的資訊。

B

偏誤 (道德/公平)

#fairness
#fundamentals

1. 對某些事物、人物或團體的刻板印象、偏見或偏愛。這些偏誤可能會影響資料收集和解讀作業、系統設計,以及使用者與系統互動的方式。這類偏誤的形式包括:

2. 取樣或回報程序產生的系統錯誤。這類偏誤的形式包括:

請勿與機器學習模型中的偏誤字詞預測偏誤混淆。

C

確認偏誤

#fairness

不斷搜尋、解讀、回想和召回資訊的方式,目的就是要確認現有信念的存在和假想。 機器學習開發人員可能會在無意間收集或標籤資料,進而影響支持現有信念的成果。確認偏誤是一種隱含偏誤

實驗者偏誤是驗證偏誤的一種形式,在實驗確認之前,實驗人員會持續訓練模型。

仿冒商品

#fairness
公平性指標會檢查分類器是否向另一個人產生相同的結果,而結果是否與第一位相同的參與者相同,但有一或多個敏感屬性除外。評估公平性方面的分類器是在模型中顯示潛在偏誤來源的一種方法。

如需更公平的公平性討論,請參閱《Worlds Coliide: Integing the different Counterfreal 假設 in Fairness》)。

涵蓋率偏誤

#fairness

請參閱選取偏誤

D

客層一致性

#fairness

模型和類別的分類結果不依賴指定的敏感屬性時,必須滿足的公平性指標

舉例來說,如果 Lilliputians 和 Brobdingnagians 都套用到 Glubbdubdrib 大學,則即使已確認的 Lilliputians 百分比與獲準的 Brobdingnagians 百分比相同,無論該群體的平均分數是否高於另一個群組,都會達成客層一致性。

這與等化機率機會平等性不同,後者允許分類結果依附敏感屬性,但不允許將特定指定可靠標籤的分類結果依附於敏感屬性。請參閱「利用更聰明的機器學習技術攻擊歧視」,針對以客層對等度最佳化進行最佳化時取得的優缺點。

截然不同的影響

#fairness

針對影響不同人口子群組的使用者進行比例不成比例的決策。這通常是指演算法決策程序傷害或某些子群組比其他子群組更有益的情況。

舉例來說,假設某個演算法判定了 Liliiputian 的迷你房屋貸款資格,但郵寄地址含有特定郵遞區號,因此較有可能將該類別歸類為「不符合資格」。如果 Bi-Endian Lilliputians 更有可能使用這個郵遞區號,那麼相較於 Little-Endian Lilliputians,這個演算法可能會導致產生不同的影響。

這與不同的處理不同,後者著重於讓子群組特徵是演算法的明確決策時的明確差異。

獨特治療

#fairness

將主旨、#39;敏感屬性計入演算法的決策過程中,讓不同的子群組有不同的處理方式。

例如,您可以使用一種演算法,根據貸款應用程式中提供的資料,決定小美房產貸款的資格。如果演算法使用 Lilliputian 的關聯做為 Big-Endian 或 Little-Endian 做為輸入內容,則會對該維度強制執行不同的處理方式。

這與截然不同的影響不同,後者著重於演算法在子群組上對社會決策的影響,在於這些子群組是否屬於模型的輸入內容。

E

機會平等

#fairness
「公平性指標」會檢查偏好的標籤 (造成個人優勢或好處) 和指定的屬性,分類器預測該屬性的所有值都同樣適用於該標籤。換句話說,無論機會是否屬於群組成員,都應評估機會資格是否均等相同。

舉例來說,假設 Glubbdubdrib University 接受利利夫人和 Brobdingnagians 通過嚴謹的數學課程。但萊利安的中學具備強大的數學課程,且絕大多數學生都符合大學課程資格。Brobdingnagians 的中學完全不提供數學課程,因此學生的數量較少。「入學」的偏好標籤會滿足機會平等;如果符合資格的學生均不可能被認定為「國籍」(Lilliputian 或 Brobdingnagian),無論這些人是 Liliiputian 還是 Brobdingnagian,她都會接受認同。

例如,假設有 100 位列支敦斯人和 100 位的布羅伯納的大學適用於格洛布杜布大學,那麼入學決策如下:

表 1. 利利維亞文申請者 (90% 符合資格)

  晉級 不合格
已接受 45 3
已遭拒 45 7
總計 90 10
合格學生百分比:45/90 = 50%
不符合學生資格的學生百分比:7/10 = 70%
學生所知的合格學生總數百分比:(45+3)/100 = 48%

 

表 2. Brobdingnagian 申請者 (10% 符合資格) 如下:

  晉級 不合格
已接受 5 9
已遭拒 5 81
總計 10 90
合格學生百分比:5/10 = 50%
不符合學生資格的學生百分比:81/90 = 90%
中等教育學生學生總數 (5+9)/100 = 14%

上述範例符合接受合格學生資格的機會平等,因為合格的 Liliiputians 和 Brobdingnagians 都有 50% 的錄取機會。

如要進一步查看機會平等的機會,請參閱「監督式學習機會的平等性」。另請參閱「使用更聰明的機器學習攻擊歧視行為」,以視覺化的方式探索在最佳化機會時,為權衡平等。

等化機率

#fairness
這個公平性指標會檢查特定屬性和屬性是否使用了特定標籤,然後確保該標籤的所有值都同樣準確預測。

舉例來說,假設 Glubbdubdrib University 接受列支敦斯文人和 Brobdingnagians 的嚴格數學要求,文學學家 ##99; 中學學生提供完善的數學課程,且絕大多數學生都符合大學課程資格。Brobdingnagians'中學完全不提供數學課程,因此學生的數量較少。除非參賽者是否為 Liliiputian 或 Brobdingnagian,只要符合資格,就有同等的機率,可以加入該計劃,如果不符合條件,也同樣可能遭到拒絕。

假設 Glubbdubdrib 有 100 位利里夫人和 100 位布羅迪納吉人的學程 大學,則入學決策如下:

表 3. 利利維亞文申請者 (90% 符合資格)

  晉級 不合格
已接受 45 2
已遭拒 45 8
總計 90 10
合格學生百分比:45/90 = 50%
不符合學生資格的學生百分比:8/10 = 80%
已向合格的 Liliiputian 學生佔比 (45+2)/100 = 47%

 

表 4. Brobdingnagian 申請者 (10% 符合資格) 如下:

  晉級 不合格
已接受 5 18
已遭拒 5 72
總計 10 90
合格學生百分比:5/10 = 50%
不符合學生資格的學生百分比:72/90 = 80%
中等教育學生學生總數 (5+18)/100 = 23%

符合條件的奇數保證,因為合格的 Lilliputian 和 Brobdingnagian 學生均有 50% 的允許機會,而不合格的 Lilliputian 和 Brobdingnagian 則有 80% 的遭拒機會。