Công bằng: Các loại thiên kiến

Các mô hình học máy (ML) vốn không phải là mô hình khách quan. chuyên viên học máy huấn luyện các mô hình bằng cách cung cấp cho chúng một tập dữ liệu gồm các ví dụ huấn luyện và con người tham gia vào việc cung cấp và tuyển chọn dữ liệu này có thể giúp dự đoán dễ bị thiên lệch.

Khi xây dựng mô hình, điều quan trọng là phải nhận thức được các thiên kiến phổ biến của con người có thể tệp kê khai trong dữ liệu của mình để bạn có thể chủ động thực hiện các bước nhằm giảm thiểu các hiệu ứng.

Thiên vị trong báo cáo

Xu hướng trước đây

Xu hướng tự động hoá

Thiên vị khi lựa chọn

Thiên vị lựa chọn xảy ra nếu các ví dụ của tập dữ liệu được chọn theo cách không phản ánh phân phối trong thế giới thực. Thiên kiến lựa chọn có thể có nhiều hình thức, bao gồm sai lệch do phạm vi sử dụng, sai lệch do không phản hồi và sai lệch lấy mẫu.

Thiên vị mức độ phù hợp

Thành kiến khi không phản hồi

Xu hướng lấy mẫu

Xu hướng phân bổ theo nhóm

Xu hướng phân bổ theo nhóm có xu hướng khái quát hoá những điều đúng đắn của một cá nhân cho cả nhóm để của mình. Thành kiến phân bổ nhóm thường thể hiện ở hai điều sau biểu mẫu.

Thiên vị cùng nhóm

Thành kiến về tính đồng nhất ngoài nhóm

Xu hướng ngầm ẩn

Thiên vị xác nhận

Thiên vị của người thử nghiệm

Bài tập: Kiểm tra kiến thức

Loại thiên kiến nào sau đây có thể là nguyên nhân các dự đoán sai lệch trong mô hình tuyển sinh đại học đã mô tả trong giới thiệu?
Xu hướng trước đây
Mô hình tuyển sinh được đào tạo dựa trên hồ sơ của học sinh trước đây 20 năm. Nếu học sinh là người thiểu số không được thể hiện đúng mức trong dữ liệu này, mô hình đó có thể đã tái hiện sự bất bình đẳng trước đây tương tự khi đưa ra dự đoán về dữ liệu mới của học sinh.
Thiên vị cùng nhóm
Mô hình tuyển sinh được đào tạo bởi các sinh viên đang theo học đại học, những người có thể đã vô thức muốn nhận học sinh xuất thân từ hoàn cảnh giống với hoàn cảnh của họ, có thể đã ảnh hưởng đến cách họ tuyển chọn hoặc thiết kế tính năng dữ liệu mà mô hình được huấn luyện.
Thiên vị xác nhận
Mô hình tuyển sinh được đào tạo bởi các sinh viên đang theo học đại học, những người có khả năng tin tưởng từ trước về các loại khả năng chuyên môn tương quan với sự thành công trong chương trình khoa học máy tính. Họ có thể đã vô tình tuyển chọn hoặc thiết kế tính năng dữ liệu sao cho mô hình này đã khẳng định những niềm tin hiện có này.
Xu hướng tự động hoá
Thành kiến của tự động hoá có thể giải thích tại sao hội đồng tuyển sinh chọn sử dụng mô hình ML để đưa ra quyết định tuyển sinh; chúng có thể có đã tin rằng một hệ thống tự động sẽ tạo ra kết quả tốt hơn quyết định do con người đưa ra. Tuy nhiên, xu hướng tự động hoá sẽ không mang lại bất kỳ thông tin chi tiết nào về lý do khiến dự đoán của mô hình bị sai lệch.