Công bằng: Các loại thiên kiến

Bản chất của các mô hình học máy (ML) không phải là khách quan. Các nhà thực hành học máy đào tạo mô hình bằng cách cung cấp cho mô hình một tập dữ liệu gồm các ví dụ về việc huấn luyện. Việc con người tham gia vào việc cung cấp và tuyển chọn dữ liệu này có thể khiến dự đoán của mô hình dễ bị thiên vị.

Khi xây dựng mô hình, bạn cần lưu ý đến những thành kiến phổ biến của con người có thể xuất hiện trong dữ liệu của mình để có thể chủ động thực hiện các bước nhằm giảm thiểu tác động của chúng.

Thiên vị dựa trên báo cáo

Xu hướng trước đây

Thiên vị tự động hoá

Thiên vị khi lựa chọn

Sự thiên vị trong lựa chọn xảy ra nếu các ví dụ của tập dữ liệu được chọn theo cách không phản ánh việc phân phối trong thực tế. Sự thiên vị trong lựa chọn có thể diễn ra dưới nhiều hình thức, bao gồm cả thiên vị về phạm vi, thiên vị về tỷ lệ không trả lời và thiên vị về mẫu.

Thiên vị mức độ phù hợp

Thiên kiến do thiếu hồi âm

Thiên vị do lấy mẫu

Thiên vị quy cho nhóm

Sự thiên vị trong việc phân bổ cho nhóm là xu hướng khái quát hoá những điều đúng về các cá nhân cho toàn bộ nhóm mà họ thuộc về. Thành kiến phân bổ theo nhóm thường thể hiện ở 2 dạng sau.

Thiên vị cùng nhóm

Thiên vị khác nhóm

Thiên kiến ngầm ẩn

Thiên vị xác nhận

Thiên vị của người thử nghiệm

Bài tập: Kiểm tra mức độ hiểu bài

Loại thiên kiến nào sau đây có thể đã góp phần tạo ra các dự đoán sai lệch trong mô hình tuyển sinh đại học được mô tả trong phần giới thiệu?
Sự thiên vị trong quá khứ
Mô hình tuyển sinh đã được đào tạo dựa trên hồ sơ học sinh trong 20 năm qua. Nếu dữ liệu này không thể hiện đúng đối với học sinh là người thiểu số, thì mô hình này có thể tái hiện sự bất bình đẳng trước đây khi đưa ra dự đoán về dữ liệu mới về học sinh.
Thiên vị cùng nhóm
Mô hình tuyển sinh được đào tạo bởi các sinh viên đại học hiện tại, những người có thể vô thức ưu tiên nhận những sinh viên có xuất thân tương tự như họ. Điều này có thể ảnh hưởng đến cách họ tuyển chọn hoặc tạo tính năng cho dữ liệu mà mô hình được đào tạo.
Thiên kiến xác nhận
Mô hình tuyển sinh được đào tạo bởi các sinh viên đại học hiện tại, những người có thể đã có niềm tin trước đó về những loại bằng cấp liên quan đến sự thành công trong chương trình khoa học máy tính. Họ có thể vô tình tuyển chọn hoặc tạo tính năng cho dữ liệu để mô hình xác nhận những niềm tin hiện có này.
Thiên vị tự động hoá
Sự thiên vị của hệ thống tự động hoá có thể giải thích lý do ban tuyển sinh chọn sử dụng mô hình học máy để đưa ra quyết định tuyển sinh; có thể họ tin rằng hệ thống tự động sẽ mang lại kết quả tốt hơn so với quyết định do con người đưa ra. Tuy nhiên, thiên kiến tự động hoá không cung cấp bất kỳ thông tin chi tiết nào về lý do dự đoán của mô hình bị sai lệch.