Công bằng: Các loại thiên kiến

Bản chất của các mô hình học máy (ML) không phải là khách quan. Các nhà thực hành học máy đào tạo mô hình bằng cách cung cấp cho mô hình một tập dữ liệu gồm các ví dụ về việc huấn luyện. Việc con người tham gia vào việc cung cấp và tuyển chọn dữ liệu này có thể khiến dự đoán của mô hình dễ bị thiên vị.

Khi xây dựng mô hình, bạn cần lưu ý đến những thành kiến phổ biến của con người có thể xuất hiện trong dữ liệu của mình để có thể chủ động thực hiện các bước nhằm giảm thiểu tác động của chúng.

Thiên vị dựa trên báo cáo

Xu hướng trước đây

Thiên vị tự động hoá

Thiên vị khi lựa chọn

Sự thiên vị trong lựa chọn xảy ra nếu các ví dụ của tập dữ liệu được chọn theo cách không phản ánh việc phân phối trong thực tế. Sự thiên vị trong lựa chọn có thể diễn ra dưới nhiều hình thức, bao gồm cả thiên vị về phạm vi, thiên vị về tỷ lệ không trả lời và thiên vị về mẫu.

Thiên vị mức độ phù hợp

Thiên kiến do thiếu hồi âm

Thiên vị do lấy mẫu

Thiên vị quy cho nhóm

Sự thiên vị trong việc phân bổ cho nhóm là xu hướng khái quát hoá những điều đúng về các cá nhân cho toàn bộ nhóm mà họ thuộc về. Thành kiến phân bổ theo nhóm thường thể hiện ở 2 dạng sau.

Thiên vị cùng nhóm

Thiên vị khác nhóm

Thiên kiến ngầm ẩn

Thiên vị xác nhận

Thiên vị của người thử nghiệm

Bài tập: Kiểm tra mức độ hiểu bài

Loại thiên kiến nào sau đây có thể đã góp phần tạo ra các dự đoán sai lệch trong mô hình tuyển sinh đại học được mô tả trong phần giới thiệu?
Thiên kiến xác nhận
Sự thiên vị trong quá khứ
Thiên vị cùng nhóm
Thiên vị tự động hoá