Công bằng: Bình đẳng về cơ hội

Trong phần trước, chúng ta đã đánh giá mô hình tuyển sinh về tính công bằng bằng cách sử dụng nhân khẩu học tương đương bằng cách so sánh tỷ lệ chấp nhận tổng thể của cả các nhóm nhân khẩu học khác nhau.

Ngoài ra, chúng ta có thể so sánh tỷ lệ chấp nhận của chỉ ứng cử viên trong nhóm đa số và nhóm thiểu số. Nếu tỷ lệ chấp nhận đối với số sinh viên đủ điều kiện trong cả hai nhóm là như nhau, mô hình thể hiện bình đẳng về cơ hội: sinh viên có nhãn ưu tiên ("đủ điều kiện nhập học") sẽ có điểm số cơ hội được chấp nhận, bất kể họ thuộc nhóm nhân khẩu học nào sang.

Hãy cùng xem lại nhóm ứng viên trong phần trước:

Nhóm đa số Nhóm thiểu số
Đủ điều kiện 35 15
Không đủ điều kiện 45 5

Giả sử mô hình tuyển sinh chấp nhận 14 ứng viên thuộc nhóm đa số và 6 ứng cử viên thuộc nhóm thiểu số. Các quyết định của mô hình đáp ứng mức độ bình đẳng về cơ hội, vì tỷ lệ chấp nhận cho cả hai đủ điều kiện là đa số và ứng cử viên thiểu số đủ điều kiện là 40%.

Nhóm 100 ứng cử viên, được chia thành 2 nhóm: Bị từ chối
      Ứng viên (66 học sinh màu xanh dương, 14 học sinh màu cam) và Đã chấp nhận
      Ứng viên (14 học sinh màu xanh, 6 học sinh màu cam). Trong thẻ Được chấp nhận
      nhóm, tất cả 20 học sinh đều được tô màu xanh lục (biểu thị
      đủ điều kiện) và trong nhóm Bị từ chối có 21 học sinh màu xanh dương và 9
      màu cam của học sinh cũng bị tô màu xanh lục
Hình 4. Bảng chi tiết các ứng viên bị từ chối và được chấp nhận, với tất cả học sinh đủ điều kiện trong cả nhóm đa số và nhóm thiểu số được tô bóng có màu xanh lục. Trong số 35 học sinh đủ điều kiện trong nhóm đa số, có 14 em đã chấp nhận. Trong số 15 học sinh đủ điều kiện thuộc nhóm thiểu số, có 6 em đã chấp nhận. Do đó, cả hai nhóm đều có tỷ lệ chấp nhận là 40% cho sinh viên đủ điều kiện.

Bảng sau đây định lượng các con số hỗ trợ quảng cáo bị từ chối và được chấp nhận các ứng viên trong Hình 4.

Nhóm đa số Nhóm thiểu số
Đã chấp nhận Bị từ chối Đã chấp nhận Bị từ chối
Đủ điều kiện 14 21 6 9
Không đủ điều kiện 0 45 0 5

Lợi ích và hạn chế

Lợi ích chính của mức độ bình đẳng về cơ hội là nó cho phép tỷ lệ dự đoán tích cực và tiêu cực để thay đổi giữa các nhóm nhân khẩu học, miễn là mô hình đó cũng thành công như nhau trong việc dự đoán nhãn ưu tiên ("đủ điều kiện nhập học") cho cả hai nhóm.

Các dự đoán của mô hình trong Hình 4 không đáp ứng sự tương đồng về nhân khẩu học, là học sinh trong nhóm đa số thì có 17,5% cơ hội được chấp nhận, và thì một học sinh thuộc nhóm thiểu số sẽ có 30% cơ hội được chấp nhận. Tuy nhiên, một sinh viên đủ điều kiện có 40% cơ hội được chấp nhận, bất kể nhóm của họ, đây có thể là kết quả công bằng hơn trong trường hợp sử dụng mô hình cụ thể.

Một nhược điểm của cơ hội bình đẳng là cơ hội được thiết kế để sử dụng trong những trường hợp có nhãn ưu tiên rõ ràng. Nếu các yếu tố đó đều quan trọng mô hình này dự đoán cả lớp khẳng định ("đủ điều kiện nhập học") và lớp phủ định ("không đủ điều kiện để được nhập học") cho tất cả các nhóm nhân khẩu học, thì bạn nên dùng chỉ số tỷ lệ cược bằng để thực thi tỷ lệ thành công như nhau cho cả hai nhãn.

Một nhược điểm khác của cơ hội bình đẳng là nó đánh giá tính công bằng bằng cách so sánh tỷ lệ lỗi tổng hợp cho các nhóm nhân khẩu học, điều này có thể không phải lúc nào cũng khả thi. Ví dụ: nếu tập dữ liệu của mô hình tuyển sinh Nếu không có tính năng demographic_group, thì bạn không thể tách riêng tỷ lệ chấp nhận đối với các ứng cử viên đa số và thiểu số đủ điều kiện và so sánh chúng để xem liệu có thoả mãn cơ hội bằng nhau hay không.

Trong phần tiếp theo, chúng ta sẽ xem xét một chỉ số khác về tính công bằng, đó là phản thực tế về sự công bằng, có thể được áp dụng trong các trường hợp mà dữ liệu nhân khẩu học không có sẵn cho tất cả các ví dụ.

Bài tập: Kiểm tra kiến thức

Đúng hay sai: Không thể tạo mô hình phân loại nhị phân đáp ứng cả sự bình đẳng về nhân khẩu học và sự bình đẳng về cơ hội trên cùng một nhóm các dự đoán.
Đúng
Các dự đoán của mô hình có thể đáp ứng cả hai yếu tố nhân khẩu học sự cân bằng và bình đẳng về cơ hội. Để xem liệu bạn có thể nghĩ ra tình huống trong đó cả hai chỉ số đều được thoả mãn, rồi chọn kịch bản còn lại câu trả lời dưới đây để xem phần giải thích của chúng tôi.
Sai

Các dự đoán của mô hình có thể đáp ứng cả hai yếu tố nhân khẩu học sự cân bằng và bình đẳng về cơ hội.

Ví dụ: giả sử một thuật toán phân loại nhị phân (có nhãn ưu tiên là lớp dương) được đánh giá dựa trên 100 ví dụ, với kết quả được trình bày trong các ma trận nhầm lẫn sau đây, được chia theo nhóm nhân khẩu học (đa số và thiểu số):

Nhóm đa số Nhóm thiểu số
Dự đoán dương Dự đoán âm Dự đoán dương Dự đoán âm
Kết quả tích cực thực tế 6 12 3 6
Tiêu cực thực tế 10 36 6 21

\(\text{Positive Rate} = \frac{6+10}{6+10+12+36} = \frac{16}{64} = \text{25%}\)

\(\text{True Positive Rate} = \frac{6}{6+12} = \frac{6}{18} = \text{33%}\)

\(\text{Positive Rate} = \frac{3+6}{3+6+6+21} = \frac{9}{36} = \text{25%}\)

\(\text{True Positive Rate} = \frac{3}{3+6} = \frac{3}{9} = \text{33%}\)

Cả nhóm đa số và nhóm thiểu số đều có tỷ lệ dự đoán tích cực 25%, đáp ứng sự tương đồng về nhân khẩu học và tỷ lệ dương thực sự (tỷ lệ phần trăm ví dụ có nhãn được ưu tiên phân loại chính xác) là 33%, đáp ứng sự bình đẳng về cơ hội.