공정성: 편향의 유형

머신러닝 (ML) 모델은 본질적으로 객관적이지 않습니다. ML 실무자 모델에 학습 예시 데이터 세트를 제공하여 이러한 데이터의 프로비저닝과 선별에 개입함으로써 모델의 예측이 편중되기 쉽습니다.

모델을 만들 때는 모델에 영향을 줄 수 있는 데이터에 매니페스트를 삽입하여 사전 예방적 조치를 취하여 사용할 수 있습니다.

보고 편향

과거 편향

자동화 편향

표본 선택 편향

표본 선택 편향은 데이터 세트의 예시는 예시를 반영하지 않은 방식으로 살펴보겠습니다. 표본 선택 편향은 다양한 형태를 취할 수 있습니다. 여기에는 커버리지 편향, 무응답 편향, 샘플링 편향 등이 포함됩니다

포함 편향

무응답 편향

표본 추출 편향

그룹 귀인 편향

그룹 귀인 편향 전체 그룹에서 개인의 특성을 일반화하여 확인할 수 있습니다 그룹 귀인 편향은 보통 양식을 작성했습니다.

내집단 편향

외부 집단 동질화 편향

내재적 편향

확증 편향

실험자 편향

연습문제: 학습 내용 점검하기

다음 중 어떤 유형의 편향이 원인이 되었을 수 있나요? 편향된 예측으로 바꾸어 보겠습니다. 인치 어떻게 해야 할까요?
과거 편향
입학 모델은 과거의 학생 기록으로 학습되었습니다. 20년 이 데이터에 소수 학생이 과소표현되었다면 모델이 새 학생 데이터를 예측할 때 동일한 과거 불평등을 재현했을 수 있습니다.
내집단 편향
입학 모델은 현 대학생들이 학습했고 무의식적으로 입학을 선호했을 수도 있었는데 유사한 배경을 가진 사람들이었습니다. 데이터를 선별하거나 특성 추출하는 방식에 영향을 미쳤을 수 있음 데이터 세트입니다.
확증 편향
입학 모델은 현 대학생들이 학습했고 어떤 유형의 자격에 대해 이미 확신하고 있었을지를 컴퓨터 공학 프로그램의 성공과 관련이 있습니다. 그들은 다음과 같이 할 수 있습니다. 실수로 데이터를 선별하거나 특성 추출하여 모델이 이러한 기존의 신념을 확인했습니다.
자동화 편향
자동화 편향은 입학 위원회가 입학 위원회가 선택한 이유를 설명할 수 있음 ML 모델을 사용하여 입학 결정을 내리고 어쩌면 자동화된 시스템이 더 나은 결과를 낼 것이라고 인간이 내리는 결정입니다. 그러나 자동화 편향은 왜 모델 예측이 왜곡되었는지에 대한 통찰력을 얻을 수 있습니다.