머신러닝 (ML) 모델은 본질적으로 객관적이지 않습니다. ML 실무자 모델에 학습 예시 데이터 세트를 제공하여 이러한 데이터의 프로비저닝과 선별에 개입함으로써 모델의 예측이 편중되기 쉽습니다.
모델을 만들 때는 모델에 영향을 줄 수 있는 데이터에 매니페스트를 삽입하여 사전 예방적 조치를 취하여 사용할 수 있습니다.
보고 편향
-
정의
보고 편향은 데이터 세트에 캡처된 이벤트, 속성 또는 결과의 빈도가 실제 빈도를 정확하게 반영하지 않을 때 발생합니다. 이러한 편향은 평범한 것은 기록할 필요가 없다고 가정하고 특이하거나 특별히 기억에 남는 상황을 기록하는 데 집중하는 경향이 있기 때문에 발생할 수 있습니다.
-
예
감정 분석 모델은 책이 한 권의 책인지 사용자 코퍼스를 기준으로 긍정적 또는 부정적 리뷰 인기 웹사이트에 제출할 수 있습니다. 학습 데이터 세트에는 극단적인 의견( 좋아하거나 싫어함). 호의적이지 않은 경우 책에 대한 리뷰를 작성했습니다. 감정을 정확하게 예측하는 능력이 보다 섬세한 언어를 사용하여 책을 설명하는 리뷰
정의의 chevron_left를 클릭합니다.
과거 편향
-
정의
이전 편향은 이전 데이터가 당시 세상에 존재했던 불평등을 반영합니다.
-
예
1960년대의 도시 주택 데이터 세트에는 그 10년 동안 시행된 부문 차별 대출 관행을 반영하는 주택 가격 데이터가 포함되어 있습니다.
정의의 chevron_left를 클릭합니다.
자동화 편향
-
정의
자동화 편향은 결과를 선호하는 경향 자동화 시스템에서 생성된 데이터보다 각 시스템의 오류율과 관계없이
-
예
스프로킷 제조업체에서 근무하는 ML 전문가는 치아 결함을 식별하도록 학습한 새로운 '획기적인' 모델을 배포하고 싶어 했지만, 공장 감독관이 모델의 정밀도와 재현율이 인간 검사원의 정밀도와 재현율보다 모두 15% 낮다고 지적했습니다.
를 클릭합니다. chevron_left를 사용해 보세요.
표본 선택 편향
표본 선택 편향은 데이터 세트의 예시는 예시를 반영하지 않은 방식으로 살펴보겠습니다. 표본 선택 편향은 다양한 형태를 취할 수 있습니다. 여기에는 커버리지 편향, 무응답 편향, 샘플링 편향 등이 포함됩니다
포함 편향
-
정의
범위 편향은 살펴봤습니다
-
예
모델을 학습시켜 신제품의 향후 판매를 예측하고 제품을 구매한 소비자 표본을 대상으로 실시한 전화 설문조사에서 있습니다. 대신 경쟁 제품을 구매하기로 선택한 소비자 설문 조사에 응하지 않았으며, 그 결과 이 그룹은 학습 데이터에 표현됩니다.
를 클릭합니다. chevron_left를 사용해 보세요.
무응답 편향
-
정의
무응답 편향(참여도 편향이라고도 함)은 데이터 수집 과정에서 참여도 격차로 인해 데이터가 대표성을 갖지 못하는 경우에 발생합니다.
-
예
제품을 구매한 소비자 샘플과 경쟁 제품을 구매한 소비자 샘플을 대상으로 전화 설문조사를 실시한 결과를 토대로 미래의 신제품 판매량을 예측하도록 학습된 모델이 있습니다. 경쟁 제품을 구매한 소비자는 80% 더 높았습니다. 설문조사 작성을 거부할 가능성이 높았으며 데이터는 잘 드러나지 않습니다
정의의 chevron_left를 클릭합니다.
표본 추출 편향
-
정의
표본 추출 편향은 데이터 수집 중에 적절한 무작위 순서 지정이 사용되지 않을 때 발생합니다.
-
예
모델을 학습시켜 신제품의 향후 판매를 예측하고 제품을 구매한 소비자 표본을 대상으로 실시한 전화 설문조사에서 경쟁업체의 제품을 구매한 소비자 표본을 대상으로 있습니다. 설문조사 담당자는 소비자를 무작위로 타겟팅하는 대신 이메일에 응답한 첫 200명의 소비자를 뽑아 제품에 대한 열정이 평균보다 높음 있습니다.
를 클릭합니다. chevron_left를 사용해 보세요.
그룹 귀인 편향
그룹 귀인 편향 전체 그룹에서 개인의 특성을 일반화하여 확인할 수 있습니다 그룹 귀인 편향은 보통 양식을 작성했습니다.
내집단 편향
-
정의
내집단 편향은 내가 속한 그룹 또는 특성 공유할 수 있습니다
-
예
ML 실무자 2명이 이력서 선별 모델을 학습시킴 소프트웨어 개발자는 신청자가 자신의 데이터를 보호하는 데 도움이 된다고 둘 다 같은 컴퓨터 공학 아카데미에 다녔습니다. 더 적합할 수 있습니다
정의의 chevron_left를 클릭합니다.
외부 집단 동질화 편향
-
정의
외부 집단 동질화 편향은 특정 집단의 개별 구성원에 대해 대답할 수 없다는 고정 관념 소속감을 느끼게 하거나 그 특성이 더욱 동일하다고 볼 수도 있습니다.
-
예
ML 실무자 2명이 이력서 선별 모델을 학습시킴 소프트웨어 개발자는 모든 신청자가 컴퓨터 공학 아카데미에 다니지 않은 사람은 충분한 전문성을 갖추고 있는지 확인해야 합니다
를 클릭합니다. chevron_left를 사용해 보세요.
내재적 편향
-
정의
내재적 편향은 가정할 때 발생합니다. 스스로의 사고 모델과 개인적 경험을 바탕으로 항상 더 일반적으로 적용되는 것은 아닙니다
-
예
동작 인식 모델을 학습시키는 ML 전문가가 고개 가로 젓기를 기능으로 사용하여 사람이 '아니요'라는 단어를 전달하고 있음을 나타냅니다. 하지만 일부 지역에서는 실제로 머리를 흔드는 는 '예'를 나타냅니다.
정의의 chevron_left를 클릭합니다.
확증 편향
-
정의
확증 편향은 모델을 만드는 사람이 자기도 모르게 이미 가지고 있는 믿음이나 가설을 긍정하는 방향으로 데이터를 처리할 때 발생합니다.
-
예
ML 전문가가 다양한 특징(키, 체중, 품종, 환경)을 바탕으로 개의 공격성을 예측하는 모델을 만들고 있습니다. 이 전문가는 어릴 때 활동성이 강한 토이 푸들로 인해 불쾌한 일이 있었기 때문에 이후 항상 토이 푸들을 공격적인 종이라고 생각하고 있었습니다. 모델의 학습 데이터를 선별할 때 전문 분야 종사자가 무의식적으로 사용한 특성 중 작은 강아지가 순조롭게 움직였다는 증거가 있습니다.
정의의 chevron_left를 클릭합니다.
실험자 편향
-
정의
실험자 편향은 모델 빌더가 모델이 원래 가설과 일치하는 결과를 생성할 때까지 모델을 계속 학습시킬 때 발생합니다.
-
예
ML 전문가가 다양한 특징(키, 체중, 품종, 환경)을 바탕으로 개의 공격성을 예측하는 모델을 만들고 있습니다. 전문직 종사자가 직장에서 토이푸들은 활동량이 많아서 공격적인 품종. 학습된 모델이 대부분의 토이 푸들이 상대적으로 유순하다고 예측했을 때 전문가는 크기가 작은 푸들이 더 공격적이라는 결과가 나올 때까지 모델을 여러 번 다시 학습시켰습니다.
를 클릭합니다. chevron_left를 사용해 보세요.