공정성: 지식 테스트

  1. 참 또는 거짓: 과거 편향은 모델이 오래된 데이터로 학습될 때 발생합니다.

  2. 엔지니어가 전 세계 레시피 웹사이트에서 스크래핑한 다양한 특성 데이터(예: 1회 제공량, 재료, 준비 기술)를 기반으로 식사의 칼로리 함량을 예측하도록 회귀 모델을 학습시키고 있습니다. 다음 중 더 자세히 조사해야 하는 잠재적인 편향의 원인이 될 수 있는 데이터 문제는 무엇인가요?

    적절한 답변을 모두 선택합니다.

  3. 비꼬기 감지 모델은 성인 (만 18세 이상)이 보낸 40,000건과 미성년자 (만 18세 미만)가 보낸 40,000건 등 80,000건의 문자 메시지로 학습되었습니다. 그런 다음 20,000개의 메일(성인 10,000개, 미성년자 10,000개)으로 구성된 테스트 세트에서 모델을 평가했습니다. 다음 혼동 행렬은 각 그룹의 결과를 보여줍니다 (양성 예측은 '비꼼'으로 분류됨, 음성 예측은 '비꼼이 아님'으로 분류함).

    성인

    참양성 (TP): 512 거짓양성 (FP): 51
    거짓음성 (FN): 36 참음성 (TN): 9401
    정밀도 = TP/(TP + FP) = 0.909
    재현율 = TP/(TP + FN) = 0.934

    미성년자

    참양성 (TP): 2147 거짓양성 (FP): 96
    거짓음성 (FN): 2177 참음성 (TN): 5580
    정밀도 = TP/(TP + FP) = 0.957
    재현율 = TP/(TP + FN) = 0.497

    다음 중 모델의 테스트 세트 성능에 관한 올바른 설명은 무엇인가요?

    적절한 답변을 모두 선택합니다.

  4. 다음 중 비꼬기 감지 모델의 테스트 세트에 대한 하위 그룹 성과의 불일치를 설명할 수 있는 가설은 무엇인가요?

    적절한 답변을 모두 선택합니다.

  5. 엔지니어들이 위의 비꼬기 모델을 재학습시켜 연령대별 비꼬기 감지 정확성의 불일치 문제를 해결하기 위해 노력하고 있지만, 이 모델은 이미 프로덕션 버전으로 출시된 상태입니다. 다음 중 모델의 예측 오류를 완화하는 데 도움이 되는 임시 전략은 무엇인가요?