이 페이지는 Cloud Translation API를 통해 번역되었습니다. 공정성: 지식 테스트 경로로 돌아가기 참 또는 거짓: 과거 편향은 모델이 오래된 데이터로 학습될 때 발생합니다. 참 거짓 엔지니어가 전 세계 레시피 웹사이트에서 스크래핑한 다양한 특성 데이터(예: 1회 제공량, 재료, 준비 기술)를 기반으로 식사의 칼로리 함량을 예측하도록 회귀 모델을 학습시키고 있습니다. 다음 중 더 자세히 조사해야 하는 잠재적인 편향의 원인이 될 수 있는 데이터 문제는 무엇인가요? 적절한 답변을 모두 선택합니다. 학습 예시 40,000개 중 약 4,000개에서 특성 '서빙 크기' 값이 누락되었습니다. 학습 예시 중 약 5,000개는 야드파운드법 (온스, 파운드 등) 단위로 측정한 반면, 나머지 35,000개 예의 측정값은 미터법 (그램, 리터 등)이었습니다. 40,000개의 학습 예시 중 약 100개의 성분 값이 정확하지 않을 가능성이 매우 높은 것으로 보입니다 (예: 버터 100스틱). 일부 인기 있는 식사가 다른 인기 식사에 비해 학습 데이터에서 과소 표현되었습니다 (예: 도사에 대한 학습 예시는 200개이지만 피자의 학습 예시는 10개뿐). 비꼬기 감지 모델은 성인 (만 18세 이상)이 보낸 40,000건과 미성년자 (만 18세 미만)가 보낸 40,000건 등 80,000건의 문자 메시지로 학습되었습니다. 그런 다음 20,000개의 메일(성인 10,000개, 미성년자 10,000개)으로 구성된 테스트 세트에서 모델을 평가했습니다. 다음 혼동 행렬은 각 그룹의 결과를 보여줍니다 (양성 예측은 '비꼼'으로 분류됨, 음성 예측은 '비꼼이 아님'으로 분류함). 성인 참양성 (TP): 512 거짓양성 (FP): 51 거짓음성 (FN): 36 참음성 (TN): 9401 정밀도 = TP/(TP + FP) = 0.909 재현율 = TP/(TP + FN) = 0.934 미성년자 참양성 (TP): 2147 거짓양성 (FP): 96 거짓음성 (FN): 2177 참음성 (TN): 5580 정밀도 = TP/(TP + FP) = 0.957 재현율 = TP/(TP + FN) = 0.497 다음 중 모델의 테스트 세트 성능에 관한 올바른 설명은 무엇인가요? 적절한 답변을 모두 선택합니다. 미성년자의 사례보다 성인의 사례에서 모델의 성능이 더 우수합니다. 성인이 보낸 10,000건의 메시지는 클래스 불균형 데이터 세트입니다. 미성년자가 보낸 10,000건의 메시지는 클래스 불균형 데이터 세트입니다. 미성년자가 보낸 메시지의 약 50% 가 '비꼼'으로 잘못 분류되었습니다. 이 모델은 미성년자가 비꼬는 메시지의 약 50% 를 '비꼼'으로 분류하지 못합니다. 다음 중 비꼬기 감지 모델의 테스트 세트에 대한 하위 그룹 성과의 불일치를 설명할 수 있는 가설은 무엇인가요? 적절한 답변을 모두 선택합니다. 모델이 '비꼬는 것' 예측에 너무 많은 오류가 있습니다. 그 결과 미성년자를 분류할 때 더 많은 오류가 발생합니다. 문자 메시지(테스트 세트에 미성년자가 보내는 더 비꼬는 메시지가 더 많기 때문) 이 모델은 성인보다 미성년자의 부정적 (비꼼이 아닌) 예를 기준으로 평가되었기 때문에 미성년자에게 더 많은 오류가 발생했습니다. 미성년자 문자 메시지의 냉소는 미묘하기 때문에 모델이 신고될 가능성이 낮았습니다. 성인이 작성한 실제 비꼬는 메시지는 미성년자가 보낸 메시지보다 훨씬 적습니다. 클래스 균형이 더 높은 성인용 메시지 집합으로 모델을 평가하면 해당 하위 그룹에 대한 재현율이 감소할 수 있습니다. 엔지니어들이 위의 비꼬기 모델을 재학습시켜 연령대별 비꼬기 감지 정확성의 불일치 문제를 해결하기 위해 노력하고 있지만, 이 모델은 이미 프로덕션 버전으로 출시된 상태입니다. 다음 중 모델의 예측 오류를 완화하는 데 도움이 되는 임시 전략은 무엇인가요? 미성년자가 보내는 SMS에만 모델을 사용합니다. 모델이 원래 예측한 내용과 관계없이 미성년자가 보낸 모든 문자 메시지에 '비꼼'이 반환되도록 모델 출력을 조정합니다. 모델이 미성년자가 보낸 SMS를 '비꼼이 아님'으로 예측할 경우 출력을 조정하여 '확실하지 않음' 값을 반환합니다. 답변 제출 error_outline 퀴즈를 채점하는 중에 오류가 발생했습니다. 다시 시도해 주세요.