배운 내용 테스트하기

다음 질문은 핵심 ML 개념을 이해하는 데 도움이 됩니다.

예측력

지도 ML 모델은 라벨이 지정된 예가 포함된 데이터 세트를 사용하여 학습됩니다. 모델은 특성에서 라벨을 예측하는 방법을 학습합니다. 그러나 데이터 세트의 모든 특성이 예측력을 갖는 것은 아닙니다. 경우에 따라 일부 기능만 라벨의 예측자로 작용합니다. 아래 데이터 세트에서 가격을 라벨로, 나머지 열을 기능으로 사용합니다.

자동차 속성의 라벨이 지정된 예시

자동차 가격을 가장 잘 예측할 수 있는 세 가지 기능은 무엇인가요?
Tire_size, wheel_base, year
Color, height, make_model
Miles, gearbox, make_model.
Make_model, year, miles

지도 학습 및 비지도 학습

문제에 따라 감독 방식 또는 비감독 방식을 사용합니다. 예를 들어 예측하려는 값이나 카테고리를 미리 알고 있다면 감독 학습을 사용합니다. 하지만 데이터 세트에 관련 예시의 세분화 또는 그룹이 포함되어 있는지 알아보려면 감독 없는 학습을 사용합니다.

온라인 쇼핑 웹사이트의 사용자 데이터 세트가 있고 여기에 다음 열이 포함되어 있다고 가정해 보겠습니다.

고객 속성 행의 이미지입니다.

사이트를 방문하는 사용자 유형을 파악하려면 지도 학습과 비지도 학습 중 어느 학습을 사용해야 하나요?
지도 학습: 사용자가 속한 클래스를 예측하려고 하기 때문입니다.
비지도 학습

다음과 같은 열이 있는 주택 에너지 사용량 데이터 세트가 있다고 가정해 보겠습니다.

홈 속성 행의 이미지입니다.

새로 지어진 주택에서 연간 사용되는 킬로와트시를 예측하려면 어떤 유형의 ML을 사용해야 하나요?
비지도 학습
지도 학습

다음과 같은 열이 있는 항공편 데이터 세트가 있다고 가정해 보겠습니다.

항공편 데이터 행의 이미지입니다.

버스 티켓 비용을 예측하려면 회귀 분석을 사용해야 하나요, 아니면 분류를 사용해야 하나요?
분류
회귀
데이터 세트를 기반으로 버스 티켓 가격을 '높음', '평균', '낮음'으로 분류하는 분류 모델을 학습할 수 있나요?
아니요. 분류 모델은 spam 또는 not_spam와 같은 두 가지 카테고리만 예측합니다. 이 모델은 세 가지 카테고리를 예측해야 합니다.
아니요. 분류 모델을 만들 수는 없습니다. coach_ticket_cost 값은 범주형이 아닌 숫자입니다.
예. 하지만 먼저 coach_ticket_cost 열의 숫자 값을 범주형 값으로 변환해야 합니다.

학습 및 평가

모델을 학습한 후 라벨이 지정된 예가 포함된 데이터 세트를 사용하여 모델을 평가하고 모델의 예측 값을 라벨의 실제 값과 비교합니다.

질문에 가장 적절한 답변 두 개를 선택하세요.

모델의 예측이 크게 벗어난 경우 이를 개선하기 위해 취할 수 있는 조치는 무엇인가요?
모델을 다시 학습시키되 라벨에 대한 예측력이 가장 강력하다고 생각되는 특성만 사용합니다.
다른 학습 방식을 시도해 보세요. 예를 들어 지도 방식을 사용했다면 비지도 방식을 사용해 봅니다.
더 크고 다양한 데이터 세트를 사용하여 모델을 다시 학습시킵니다.
예측이 크게 벗어난 모델은 수정할 수 없습니다.

이제 ML 여정의 다음 단계를 진행할 준비가 되었습니다.

  • 사람 + AI 가이드북 Google 직원, 업계 전문가, 학술 연구에서 제시한 ML 사용을 위한 일련의 방법, 권장사항, 예시를 찾고 있다면

  • 문제 프레이밍 ML 모델을 만들고 그 과정에서 일반적인 함정을 피하기 위한 현장에서 검증된 접근 방식을 찾고 있다면

  • 머신러닝 단기집중과정 ML에 대해 심층적이고 실무적인 접근 방식으로 자세히 알아보고자 하는 경우