특성 교차: 플레이그라운드 실습

특성 교차 소개

특성 교차를 통해 모델이 비선형 데이터에 적합하도록 할 수 있을까요? 확인해 보려면 이 연습을 시도해 보세요.

과제: 다음 세 가지 입력 특성의 가중치를 수동으로 변경하여 파란색 점과 주황색 점을 구분하는 모델을 만들어 보세요.

1개₁
x₂
x₁ x₂(특성 교차)

몸무게를 직접 변경하려면 다음 단계를 따르세요.

특성을 출력에 연결하는 선을 클릭합니다. 입력 양식이 표시됩니다.
해당 입력 양식에 부동 소수점 값을 입력합니다.
Enter 키를 누릅니다.

이 연습의 인터페이스에는 단계 버튼이 없습니다. 이 연습에서는 모델을 반복적으로 학습시키지 않기 때문입니다. 오히려 모델의 '최종' 가중치를 직접 입력합니다.

연습 바로 아래에 답변이 표시됩니다.

답변의 더하기 아이콘을 클릭합니다.

w₁ = 0
w₂ = 0입니다.
x₁ x₂ = 1 (또는 양수 값)

특성 교차에 음수 값을 입력하면 모델이 파란색 점을 주황색 점과 분리하지만 예측이 완전히 잘못됩니다. 즉, 모델은 파란색 점의 주황색과 주황색 점의 파란색을 예측합니다.

더 복잡한 특성 교차

이제 몇 가지 고급 특성 교차 조합을 사용해 보겠습니다. 이 Playground 실습의 데이터 세트는 다트 게임에서 시끄러운 과녁처럼 보이며 중앙에는 파란색 점이 있고 외부 링에는 주황색 점이 있습니다.

더하기 아이콘을 클릭하여 모델 시각화에 대한 설명을 확인합니다.

각 플레이그라운드 실습에는 모델의 현재 상태가 시각적으로 표시됩니다. 예를 들어 시각화는 다음과 같습니다.

모델 시각화와 관련하여 다음 사항에 유의하세요.

각 축은 특정 특성을 나타냅니다. 스팸 대 스팸 아님의 경우 특성은 단어 수와 이메일 수신자 수일 수 있습니다.
참고: 적절한 축 값은 특성 데이터에 따라 다릅니다. 위에 표시된 축 값은 단어 수 또는 수신자 수에 적합하지 않으며, 둘 다 음수가 될 수 없습니다.
각 점은 이메일과 같은 데이터 예시의 특성값을 표시합니다.
점의 색상은 예가 속한 클래스를 나타냅니다. 예를 들어 파란색 점은 스팸이 아닌 이메일을 나타내고 주황색 점은 스팸 이메일을 나타낼 수 있습니다.
배경색은 모델이 예측한 색상의 예를 어디서 찾을 수 있는지에 대한 예측을 나타냅니다. 파란색 점 주위의 파란색 배경은 모델이 해당 예를 올바르게 예측하고 있음을 의미합니다. 반대로, 파란색 점 주위의 주황색 배경은 모델이 해당 예를 잘못 예측하고 있음을 의미합니다.
배경 파란색과 오렌지색은 크기가 조정됩니다. 예를 들어 시각화의 왼쪽은 파란색으로 계속 표시되지만 시각화의 중심에서는 점차 흰색으로 바뀝니다. 색 강도는 추측에 있는 모델의 신뢰도를 제안하는 것으로 생각할 수 있습니다. 파란색은 확신이 강하다는 의미이며, 하늘색은 모델 신뢰도가 낮음을 의미합니다. (그림에 표시된 모델 시각화는 예측이 제대로 작동하지 않습니다.)

모델의 진행 상황을 확인하려면 시각화를 사용하세요. (아주 좋음 - 파란색 점 대부분은 파란색 배경이 있습니다.' 또는 파란색 점의 배경은 주황색입니다.') 색상뿐만 아니라 플레이그라운드도 모델의 현재 손실을 숫자로 표시합니다. (&O; 손실이 감소하는 것이 아니라 증가하는 중입니다.")

작업 1: 지정된 대로 이 선형 모델을 실행합니다. 1~2분 정도 시간을 내어 다양한 학습률 설정을 사용해 보면서 개선사항을 찾을 수 있는지 확인해 보세요. 선형 모델이 이 데이터 세트의 효과를 얻을 수 있나요?

작업 2: 이제 x₁x₂와 같은 크로스 프로덕트 특성을 추가하여 성능을 최적화해 보세요.

가장 도움이 되는 기능은 무엇인가요?
얻을 수 있는 최고의 성능은 무엇인가요?

작업 3: 적절한 모델이 있으면 모델 출력 표면 (배경 색상으로 표시됨)을 확인합니다.

선형 모델처럼 보이나요?
이 모델을 어떻게 설명하시겠어요?

연습 바로 아래에 답변이 표시됩니다.

작업 1의 답을 보려면 더하기 아이콘을 클릭합니다.

아니요. 선형 모델은 이 데이터 세트를 효과적으로 모델링할 수 없습니다. 학습률을 낮추면 손실이 감소하지만 여전히 허용할 수 없는 높은 값으로 손실이 수렴됩니다.

작업 2의 답을 보려면 더하기 아이콘을 클릭합니다.

Playground의 데이터 세트는 무작위로 생성됩니다. 따라서 Google의 답변이 정확하게 일치하지 않을 수도 있습니다. 실제로 실행 사이에 데이터 세트를 다시 생성하는 경우 자체 결과가 항상 이전 실행과 정확히 일치하지는 않습니다. 그렇지만 다음과 같은 방법으로 더 나은 결과를 얻을 수 있습니다.

x₁²와 x₂²를 모두 특성 교차로 사용합니다. x₁x₂를 특성 교차로 추가하면 도움이 되지 않는 것으로 보입니다.
학습률을 0.001로 낮춥니다.

작업 3의 답변을 보려면 더하기 아이콘을 클릭하세요.

모델 출력 표면이 선형 모델처럼 보이지 않습니다. 오히려 타원형으로 보입니다.

원-핫 벡터 교차

프로그래밍 실습