신경망: 노드 및 히든 레이어

신경망 빌드 비선형성을 학습하며 다음과 같은 익숙한 모델 구조로 시작하세요. 형식의 선형 모델 y달러 = b + w_1x_1 + w_2x_2 + w_3x_3$입니다.

이 방정식을 아래와 같이 시각화할 수 있습니다. 여기서 $x_1$, $x_2$ 및 $x_3$ 는 3개의 입력 노드 (파란색)이고 $y'$는 출력 노드입니다. (녹색)

실습 1

위 모델에서 가중치편향 값이 무작위로 초기화됩니다. 다음 작업을 실행하여 선형 모델을 살펴보겠습니다 다음을 수행할 수 있습니다. 지금은 Activation Function 드롭다운을 무시합니다. 이 부분에 대해서는 모듈 후반부에서 다루도록 하겠습니다

  1. 네트워크 위의 재생 (▶️) 버튼을 클릭하여 입력값 $x_1 = 1.00$, $x_2 = 2.00$, $x_3 = 3.00$입니다.

  2. 표에서 두 번째 노드를 클릭하고 입력 레이어, 2.00부터의 값 2.50으로 변경합니다. 출력 노드의 값이 변경됩니다. 출력 선택 노드 (녹색)를 클릭하고 계산 패널을 검토하여 결과가 값이 계산되었습니다.

  3. 출력 노드 (녹색)를 클릭하여 가중치 ($w_1$, $w_2$, $w_3$)를 확인하고 편향 ($b$) 매개변수 값에 대해 학습됩니다. 가중치 값 감소 $w_3$ (다시 말하지만, 출력 노드의 값과 아래의 계산은 변경) 그런 다음 편향 값을 늘립니다. 변경사항 검토 영향을 줄 수 있습니다

네트워크에 계층 추가

이때 네트워크의 가중치와 편향 값을 실습 1 - 전반적인 수학 개념에 관계를 보여줍니다. 이 모델은 여전히 선형 모델입니다.

하지만 네트워크의 입력 레이어 사이에 어떻게 해야 할까요? 신경망 용어에서 입력 레이어와 출력 레이어는 히든 레이어 및 노드는 이러한 계층을 형성하고 뉴런.

히든 레이어의 각 뉴런 값은 선형 모델의 출력: 각 입력의 곱의 합을 구합니다. (이전 네트워크 계층의 뉴런) 및 고유한 가중치 매개변수 편향을 더합니다. 마찬가지로 다음 레이어의 뉴런 (출력 레이어)은 히든 레이어의 뉴런 값을 입력으로 사용하여 계산됩니다.

이 새로운 히든 레이어를 사용하면 모델이 다른 히든 레이어를 사용하여 입력 데이터를 매개변수 집합일 수도 있습니다. 모델이 비선형 관계를 학습하는 데 도움이 될 수 있을까요?

실습 2

뉴런이 4개 포함된 히든 레이어를 모델에 추가했습니다.

네트워크 위의 재생 (▶️) 버튼을 클릭하여 4개의 히든 레이어 노드와 입력 값의 출력 노드 $x_1 = 1.00$, $x_2 = 2.00$, $x_3 = 3.00$입니다.

그런 다음 모델을 살펴보고 이를 사용하여 다음 질문에 답하세요.

개수 매개변수 (가중치 및 편향)는 어떻게 해야 할까요?
4
실습 1의 원래 모델에서는 4개의 매개변수: w11, w21, w31, b. 이 모델에는 더 많은 매개변수가 있습니다.
12
총 매개변수 수에는 두 매개변수 모두 포함됩니다. 히든 레이어의 노드 값을 입력 값, 출력 값을 계산하는 데 사용되는 매개변수 히든 레이어의 노드 값에서 추출됩니다.
16
총 매개변수 수에는 가중치와 영향을 줄 수 있습니다.
21
히든 레이어 - 3개의 가중치 (각 입력 값에 대해 하나씩)와 총 16개의 매개변수가 있습니다. 다음으로 사용할 5개의 매개변수는 4개의 가중치( 히든 레이어)와 편향이 포함되어 있습니다 이 신경망에는 총 21개의 매개변수입니다.

모델 매개변수를 수정하여 모델에 미치는 영향을 관찰합니다. 히든 레이어 노드 값과 출력 값 (출력 값)을 아래의 계산 패널에서 이러한 값이 어떻게 계산되었는지 확인하세요. 산출됩니다.

이 모델이 비선형성을 학습할 수 있나요?

히든 레이어의 각 노드와 출력 노드를 클릭합니다. 아래의 계산을 검토하세요. 어떤 점을 알 수 있나요? 어떻게 해야 할까요?
아니요

히든 레이어의 각 노드를 클릭하고 아래의 계산에서는 모든 것이 선형인 것을 볼 수 있습니다. (곱셈과 덧셈 연산으로 구성)

그런 다음 출력 노드를 클릭하고 계산을 검토하면 이 계산은 선형입니다. 선형 선형 계산의 출력에 수행된 계산은 이 모델은 비선형성을 학습할 수 없습니다.