Mạng nơron

Bạn có thể nhớ lại từ Bài tập chéo tính năng trong mô-đun dữ liệu danh mục, rằng vấn đề phân loại sau đây là phi tuyến tính:

Hình 1. Mặt phẳng toạ độ Descartes, được chia thành bốn
      góc phần tư, mỗi góc được lấp đầy bằng các chấm ngẫu nhiên có hình dạng giống như
      vuông. Các chấm trong góc phần tư trên cùng bên phải và dưới cùng bên trái có màu xanh dương,
      và các dấu chấm trong góc phần tư trên cùng bên trái và dưới cùng bên phải có màu cam.
Hình 1. Vấn đề phân loại phi tuyến tính. Hàm tuyến tính không được tách riêng tất cả các chấm màu xanh dương khỏi các chấm màu cam.

"Phi tuyến tính" nghĩa là bạn không thể dự đoán chính xác nhãn có của biểu mẫu \(b + w_1x_1 + w_2x_2\). Nói cách khác, "bề mặt quyết định" không phải là một đường.

Tuy nhiên, nếu chúng ta thực hiện chéo tính năng trên các tính năng $x_1$ và $x_2$, chúng ta có thể sau đó biểu thị mối quan hệ phi tuyến tính giữa hai đối tượng bằng cách sử dụng mô hình tuyến tính: $b + w_1x_1 + w_2x_2 + w_3x_3$ trong đó $x_3$ là đối tượng giao cắt giữa $x_1$ và $x_2$:

Hình 2. Cùng một mặt phẳng toạ độ Descartes màu xanh dương và cam
      như trong Hình 1.  Tuy nhiên, lần này một đường cong hyperbol màu trắng
      được vẽ trên lưới, sẽ phân tách các chấm màu xanh dương ở góc trên cùng bên phải
      và góc phần tư dưới cùng bên trái (hiện được tô bóng với nền màu xanh dương) từ
      các chấm màu cam trong góc phần tư trên cùng bên trái và dưới cùng bên phải (hiện tại
      được tô bóng với nền màu cam).
Hình 2. Bằng cách thêm chữ thập của tính năng x1x2 thì mô hình tuyến tính có thể học một hình dạng hyperbol phân tách các chấm màu xanh với các chấm màu cam.

Bây giờ, hãy xem xét tập dữ liệu sau:

Hình 3. Mặt phẳng toạ độ Descartes, được chia thành 4 góc phần tư.
      Một cụm các chấm tròn màu xanh dương nằm chính giữa tại điểm gốc của
      và được bao quanh bởi vòng tròn các chấm màu cam.
Hình 3. Một vấn đề khó phân loại phi tuyến tính hơn.

Bạn cũng có thể nhớ lại từ Bài tập chéo tính năng rằng việc xác định đúng đối tượng sẽ chuyển sang điều chỉnh mô hình tuyến tính cho phù hợp với dữ liệu này tốn nhiều công sức và thử nghiệm hơn.

Nhưng nếu bạn không phải tự mình thực hiện tất cả những thử nghiệm đó thì sao? Mạng nơron là một gia đình cấu trúc mô hình được thiết kế để tìm phi tuyến tính trong dữ liệu. Trong quá trình huấn luyện mạng nơron, model tự động học tính năng tối ưu chéo để thực hiện trên dữ liệu đầu vào nhằm giảm thiểu tổn thất.

Trong các phần sau, chúng ta sẽ xem xét kỹ hơn về cách hoạt động của mạng nơron.