Thực hành học máy: Phân loại hình ảnh

Ngăn chặn tình trạng thích ứng quá mức

Giống như mọi mô hình học máy, mối lo ngại chính khi huấn luyện mạng nơron xoáy là quá thích ứng: mô hình được điều chỉnh theo thông tin cụ thể của dữ liệu huấn luyện đến mức không thể khái quát hoá cho các ví dụ mới. Có hai kỹ thuật để ngăn chặn việc điều chỉnh quá mức khi xây dựng một CNN:

  • Tăng cường dữ liệu: tăng cường tính đa dạng và số lượng ví dụ về việc huấn luyện bằng cách thực hiện các phép biến đổi ngẫu nhiên đối với hình ảnh hiện có để tạo một tập hợp các biến thể mới (xem Hình 7). Việc tăng cường dữ liệu đặc biệt hữu ích khi tập dữ liệu huấn luyện ban đầu tương đối nhỏ.
  • Tính năng chuẩn hoá bỏ qua: Xoá ngẫu nhiên các đơn vị khỏi mạng nơron trong bước độ dốc huấn luyện.

Sơ đồ về việc tăng cường dữ liệu trên một hình ảnh chó, tạo ra 9 hình ảnh mới thông qua các phép biến đổi ngẫu nhiên Hình 7. Tăng cường dữ liệu trên một hình ảnh chó (trích từ tập dữ liệu"Chó so với mèo" có trên Kaggle). Trái: Hình ảnh chó ban đầu trong bộ huấn luyện. Phải: 9 hình ảnh mới được tạo từ hình ảnh gốc bằng cách sử dụng các phép biến đổi ngẫu nhiên.