Ngăn chặn tình trạng quá mức
Giống như mọi mô hình máy học, một mối quan tâm chính cần được chú ý khi đào tạo một mạng nơron tích cực là trùng lặp: một mô hình được điều chỉnh theo các chi tiết cụ thể của dữ liệu huấn luyện để không thể tổng quát hoá các ví dụ mới. Hai kỹ thuật giúp ngăn chặn tình trạng trang bị quá mức khi xây dựng CNN là:
- Tăng cường dữ liệu: tăng tính đa dạng và số lượng ví dụ huấn luyện một cách giả tạo bằng cách thực hiện các biến đổi ngẫu nhiên đối với hình ảnh hiện có để tạo một tập hợp các biến thể mới (xem Hình 7). Tính năng tăng cường dữ liệu đặc biệt hữu ích khi tập dữ liệu đào tạo ban đầu tương đối nhỏ.
- Bỏ qua quy trình chuẩn hoá: Xoá ngẫu nhiên các đơn vị khỏi mạng nơron trong một bước chuyển đổi độ dốc.
Hình 7. Tăng cường dữ liệu trên một hình ảnh một con chó (được trích xuất từ "Dogs so với Cats" tập dữ liệu có sẵn trên Kaggle). Trái: Hình ảnh con chó ban đầu từ bộ đào tạo. Bên phải: Chín hình ảnh mới được tạo từ hình ảnh gốc sử dụng các phép biến đổi ngẫu nhiên.