Công nghệ học máy sẽ đơn giản hơn nhiều nếu tất cả đường cong mất trông giống như thế này vào lần đầu tiên bạn huấn luyện mô hình của mình:
Thật không may, đường cong về tổn thất thường rất khó diễn giải. Sử dụng để giải các bài tập trên trang này.
Bài tập 1: Đường cong tổn thất dao động
Ba điều bạn có thể làm để thử cải thiện đường cong về khả năng ngừng sử dụng
được minh hoạ trong Hình 21.
Kiểm tra dữ liệu của bạn dựa trên giản đồ dữ liệu để phát hiện các ví dụ không hợp lệ, và
thì hãy xoá các ví dụ không hợp lệ khỏi tập huấn luyện.
Có, đây là một phương pháp hay cho tất cả mô hình.
Giảm tốc độ học.
Có, việc giảm tốc độ học thường là một ý hay khi gỡ lỗi
vấn đề huấn luyện.
Giảm lượng tập huấn luyện xuống một số ít ví dụ đáng tin cậy.
Mặc dù kỹ thuật này nghe có vẻ nhân tạo, nhưng thực sự là một kỹ thuật hay
ý tưởng. Giả sử mô hình hội tụ trên tập nhỏ
ví dụ đáng tin cậy, sau đó bạn có thể dần dần thêm nhiều ví dụ hơn,
có thể là tìm ra các ví dụ dẫn đến đường cong tổn thất
dao động.
Tăng số lượng ví dụ trong tập huấn luyện.
Đây là một ý tưởng hấp dẫn nhưng rất khó có thể khắc phục được
sự cố.
Tăng tốc độ học.
Nhìn chung, hãy tránh tăng tốc độ học khi
đường cong học tập cho thấy một vấn đề.
Bài tập 2. Đường cong mất đi kèm bước nhảy vọt
Hai câu lệnh nào sau đây có thể xác định được khả năng
nguyên nhân gây ra tổn thất do nổ được minh hoạ trong Hình 22.
Dữ liệu đầu vào chứa một hoặc nhiều NaN – ví dụ: một giá trị
gây ra bởi phép chia cho 0.
Trường hợp này thường xảy ra hơn dự kiến.
Dữ liệu đầu vào có chứa một loạt các điểm ngoại lai.
Đôi khi, do việc trộn các lô không đúng cách, một lô có thể
chứa nhiều điểm ngoại lai.
Tốc độ học quá thấp.
Tốc độ học tập rất thấp có thể làm tăng thời gian đào tạo, nhưng
không phải là nguyên nhân của đường cong tổn thất kỳ lạ.
Tốc độ điều chỉnh quá cao.
Đúng, mức điều chỉnh rất cao có thể ngăn mô hình
converging; tuy nhiên, điều đó không gây ra đường cong tổn thất kỳ lạ
được minh hoạ trong Hình 22.
Bài tập 3. Mất kiểm thử khác với số lần ngừng huấn luyện
Một câu nào sau đây xác định đúng nhất:
lý do dẫn đến sự khác biệt này giữa đường cong tổn thất trong quá trình đào tạo
và tập hợp thử nghiệm?
Mô hình này đang vượt quá tập huấn luyện.
Vâng, có lẽ là vậy. Giải pháp khả thi:
- Làm cho mô hình đơn giản hơn, có thể bằng cách giảm số lượng nhiều tính năng.
- Tăng tốc độ điều chỉnh.
- Đảm bảo rằng tập huấn luyện và tập kiểm thử đều có ý nghĩa thống kê tương đương.
Tốc độ học quá cao.
Nếu tốc độ học tập quá cao, đường cong tổn thất cho tập huấn luyện
có thể sẽ không hoạt động như trước.
Bài tập 4. Đường cong tổn thất bị mắc kẹt
Một câu nào sau đây có khả năng xuất hiện nhất
lời giải thích cho đường cong tổn thất thất thường được thể hiện trong Hình 24?
Tập hợp huấn luyện chứa các chuỗi ví dụ lặp lại.
Đây là một khả năng. Đảm bảo rằng bạn đang xáo trộn các ví dụ
đủ.
Tốc độ điều chỉnh quá cao.
Đây không phải là nguyên nhân.
Tập hợp huấn luyện chứa quá nhiều tính năng.
Đây không phải là nguyên nhân.