Hệ thống học máy sản xuất: Kiểm tra kiến thức

  1. Bạn đang dùng công nghệ học máy để xây dựng một mô hình phân loại nhằm dự đoán sự xuất hiện của kỳ lân. Tập dữ liệu của bạn mô tả chi tiết 10.000 lần xuất hiện kỳ lân và 10.000 lần xuất hiện kỳ lân. Tập dữ liệu này chứa vị trí, thời gian trong ngày, độ cao, nhiệt độ, độ ẩm, mức độ che phủ của cây, sự hiện diện của cầu vồng và một số đối tượng khác.

    Sau khi chạy công cụ dự đoán giao diện kỳ lân, bạn cần phải làm mới mô hình bằng cách huấn luyện lại dữ liệu mới. Vì đang thu thập quá nhiều dữ liệu mới để huấn luyện, bạn quyết định giới hạn dữ liệu huấn luyện bằng cách lấy mẫu dữ liệu mới trong một khoảng thời gian. Bạn cũng cần tính đến các xu hướng hằng ngày và hằng năm khi xuất hiện kỳ lân. Bạn chọn khoảng thời gian nào?

  2. Bạn chạy công cụ dự đoán giao diện kỳ lân. Quảng cáo hoạt động tốt! Bạn đi nghỉ và quay lại sau 3 tuần để thấy rằng chất lượng mô hình của mình đã giảm đáng kể. Giả sử hành vi của kỳ lân khó có khả năng thay đổi đáng kể sau 3 tuần. Đâu là lý do phù hợp nhất cho việc giảm chất lượng?

  3. Bạn xem lại các dự đoán của mô hình cho Nam Cực và phát hiện ra mô hình đã đưa ra những dự đoán kém hiệu quả ở đó kể từ khi mô hình được đưa vào sản xuất. Nguyên nhân nào sau đây có thể là nguyên nhân của vấn đề?

  4. Công cụ dự đoán giao diện kỳ lân của bạn đã hoạt động được một năm. Bạn đã khắc phục nhiều vấn đề và chất lượng hiện đã đạt mức cao. Tuy nhiên, bạn nhận thấy một vấn đề nhỏ nhưng dai dẳng. Chất lượng mô hình của bạn thấp hơn một chút ở khu vực thành thị. Đâu có thể là nguyên nhân?

  5. Thông qua tất cả các biện pháp khắc phục sự cố, bạn đã cải thiện đáng kể chất lượng dự đoán của mô hình kỳ lân, nhờ đó, mức sử dụng đã tăng gấp 10 lần. Tuy nhiên, người dùng hiện đang phàn nàn rằng mô hình này cực kỳ chậm; yêu cầu suy luận thường mất hơn 30 giây để trả về dự đoán. Thay đổi nào sau đây có thể giúp giải quyết vấn đề này?