Hệ thống học máy sản xuất: Kiểm tra kiến thức

Bạn đang dùng công nghệ học máy để xây dựng một mô hình phân loại nhằm dự đoán sự xuất hiện của kỳ lân. Tập dữ liệu của bạn mô tả chi tiết 10.000 lần xuất hiện kỳ lân và 10.000 lần xuất hiện kỳ lân. Tập dữ liệu này chứa vị trí, thời gian trong ngày, độ cao, nhiệt độ, độ ẩm, mức độ che phủ của cây, sự hiện diện của cầu vồng và một số đối tượng khác.

Sau khi chạy công cụ dự đoán giao diện kỳ lân, bạn cần phải làm mới mô hình bằng cách huấn luyện lại dữ liệu mới. Vì đang thu thập quá nhiều dữ liệu mới để huấn luyện, bạn quyết định giới hạn dữ liệu huấn luyện bằng cách lấy mẫu dữ liệu mới trong một khoảng thời gian. Bạn cũng cần tính đến các xu hướng hằng ngày và hằng năm khi xuất hiện kỳ lân. Bạn chọn khoảng thời gian nào?

Một ngày nào đó, vì cửa sổ lớn hơn sẽ dẫn đến nhiều dữ liệu và mô hình của bạn sẽ mất quá nhiều thời gian để huấn luyện.

Một tuần, để tập dữ liệu không quá lớn nhưng bạn vẫn có thể làm mịn các mẫu.

Một năm để đảm bảo rằng mô hình của bạn không bị sai lệch theo các mẫu hằng năm.

Độ lệch phân phát huấn luyện: định dạng của dữ liệu phân phát dần thay đổi tại một thời điểm nào đó sau khi mô hình bắt đầu phân phát.

Bạn đã sử dụng độ chính xác làm chỉ số trong quá trình huấn luyện.

Mô hình của bạn đã cũ.

Không có câu nào đúng.

Bạn chưa có đủ ví dụ huấn luyện cho Nam Cực.

Bạn đã sử dụng quy trình đào tạo động thay vì quy trình đào tạo tĩnh.

Mô hình của bạn đã cũ.

Tất cả chủ đề trên.

Chất lượng dự đoán cao của bạn giúp người dùng dễ dàng tìm thấy kỳ lân, điều này ảnh hưởng đến hành vi của chính nó.

Các khu vực đô thị rất khó lập mô hình.

Sự xuất hiện của kỳ lân được báo cáo nhiều lần ở các khu vực đông dân cư, làm sai lệch dữ liệu huấn luyện của bạn.

Chuyển mô hình từ huấn luyện động sang huấn luyện tĩnh.

Chuyển mô hình từ suy luận động sang suy luận tĩnh.

Hãy xác thực chất lượng mô hình trước khi phân phát.

Không giải pháp nào ở trên có thể giúp ích cho bạn.