Tập dữ liệu, khái quát hoá và gắn kết quá mức: Kiểm tra kiến thức của bạn

  1. Ví dụ nào sau đây là ví dụ về tập dữ liệu tĩnh?

  2. Bạn đang chuẩn bị huấn luyện một mô hình để dự đoán giá ưu đãi của ô tô đã qua sử dụng bằng cách sử dụng một tập dữ liệu có chứa các tính năng sau: year, modelmileage. Khi kiểm tra tập dữ liệu, bạn phát hiện ra rằng có 150/2.500 ví dụ bị thiếu giá trị quãng đường đã đi. Bạn nên chọn phương án nào sau đây? (Chọn tất cả câu trả lời phù hợp)

    Chọn số lượng đáp án tuỳ ý.

  3. Bạn đang huấn luyện mô hình đề xuất phim của một dịch vụ xem trực tuyến để dự đoán liệu người dùng có thích một bộ phim cụ thể hay không. Nhãn nào sau đây là nhãn proxy hợp lý cho "Người dùng đã thích bộ phim"? (Chọn tất cả câu trả lời phù hợp)

    Chọn số lượng đáp án tuỳ ý.

  4. Đúng hay sai: Huấn luyện mô hình cho đến khi mô hình đạt được giá trị tổn thất thấp trên dữ liệu kiểm thử là một cách hay để tránh tình trạng sử dụng quá mức.

  5. Điền vào chỗ trống trong câu sau:
    Việc điều chỉnh chính quy giúp mô hình của bạn có khả năng khái quát hoá dữ liệu mới bằng cách áp dụng một số hình thức phạt ___ trong quá trình huấn luyện.