Công bằng: Kiểm tra kiến thức

  1. Đúng hay sai: Thành kiến lịch sử xảy ra khi một mô hình được huấn luyện dựa trên dữ liệu cũ.

  2. Các kỹ sư đang huấn luyện một mô hình hồi quy để dự đoán hàm lượng calo của bữa ăn dựa trên nhiều dữ liệu tính năng mà họ lấy từ các trang web về công thức nấu ăn trên khắp thế giới, bao gồm cả khẩu phần, nguyên liệu chế biến và kỹ thuật chuẩn bị. Vấn đề nào sau đây về dữ liệu là nguồn có thể gây sai lệch cần được điều tra thêm?

    Chọn số lượng đáp án tuỳ ý.

  3. Một mô hình phát hiện lời nói mỉa mai được huấn luyện dựa trên 80.000 tin nhắn văn bản, 40.000 tin nhắn do người lớn (từ 18 tuổi trở lên) và 40.000 tin nhắn do trẻ vị thành niên gửi (dưới 18 tuổi). Mô hình sau đó được đánh giá trên một bộ thử nghiệm gồm 20.000 tin nhắn: 10.000 tin nhắn từ người lớn và 10.000 tin nhắn từ trẻ vị thành niên. Các ma trận nhầm lẫn sau đây cho thấy kết quả cho từng nhóm (dự đoán khẳng định biểu thị phân loại "châm biếm"; dự đoán phủ định biểu thị phân loại "không châm biếm"):

    Người lớn

    Kết quả tích cực thực (TP): 512 Kết quả sai lệch (FP): 51
    Từ khoá phủ định sai (FN): 36 True negative (TN): 9401
    Độ chính xác = TP/(TP + FP) = 0,909
    Thu hồi = TP/(TP + FN) = 0,934

    Trẻ vị thành niên

    Kết quả tích cực (TP): 2147 Số kết quả sai lệch (FP): 96
    Từ khoá phủ định sai (FN): 2177 True negative (TN): 5580
    Độ chính xác = TP/(TP + FP) = 0,957
    Thu hồi = TP/(TP + FN) = 0,497

    Câu nào sau đây là đúng về hiệu suất của tập hợp kiểm thử của mô hình?

    Chọn số lượng đáp án tuỳ ý.

  4. Giả thuyết nào sau đây có thể giải thích sự khác biệt về hiệu suất của nhóm con trong bộ thử nghiệm cho mô hình phát hiện lời nói mỉa mai ở trên?

    Chọn số lượng đáp án tuỳ ý.

  5. Các kỹ sư đang nỗ lực cải thiện mô hình châm biếm nói trên để giải quyết các vấn đề không nhất quán về độ chính xác của việc phát hiện lời nói mỉa mai trong các nhóm nhân khẩu học về độ tuổi. Tuy nhiên, mô hình này đã được phát hành chính thức. Chiến lược khoảng trống nào sau đây sẽ giúp giảm thiểu lỗi trong thông tin dự đoán của mô hình?