Hệ thống máy học trong thế giới thực: Dự đoán ung thư

Trong bài học này, bạn sẽ gỡ lỗi một bài toán máy học trong thế giới thực* liên quan đến dự đoán ung thư.

Ví dụ về thế giới thực: Dự đoán ung thư

  • Mô hình được đào tạo để dự đoán " bệnh nhân khả năng bị ung thư" từ bệnh án
Tế bào ung thư
  • Mô hình được đào tạo để dự đoán " bệnh nhân khả năng bị ung thư" từ bệnh án
  • Các đặc điểm bao gồm tuổi tác, giới tính, tình trạng bệnh trước đây, tên bệnh viện, các dấu hiệu sinh tồn, kết quả xét nghiệm
Tế bào ung thư
  • Mô hình được đào tạo để dự đoán " bệnh nhân khả năng bị ung thư" từ bệnh án
  • Các đặc điểm bao gồm tuổi tác, giới tính, tình trạng bệnh trước đây, tên bệnh viện, các dấu hiệu sinh tồn, kết quả xét nghiệm
  • Mô hình có hiệu suất tuyệt vời khi sử dụng dữ liệu thử nghiệm chưa công bố
Tế bào ung thư
  • Mô hình được đào tạo để dự đoán " bệnh nhân khả năng bị ung thư" từ bệnh án
  • Các đặc điểm bao gồm tuổi tác, giới tính, tình trạng bệnh trước đây, tên bệnh viện, các dấu hiệu sinh tồn, kết quả xét nghiệm
  • Mô hình có hiệu suất tuyệt vời khi sử dụng dữ liệu thử nghiệm chưa công bố
  • Nhưng mô hình có hiệu suất cực kỳ cao trên bệnh nhân mới – tại sao?
Tế bào ung thư

Tại sao bạn cho rằng mô hình này không thể hoạt động hiệu quả trên các bệnh nhân mới? Xem bạn có tìm ra vấn đề không rồi nhấp vào nút Phát ▶ bên dưới để tìm hiểu xem bạn có đúng không.

* Chúng tôi đã dựa vào mô-đun này rất rời rạc (thực hiện một số sửa đổi trong quá trình thực hiện) trên "Rò rỉ trong việc khai thác dữ liệu: công thức, phát hiện và tránh" của Kaufman, Rosset và Perlich.