Sistemas de AA en el mundo real: Predicción del cáncer

En esta lección, depurarás un problema del AA en el mundo real* relacionado con la predicción del cáncer.

Ejemplo del mundo real: Predicción del cáncer

  • El modelo se entrenó para predecir “probabilidad de que un paciente tenga cáncer” a partir de las historias clínicas
Células cancerosas
  • El modelo se entrenó para predecir “probabilidad de que un paciente tenga cáncer” a partir de las historias clínicas
  • Entre los atributos, se incluyen la edad del paciente, el género, las enfermedades anteriores, el nombre del hospital, los signos vitales, los resultados de las pruebas
Células cancerosas
  • El modelo se entrenó para predecir “probabilidad de que un paciente tenga cáncer” a partir de las historias clínicas
  • Entre los atributos, se incluyen la edad del paciente, el género, las enfermedades anteriores, el nombre del hospital, los signos vitales, los resultados de las pruebas
  • El modelo tuvo un rendimiento excelente en los datos de prueba retenidos
Células cancerosas
  • El modelo se entrenó para predecir “probabilidad de que un paciente tenga cáncer” a partir de las historias clínicas
  • Entre los atributos, se incluyen la edad del paciente, el género, las enfermedades anteriores, el nombre del hospital, los signos vitales, los resultados de las pruebas
  • El modelo tuvo un rendimiento excelente en los datos de prueba retenidos
  • Sin embargo, el modelo tuvo un rendimiento muy deficiente en los pacientes nuevos. ¿Por qué?
Células cancerosas

¿Por qué crees que el modelo no tuvo un buen rendimiento con pacientes nuevos? Intenta resolver el problema y, luego, haz clic en el botón Reproducir ▶ que aparece a continuación para ver si acertaste.

* Este módulo se basó en líneas muy generales (con algunas modificaciones sobre la marcha) en "Leakage in data mining: formulation, discovery, and evitetion" de Kaufman, Rosset y Perlich.