Equidad: Pon a prueba tus conocimientos

  1. Verdadero o falso: El sesgo histórico ocurre cuando un modelo se entrena con datos antiguos.

  2. Los ingenieros están entrenando un modelo de regresión para predecir el contenido calórico de las comidas en función de una variedad de datos de atributos que recopilaron de sitios web de recetas de todo el mundo, como el tamaño de la porción, los ingredientes y las técnicas de preparación. ¿Cuáles de los siguientes problemas de datos son posibles fuentes de sesgo que deben investigarse más a fondo?

    Selecciona todas las respuestas que consideres correctas.

  3. Se entrenó un modelo de detección de sarcasmo con 80,000 mensajes de texto: 40,000 mensajes enviados por adultos (mayores de 18 años) y 40,000 mensajes enviados por menores (menores de 18 años). Luego, el modelo se evaluó en un conjunto de prueba de 20,000 mensajes: 10,000 de adultos y 10,000 de menores. Las siguientes matrices de confusión muestran los resultados de cada grupo (una predicción positiva significa una clasificación de "sarcástico"; una predicción negativa significa una clasificación de "no sarcástico"):

    Adultos

    Verdaderos positivos (VP): 512 Falsos positivos (FP): 51
    Falsos negativos (FN): 36 Verdaderos negativos (VN): 9401
    Precisión = VP/(VP + FP) = 0.909
    Recuperación = VP/(VP + FN) = 0.934

    Menores

    Verdaderos positivos (VP): 2,147 Falsos positivos (FP): 96
    Falsos negativos (FN): 2,177 Verdaderos negativos (VN): 5,580
    Precisión = VP/(VP + FP) = 0.957
    Recuperación = VP/(VP + FN) = 0.497

    ¿Cuáles de las siguientes afirmaciones sobre el rendimiento del conjunto de prueba del modelo son verdaderas?

    Selecciona todas las respuestas que consideres correctas.

  4. ¿Cuál de las siguientes hipótesis podrían explicar las discrepancias en el rendimiento de los subgrupos en el conjunto de prueba del modelo de detección de sarcasmo anterior?

    Selecciona todas las respuestas que consideres correctas.

  5. Los ingenieros están trabajando en volver a entrenar el modelo de sarcasmo anterior para abordar las incoherencias en la precisión de la detección del sarcasmo en todos los segmentos demográficos de edad, pero el modelo ya se lanzó en producción. ¿Cuál de las siguientes estrategias provisorias ayudará a mitigar errores en las predicciones del modelo?