Equidad: Tipos de sesgo

Los modelos de aprendizaje automático (AA) no son objetivos de manera inherente. Profesionales del AA a entrenar modelos a través de un conjunto de datos con ejemplos de entrenamiento la participación en el aprovisionamiento y la selección de estos datos puede hacer que la calidad predicciones susceptibles de sesgo.

Cuando se crean modelos, es importante tener en cuenta los sesgos humanos comunes se manifiestan en tus datos, de modo que puedas tomar medidas proactivas para mitigar sus efectos.

Sesgo de reporte

Sesgo histórico

Sesgo de automatización

Sesgo de selección

El sesgo de selección ocurre cuando los ejemplos del conjunto de datos se eligen de una manera que no refleje su distribución del mundo real. El sesgo de selección puede adoptar muchas formas diferentes, incluidos el sesgo de cobertura, el sesgo de no respuesta y el sesgo del muestreo.

Sesgo de cobertura

Sesgo de no respuesta

Sesgo muestral

Sesgo de correspondencia

Sesgo de correspondencia es la tendencia a generalizar la verdad sobre los individuos para todo el grupo a las que pertenecen. El sesgo de correspondencia a menudo se manifiesta formularios.

Sesgo endogrupal

Sesgo de homogeneidad de los demás

Sesgo implícito

Sesgo de confirmación

Sesgo del investigador

Ejercicio: Comprueba tus conocimientos

¿Cuál de los siguientes tipos de sesgo podría haber contribuido? con las predicciones sesgadas en el modelo de admisiones a la universidad que se describió en la introducción?
Sesgo histórico
El modelo de admisiones se entrenó con registros de estudiantes del pasado. 20 años. Si los estudiantes minoritarios estuvieran subrepresentados en estos datos, el modelo podría haber reproducido las mismas desigualdades históricas cuando se hacen predicciones sobre los datos de los estudiantes nuevos.
Sesgo endogrupal
El modelo de admisiones fue entrenado por estudiantes universitarios actuales, que podrían haber tenido una preferencia inconsciente por admitir alumnos con antecedentes similares al suyo, podrían haber afectado la forma en que seleccionan o diseñan los atributos de los datos en los que se entrenó el modelo.
Sesgo de confirmación
El modelo de admisiones fue entrenado por estudiantes universitarios actuales, que probablemente tenía creencias preexistentes sobre qué tipos de calificaciones se correlacionan con el éxito en el programa de Informática. Podrían de forma involuntaria, seleccionaron o crearon ingeniería de atributos los datos para el modelo afirmaba esas creencias existentes.
Sesgo de automatización
El sesgo de automatización podría explicar por qué el comité de admisiones usar un modelo de AA para tomar decisiones sobre admisiones podría tener creían que un sistema automatizado produciría mejores resultados que decisiones tomadas por los humanos. Sin embargo, el sesgo de automatización no proporciona por qué las predicciones del modelo terminaron teniendo un sesgo.