Se usó la API de Cloud Translation para traducir esta página.

Equidad: Tipos de sesgo

Los modelos de aprendizaje automático (AA) no son objetivos de manera inherente. Profesionales del AA a entrenar modelos a través de un conjunto de datos con ejemplos de entrenamiento la participación en el aprovisionamiento y la selección de estos datos puede hacer que la calidad predicciones susceptibles de sesgo.

Cuando se crean modelos, es importante tener en cuenta los sesgos humanos comunes se manifiestan en tus datos, de modo que puedas tomar medidas proactivas para mitigar sus efectos.

Sesgo de reporte

Definición

El sesgo de reporte ocurre cuando la frecuencia de eventos, propiedades o resultados capturados en un conjunto de datos no que reflejen con precisión su frecuencia en el mundo real. Este sesgo puede surgir porque las personas tienden a enfocarse en documentar circunstancias inusual o especialmente memorable, asumiendo que lo común no que se deben grabar.

Haz clic en . chevron_right para ver un ejemplo.
Ejemplo

Se entrena un modelo de análisis de opiniones para predecir si los libros las opiniones son positivas o negativas según un corpus de usuarios los envíos a un sitio web popular. La mayoría de las opiniones en la conjunto de datos de entrenamiento reflejan opiniones extremas (revisores que amaron o odiaron un libro), porque era menos probable que las personas enviaran una opinión sobre un libro si no respondió a él con firmeza. Como resultado, el modelo es menos capaz de predecir correctamente la opinión de reseñas que usan un lenguaje más sutil para describir un libro.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo histórico

Definición

El sesgo histórico ocurre cuando los datos históricos refleja las desigualdades que existían en el mundo en ese momento.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Un conjunto de datos de viviendas de una ciudad de la década de 1960 contiene datos sobre precios de viviendas que refleja prácticas de préstamos discriminatorias vigentes durante esa década.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de automatización

Definición

El sesgo de automatización es la tendencia a favorecer los resultados generadas por sistemas automatizados sobre las generadas de sistemas, sin importar la tasa de error de cada uno.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Los profesionales del AA que trabajaban para un fabricante de piñones estaban ansiosos por implementar el nuevo enfoque que entrenaron para identificar defectos dentales, hasta que el supervisor de la fábrica le indicara que el las tasas de precisión y recuperación del modelo fueron un 15% más bajas que las de inspectores humanos.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de selección

El sesgo de selección ocurre cuando los ejemplos del conjunto de datos se eligen de una manera que no refleje su distribución del mundo real. El sesgo de selección puede adoptar muchas formas diferentes, incluidos el sesgo de cobertura, el sesgo de no respuesta y el sesgo del muestreo.

Sesgo de cobertura

Definición

El sesgo de cobertura tiene lugar si los datos no se seleccionan en de manera representativa.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto. Consumidores que, en cambio, optaron por comprar un producto de la competencia no fueron encuestados y, como resultado, este grupo de personas no fue representados en los datos de entrenamiento.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de no respuesta

Definición

Sesgo de no respuesta (también conocido como sesgo de participación) ocurre si los datos terminan siendo no representativos debido a brechas de participación en la recopilación de datos el proceso de administración de recursos.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto y con una muestra de consumidores que compraron un producto producto. Los consumidores que compraron el producto de la competencia obtuvieron un 80% más se negaran a completar la encuesta, y sus datos fueron subrepresentados en la muestra.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo muestral

Definición

El sesgo del muestreo ocurre si se permite una aleatorización adecuada no se utilizan durante la recopilación de datos.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto y con una muestra de consumidores que compraron un producto producto. En lugar de orientarse a los consumidores al azar, el encuestador eligió a los primeros 200 consumidores que respondieron un correo electrónico, quienes podrían Se mostraron más entusiasmados con el producto que el promedio compradores.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de correspondencia

Sesgo de correspondencia es la tendencia a generalizar la verdad sobre los individuos para todo el grupo a las que pertenecen. El sesgo de correspondencia a menudo se manifiesta formularios.

Sesgo endogrupal

Definición

El sesgo endogrupal es una preferencia para los miembros de en tu propio grupo al que también perteneces o por características que tú también compartes.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Dos profesionales del AA entrenan un modelo para filtrar currículums de los desarrolladores de software están predispuestos a creer que los solicitantes que asistieron a la misma academia de informática que ellos están más calificados para el puesto.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de homogeneidad de los demás

Definición

El sesgo de homogeneidad de los demás es la tendencia estereotipar a los miembros individuales de un grupo al que tú pertenecen o ven sus características como más uniformes.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Dos profesionales del AA entrenan un modelo para filtrar currículums de los desarrolladores de software están predispuestos a creer que todos los solicitantes que no asistieron a una academia de informática experiencia suficiente para el puesto.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo implícito

Definición

El sesgo implícito tiene lugar cuando se realizan suposiciones. basada en el modelo propio de pensamiento y experiencias personales que no se aplican necesariamente a un nivel más general.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Un profesional de AA que entrena un modelo de reconocimiento de gestos usa un movimiento de cabeza como una función para indicar que una persona está comunicando la palabra "no". Sin embargo, en algunas regiones del mundo, un movimiento de la cabeza significa "sí".

Haz clic en . PERCENTAGE_left para la definición.

Sesgo de confirmación

Definición

El sesgo de confirmación ocurre cuando los creadores de modelos procesar inconscientemente los datos de formas que reafirman creencias preexistentes e hipótesis.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Un profesional del AA está creando un modelo que predice la agresividad en perros según sus características (altura, peso, raza, entorno). El practicante tuvo un encuentro desagradable con un caniche toy hiperactivo cuando era niño y, desde entonces, se ha asociado raza con agresión. Cuando selecciones los datos de entrenamiento del modelo, el profesional descartó inconscientemente las características que proporcionaban evidencia de docilidad en perros más pequeños.

Haz clic en . PERCENTAGE_left para la definición.

Sesgo del investigador

Definición

El sesgo de investigador ocurre cuando se crea un modelo sigue entrenando un modelo hasta que produce un resultado que se alinea con su hipótesis original.

Haz clic en . chevron_right para ver un ejemplo
Ejemplo

Un profesional del AA está creando un modelo que predice la agresividad en perros según sus características (altura, peso, raza, entorno). El practicante tuvo un encuentro desagradable con un caniche toy hiperactivo cuando era niño y, desde entonces, se ha asociado raza con agresión. Cuándo el modelo entrenado predijo más los caniches toy sean relativamente dóciles, el practicante volvió a entrenarlo varias veces más hasta que arroje un resultado que muestre caniches más pequeños a ser más violentos.

Haz clic en . PERCENTAGE_left para la definición.

Ejercicio: Comprueba tus conocimientos

¿Cuál de los siguientes tipos de sesgo podría haber contribuido? con las predicciones sesgadas en el modelo de admisiones a la universidad que se describió en la introducción?

Sesgo histórico

El modelo de admisiones se entrenó con registros de estudiantes del pasado. 20 años. Si los estudiantes minoritarios estuvieran subrepresentados en estos datos, el modelo podría haber reproducido las mismas desigualdades históricas cuando se hacen predicciones sobre los datos de los estudiantes nuevos.

Sesgo endogrupal

El modelo de admisiones fue entrenado por estudiantes universitarios actuales, que podrían haber tenido una preferencia inconsciente por admitir alumnos con antecedentes similares al suyo, podrían haber afectado la forma en que seleccionan o diseñan los atributos de los datos en los que se entrenó el modelo.

Sesgo de confirmación

El modelo de admisiones fue entrenado por estudiantes universitarios actuales, que probablemente tenía creencias preexistentes sobre qué tipos de calificaciones se correlacionan con el éxito en el programa de Informática. Podrían de forma involuntaria, seleccionaron o crearon ingeniería de atributos los datos para el modelo afirmaba esas creencias existentes.

Sesgo de automatización

El sesgo de automatización podría explicar por qué el comité de admisiones usar un modelo de AA para tomar decisiones sobre admisiones podría tener creían que un sistema automatizado produciría mejores resultados que decisiones tomadas por los humanos. Sin embargo, el sesgo de automatización no proporciona por qué las predicciones del modelo terminaron teniendo un sesgo.

Presentación (5 min)

Identificación del sesgo (10 min)

Equidad: Tipos de sesgo

Sesgo de reporte

Definición

Ejemplo

Sesgo histórico

Definición

Ejemplo

Sesgo de automatización

Definición

Ejemplo

Sesgo de selección

Sesgo de cobertura

Definición

Ejemplo

Sesgo de no respuesta

Definición

Ejemplo

Sesgo muestral

Definición

Ejemplo

Sesgo de correspondencia

Sesgo endogrupal

Definición

Ejemplo

Sesgo de homogeneidad de los demás

Definición

Ejemplo

Sesgo implícito

Definición

Ejemplo

Sesgo de confirmación

Definición

Ejemplo

Sesgo del investigador

Definición

Ejemplo

Ejercicio: Comprueba tus conocimientos