Equidad: Equidad contrafáctica

Hasta ahora, en nuestras discusiones sobre métricas de equidad, asumimos que nuestro entrenamiento y los ejemplos de prueba contienen datos demográficos integrales subgrupos que se están evaluando. Pero a menudo este no es el caso.

Supongamos que nuestro conjunto de datos de admisiones no contiene datos demográficos completos. En cambio, la pertenencia a un grupo demográfico se registra solo para un pequeño porcentaje de ejemplos, como los estudiantes que optaron por identificar qué grupo a los que pertenecían. En este caso, el desglose de nuestro grupo de candidatos y los estudiantes rechazados ahora tiene la siguiente apariencia:

Un grupo de 100 estudiantes, dividido en dos grupos:
      Candidatos rechazados (80 íconos de estudiantes) y candidatos aceptados (20)
      íconos de estudiantes). Todos los iconos son de color gris sombreado (lo que significa que su
      grupo demográfico es desconocido), excepto por 6 iconos. En la lista
      grupo, los íconos de dos estudiantes están sombreados en azul y los dos íconos de estudiantes están sombreados
      de color naranja. En el grupo Aceptados, el ícono de un estudiante aparece sombreado en azul y el otro aparece
      naranja sombreado.
Figura 5: Grupo de candidatos, con pertenencia a un grupo demográfico desconocido para casi todos los candidatos (íconos sombreados en gris).

En este caso, no es factible evaluar las predicciones del modelo para ningún segmento demográfico paridad o igualdad de oportunidades, porque no tenemos datos demográficos para el 94% de nuestros ejemplos. Sin embargo, el 6% de los ejemplos que sí contienen de características demográficas, de todos modos podemos comparar pares de predicciones individuales (un candidato mayoritario o minoritario) y ver si han sido tratadas equitativamente por el modelo.

Por ejemplo, supongamos que revisamos minuciosamente los datos de los atributos disponible para dos candidatos (uno en el grupo mayoritario y otro en la minoría grupo, anotado con una estrella en la imagen de abajo) y han determinado que están idénticamente calificados para la admisión en todos los aspectos. Si el modelo hace la misma predicción para ambos candidatos (es decir, cualquiera rechaza ambos) o no acepta a ambos candidatos), se dice que satisface la política contrafáctica equidad para estos ejemplos. La equidad contrafáctica estipula que dos ejemplos idénticos en todo sentido, excepto por un atributo sensible determinado (en este caso, pertenencia a un grupo demográfico), debería generar el mismo modelo. para la predicción.

El mismo grupo de candidatos que en la imagen anterior, excepto en
      esta versión, un ícono azul de estudiante (que pertenece al grupo mayoritario) y
      un ícono de estudiante naranja (que pertenezca al grupo minoritario) en la sección de solicitudes rechazadas
      grupo están anotados con una estrella, lo que indica que estos dos candidatos
      idénticos (aparte del grupo demográfico).
Figura 6. La equidad contrafáctica se satisface para los dos pares ejemplos (solo varían en cuanto a la pertenencia a un grupo demográfico) con una anotación estrella, ya que el modelo toma la misma decisión para ambos (rechazado).

Ventajas y desventajas

Como mencionamos antes, un beneficio clave de la equidad contrafáctica es que puede usarse para evaluar las predicciones de equidad en muchos casos en los que otras métricas no serían factibles. Si un conjunto de datos no contiene un conjunto completo para los atributos de grupo relevantes que se están considerando, no se ser posible evaluar la equidad con la paridad demográfica o la igualdad de oportunidades. Sin embargo, si estos atributos de grupo están disponibles para un subconjunto ejemplos y es posible identificar pares comparables de equivalentes ejemplos en diferentes grupos, los profesionales pueden usar la equidad contrafáctica como una métrica para sondear el modelo en busca de posibles sesgos en las predicciones.

Además, debido a que métricas como la paridad demográfica y la igualdad a evaluar a los grupos de oportunidades en conjunto, pueden ocultar problemas de sesgo que afectan el modelo a nivel de las predicciones individuales, que pueden ser basada en la equidad contrafáctica. Por ejemplo, imagina que nuestras admisiones acepta candidatos calificados del grupo mayoritario y de la minoría. grupo en la misma proporción, pero el candidato más calificado de la minoría rechazada, mientras que el candidato más calificado que tiene exactamente el mismo y se aceptan las credenciales. Un análisis de equidad contrafáctico puede ayudar a identificar este tipo de discrepancias para poder abordarlas.

La desventaja principal de la equidad contrafáctica es que no proporcionan una visión holística del sesgo en las predicciones del modelo. Identificar y corregir unas cuantas desigualdades en pares de ejemplos puede no ser suficiente para abordar los problemas de sesgo sistémico que afectan a subgrupos completos de ejemplos.

En los casos en que sea posible, los profesionales pueden considerar hacer una combinación un análisis de equidad (mediante una métrica como la paridad demográfica o la igualdad de oportunidad), así como un análisis de equidad contrafáctica para obtener la mayor variedad de perspectivas sobre posibles problemas de sesgo que necesitan corrección.

Ejercicio: Comprueba tus conocimientos

Figura de ejercicio. Dos grupos de círculos: Negativo
             Predicciones y predicciones positivas.
             Las predicciones negativas consisten en 50 círculos:
             39 círculos grises, 8 círculos azules y 3 círculos naranjas Uno
             el círculo azul está etiquetado como “A”, un círculo naranja está etiquetado como “A”,
             y un círculo azul está etiquetado como “C”. 
             Las predicciones positivas consisten en 15 círculos:
             10 círculos grises, 3 círculos azules y 2
             círculos naranjas. Un círculo azul está etiquetado como "B", y un círculo color naranja
             círculo está etiquetado como “B” y un círculo azul está etiquetado como “C”.
             Una leyenda debajo del diagrama indica que los círculos azules representan
             un ejemplo en el grupo mayoritario, los círculos naranjas representan
             un ejemplo en el grupo minoritario, y los círculos grises representan
             ejemplos cuya pertenencia a un grupo se desconoce
Figura 7: predicciones negativas y positivas para un lote de ejemplos; con tres pares de ejemplos etiquetados como A, B y C.

En el conjunto de predicciones de la Figura 7, ¿cuál de las siguientes opciones los siguientes pares de idénticos (excepto la pertenencia a un grupo) ejemplos recibieron predicciones que infringen la equidad contrafáctica?

Par A
Las predicciones del par A satisfacen la equidad contrafáctica, ya que ambas el ejemplo del grupo mayoritario (azul) y el ejemplo del grupo minoritario (naranja) recibió la misma predicción (negativo).
Par B
Las predicciones del par B satisfacen la equidad contrafáctica, ya que ambas el ejemplo del grupo mayoritario (azul) y el ejemplo del grupo minoritario (naranja) recibió la misma predicción (positivo).
Par C
Las predicciones del par C son para dos ejemplos que ambos pertenecen al mayoritario (azul). El hecho de que el modelo produjo diferentes para estos ejemplos idénticos sugieren que podría haber problemas de rendimiento más amplios con el modelo que deberían investigaron. Sin embargo, este resultado no infringe equidad, cuyas condiciones solo se aplican en los casos en que las dos ejemplos idénticos se extraen de grupos diferentes.
Ninguno de estos pares infringe la equidad contrafáctica
Las predicciones para los pares A y B satisfacen la equidad contrafáctica porque en ambos casos, el ejemplo del grupo mayoritario y el ejemplo del grupo minoritario reciben la misma predicción. Par C ambos pertenecen al mismo grupo (el grupo mayoritario), por lo que la equidad contrafáctica no es aplicable en este caso.

Resumen

Paridad demográfica, igualdad de oportunidades, y la equidad contrafáctica proporcionan diferentes definiciones matemáticas de equidad para las predicciones de modelos. Y esas son solo tres posibles y formas de cuantificar la equidad. Algunas definiciones de equidad son incluso mutuamente incompatibles, lo que significa que puede ser imposible satisfacerlos simultáneamente por un las predicciones del modelo dado.

Entonces, ¿cómo elegir la solución "correcta" de equidad para tu modelo? Debes considera el contexto en el que se usa y los objetivos generales que quieres lograr. Por ejemplo, el objetivo es lograr una representación equitativa (en este caso, la paridad demográfica puede ser la métrica óptima) o lograr la igualdad de oportunidades (aquí, la igualdad de oportunidades puede ser métricas)?

Para obtener más información sobre la equidad del AA y explorar estos problemas en más detalle, consulta Equidad y aprendizaje automático: limitaciones y oportunidades de Solon Barocas, Moritz Hardt y Arvind Narayanan.