Trampas de visualización

Los gráficos, los mapas y los diagramas son herramientas convincentes y persuasivas para comunicar información y estadísticas. También son fuentes de confusión, información errónea y falsedad.

Gráficos como arte y no como ciencia

A menudo, los profesionales del AA visualizan posibles conjuntos de datos de entrenamiento a fin de comprender su utilidad para los modelos, así como sus resultados para comprender el rendimiento.

Siempre pregunta sobre el contexto, el público y el propósito previstos de una visualización de datos, ya sea que la estés creando o leyendo. Estos tres factores son claves para la comunicación gráfica. El mismo gráfico puede ser útil y valioso, o engañoso y exagerado, en diferentes contextos.1 El usuario deseado y su nivel de conocimiento sobre gráficos y datos variarán. El diseño puede ayudar o dificultar. Por ejemplo, los gráficos de increíble belleza pueden ser demasiado complicados para comunicar la información con claridad.

No hay reglas estrictas sobre cómo crear un gráfico perfecto, solo lineamientos y prácticas recomendadas. Visualizar datos es tanto un arte como una ciencia. Pero al visualizar los datos, esfuérzate, sobre todo, por que sean claros y honestos. Proporciona suficiente información para comunicarte de forma clara y precisa, pero no demasiada para no abrumar al usuario.

Andamios, contenido y movimientos engañosos

Alberto Cairo, en How Charts Lie, divide las visualizaciones de datos en dos partes: andamiaje y contenido.

El andamiaje de un gráfico incluye títulos, ejes, leyendas, etiquetas y la fuente de los datos, si se proporcionan.

El contenido incluye la codificación visual de los datos y cualquier anotación textual breve. Los métodos para codificar visualmente los datos suelen incluir:

  • longitud, como en los gráficos de barras
  • posición, como en los diagramas de dispersión
  • ángulos, áreas y arcos proporcionales en gráficos circulares
  • color y tono
  • más raramente, ancho y grosor2

Todos estos elementos se pueden usar para engañar. Comenzar un gráfico de barras en un valor de referencia distinto de cero o truncar las barras más largas puede crear percepciones imprecisas, incluso si el objetivo era ahorrar espacio. Consulta el ensayo de Sarah Leo sobre errores de visualización de datos en el Economist para ver algunos ejemplos.

Una relación de aspecto inadecuada puede hacer que un cambio pequeño parezca muy grande o que un cambio grande parezca muy pequeño. El Cairo sugiere elegir una relación de aspecto que coincida con el cambio proporcional que se muestra, por ejemplo, 3:1 para un cambio del 30%, pero también aconseja prestar mucha atención al contexto, ya que hay muchas excepciones importantes a la regla. Las fluctuaciones relativamente pequeñas en la temperatura global promedio, por ejemplo, un aumento de 2 oC de 100 oC, son muy significativas y se subestimarán en un gráfico con una relación de aspecto de 50:1.3

Es muy probable que el uso de rotaciones 3D de gráficos y otros efectos 3D para lograr un impacto visual, en lugar de representar datos 3D, sea engañoso. Lo mismo ocurre con las representaciones de objetos 3D que sustituyen las barras en los gráficos de barras. Si los datos se codifican solo por longitud, como en un gráfico de barras estándar, el lector puede interpretar que el objeto proporcionalmente más grande tiene un volumen mayor y, por lo tanto, un valor más alto de lo adecuado.4 Los diseñadores que usan representaciones 2D de datos, como burbujas, y codifican los datos por radio o diámetro en lugar de por área, también crearán proporciones engañosas.5 Las representaciones 2D, como los gráficos circulares, pueden dificultar la comparación de segmentos entre sí. Los gráficos circulares también implican que todos los segmentos se suman como un todo, lo que puede o no ser el caso.

Gráfico 3D 3x4 que muestra el impacto de la gasolina, el etanol y la electricidad en el calentamiento global Gráfico de barras 3D en ángulo que muestra el porcentaje de ventas debido a diferentes fuentes
Ejemplo de visualizaciones de datos difíciles de leer.

El color es un tema en sí mismo. En general, debes hacer lo siguiente:

  • Usa 6 o menos divisiones de color, ya que ese es el límite de lo que la mayoría de las personas puede manejar sin confusión.
  • Evita una amplia selección de tonos espectrales, ya que las distintas personas los ordenan de manera diferente.6
  • Si es posible, selecciona tonos de un solo tono, que se distinguen mejor en escala de grises.
  • Ten en cuenta los diferentes tipos de daltonismo.

Referencias

Cairo, Alberto. How Charts Lie: Getting Smarter about Visual Information. NY: W.W. Norton, 2019.

Huff, Darrell. Cómo lidiar con las estadísticas. Nueva York: W.W. Norton, 1954.

Monmonier, Mark. How to Lie with Maps, 3ª ed. Chicago: U of Chicago P, 2018.

Referencias de imágenes

"Gráfico de un ejemplo de la estructura de contabilización de rendimiento". TAUser, 2008. FDL de GNU. Fuente

"GWP (MTCO2E) para todos los tipos de vehículos durante el ciclo de vida". B2.Team.Leader, 2006. Origen


  1. Cairo 72-73, 79. 

  2. El Cairo 24-26, 36-38. 

  3. El Cairo, 69-70. 

  4. Huff entre 21 y 25. 

  5. Cairo 34, 58-59. 

  6. Monmonier 65-66.