Armadilhas de visualização

Tabelas, gráficos e mapas são ferramentas de comunicação atrativas e persuasivas insights e informações. Quando implantados de forma mal-intencionada ou mal-intencionada, fontes de confusão, desinformação e inverdade.

Diagramas como arte em vez de ciência

profissionais de ML costumam visualizar conjuntos de dados de treinamento potenciais para entender a utilidade dos modelos, bem como as saídas deles para entender o desempenho.

Sempre pergunte sobre o contexto, o público-alvo e o propósito esperados de um dado visualização, esteja você criando ou lendo uma. Esses três fatores são é fundamental para a comunicação gráfica. O mesmo gráfico pode ser útil e informativo, ou enganosos e exagerados em diferentes contextos.1 O espectador pretendido e o nível de conhecimento sobre gráficos e dados do espectador varia. O design pode ajudar atrapalhar. Por exemplo, gráficos incrivelmente bonitos podem ser muito complicados para comunicar claramente as informações.

Não há regras rígidas e rápidas sobre como fazer um gráfico perfeito, e práticas recomendadas. A visualização de dados é tanto uma arte quanto uma ciência Mas, ao visualizar os dados, busque, acima de tudo, pela clareza e honestidade. Forneça informações suficientes para se comunicar de maneira clara e precisa, tanta informação que sobrecarregue o espectador.

Andaimes, conteúdo e movimentos enganosos

Alberto Cairo, em How Charts Lie (em inglês), divide as visualizações de dados em duas partes: scaffolding e conteúdo.

A estrutura de um gráfico inclui títulos, eixos, legendas, rótulos e a fonte de os dados, se fornecidos.

O conteúdo inclui a codificação visual dos dados e qualquer pequeno texto anotações. Os métodos para codificar visualmente os dados geralmente incluem:

  • comprimento, como em gráficos de barras
  • posição, como em gráficos de dispersão
  • ângulos, áreas e arcos proporcionais em gráficos de pizza
  • cor e matiz
  • mais raramente, largura e espessura2

Todos esses elementos podem ser usados para enganar. Como iniciar um gráfico de barras em um valor diferente de zero ou o truncamento das barras mais longas, pode criar percepções imprecisas, mesmo que a intenção fosse economizar espaço. Veja a série essay (em inglês) sobre erros de visualização de dados no Economist para ver alguns exemplos.

Uma proporção inadequada pode fazer com que uma pequena mudança pareça muito grande, ou uma grande mudança parece muito pequena. Cairo sugere escolher proporção que corresponda à mudança proporcional representada, por exemplo, 3:1 para um mudança de 30%, enquanto também recomenda muita atenção ao contexto, porque há muitas exceções importantes à regra. Flutuações relativamente pequenas na média na temperatura global, digamos que um aumento de 2C em 100C, por exemplo, são altamente significativos e serão discretos em um gráfico com proporção de 50:1. proporção.3

Usar rotações 3D de gráficos e outros efeitos 3D para gerar impacto visual do que para representar dados 3D, é muito provável que confunda. Assim como representações de objetos 3D que substituem as barras nos gráficos de barras. Se o os dados são codificados somente por comprimento, como em um gráfico de barras padrão, o leitor pode interpretará o objeto proporcionalmente maior como tendo um volume maior, e, portanto, um valor maior do que o apropriado.4 Designers que usam 2D. representações de dados, como bolhas, e codificar os dados por raio ou diâmetro em vez de por área, também cria proporções enganosas.5 2D representações de codificador, como gráficos de pizza, podem dificultar a comparação de segmentos uma contra a outra. Os gráficos de pizza também implicam que todos os segmentos somam um todo, o que pode ou não ser o caso.

Gráfico 3D de 3 x 4 mostrando os impactos da gasolina, do etanol e da eletricidade no aquecimento global Gráfico de barras 3D inclinadas mostrando a porcentagem das vendas devido a diferentes fontes
Exemplo de visualizações de dados difíceis de ler.

A cor é o próprio assunto. Em geral:

  • Use seis ou menos divisões de cores, porque esse é o limite do que a maioria das pessoas possa lidar sem confusão.
  • Evite uma ampla seleção de tons espectrais, porque diferentes pessoas os ordenam de maneira diferente.6
  • Se possível, selecione tons de um único matiz, que é distinguíveis em escala de cinza.
  • Conheça os diferentes tipos de daltonismo.

Referências

Cairo, Alberto. Como os gráficos mentem: como usar informações visuais de maneira mais inteligente. Nova York: W.W. Norton, 2019.

Huff, Darrell. Como mentir com estatísticas. NY: W.W. Norton, 1954.

Monmonier, Mark. How to Lie with Maps (Como mentir com o Maps), 3a ed. Chicago: U de Chicago P, 2018.

Referências de imagens

"Gráfico de um exemplo de estrutura de contabilidade da capacidade de processamento." TAUser, 2008. FDL do GNU. Fonte

"GWP (MTCO2E) para todos os tipos de veículos durante o ciclo de vida." B2.Team.Leader, 2006. Origem


  1. Cairo 72 a 73, 79. 

  2. Cairo 24-26, 36-38. 

  3. Cairo 69 a 70. 

  4. Huff 21 a 25. 

  5. Cairo 34, 58-59. 

  6. Monmonier, 65 a 66.