Gráficos, diagramas e mapas são ferramentas convincentes e persuasivas para comunicar insights e informações. Quando implantados de forma incorreta ou maliciosa, eles também são fontes de confusão, desinformação e falsidade.
Gráficos como arte, não ciência
Os profissionais de ML geralmente visualizam conjuntos de dados de treinamento em potencial para entender a utilidade deles nos modelos, bem como as saídas do modelo para entender o desempenho.
Sempre pergunte sobre o contexto, o público e o propósito pretendidos de uma visualização de dados, esteja você criando ou lendo uma. Esses três fatores são essenciais para a comunicação gráfica. O mesmo gráfico pode ser útil e informativo ou enganoso e exagerado em diferentes contextos.1 O espectador pretendido e o nível de alfabetização em dados e gráficos do espectador variam. O design pode ajudar ou impedir. Por exemplo, gráficos incrivelmente bonitos podem ser muito complicados para comunicar informações claramente.
Não há regras rígidas e definitivas sobre como fazer um gráfico perfeito, apenas diretrizes e práticas recomendadas. A visualização de dados é tanto uma arte quanto uma ciência. Mas, ao visualizar dados, procure, acima de tudo, clareza e honestidade. Forneça informações suficientes para comunicar de forma clara e precisa, mas não tantas informações que sobrecarreguem o espectador.
Andaimes, conteúdo e movimentos enganosos
Alberto Cairo, em How Charts Lie (em inglês), divide as visualizações de dados em duas partes: scaffolding e content.
A estrutura de um gráfico inclui títulos, eixos, legendas, rótulos e a origem dos dados, se houver.
O conteúdo inclui a codificação visual dos dados e anotações textuais curtas. Os métodos para codificar dados visualmente geralmente incluem:
- comprimento, como em gráficos de barras
- posição, como em diagramas de dispersão
- ângulos, áreas e arcos proporcionais em gráficos de pizza
- cor e matiz
- mais raramente, largura e espessura2
Todos esses elementos podem ser usados para enganar. Começar um gráfico de barras com uma linha de base diferente de zero ou truncar as barras mais longas pode criar percepções imprecisas, mesmo que a intenção tenha sido economizar espaço. Consulte o artigo de Sarah Leo sobre erros de visualização de dados na Economist para conferir alguns exemplos.
Uma proporção inadequada pode fazer uma pequena mudança parecer muito grande ou uma grande mudança parecer muito pequena. O Cairo sugere escolher uma proporção que corresponda à alteração proporcional representada, digamos 3:1 para uma alteração de 30%, mas também recomenda muita atenção ao contexto, porque há muitas exceções importantes à regra. Variações relativamente pequenas na temperatura global média, como um aumento de 2 °C em 100 °C, por exemplo, são muito significativas e serão subestimadas em um gráfico com uma proporção de 50:1.3
O uso de rotações 3D de gráficos e outros efeitos 3D para impacto visual, em vez de representar dados 3D, pode induzir em erro. Assim como as representações de objetos 3D que substituem barras em gráficos de barras. Se os dados forem codificados somente por comprimento, como em um gráfico de barras padrão, o leitor poderá interpretar que o objeto proporcionalmente maior tem um volume maior e, portanto, um valor mais alto do que o apropriado.4 Designers que usam representações 2D de dados, como bolhas, e codificam dados por raio ou diâmetro em vez de por área, também podem criar proporções enganosas, como outros gráficos de pizza.5.5 Os gráficos de pizza também implicam que todos os segmentos somam um todo, o que pode ou não ser o caso.
A cor é o próprio assunto. Em geral:
- Use seis ou menos divisões de cores, porque esse é o limite do que a maioria das pessoas consegue processar sem confusão.
- Evite uma ampla seleção de matizes espectrais, porque pessoas diferentes os ordenam de maneira diferente.6
- Se possível, selecione tons de uma única tonalidade, que é mais distinguível em escala de cinza.
- Conheça os diferentes tipos de daltonismo.
Referências
Cairo, Alberto. Como os gráficos mentem: como usar informações visuais de maneira mais inteligente. NY: W.W. Norton, 2019.
Huff, Darrell. Como mentir com estatísticas. NY: W.W. Norton, 1954.
Monmonier, Mark. How to Lie with Maps,3a edição Chicago: U of Chicago P, 2018.
Referências de imagens
"Gráfico de um exemplo de estrutura de contabilidade da capacidade de processamento." TAUser, 2008. FDL do GNU. Fonte
"GWP (MTCO2E) para todos os tipos de veículo ao longo do ciclo de vida". B2.Equipe.Líder, 2006. Origem