Pièges de visualisation

Les tableaux, graphiques et cartes sont des outils convaincants et persuasifs pour communiquer des insights et des informations. De plus, lorsqu'ils sont déployés mal ou de manière malveillante, sources de confusion, de fausses informations et de fausses informations.

Des tableaux comme de l'art plutôt que de la science

Les professionnels du ML visualisent souvent des ensembles de données d'entraînement potentiels pour comprendre l'utilité des modèles et leurs sorties pour comprendre les performances.

Demandez toujours le contexte, l'audience et l'objectif prévus des données. visualisation, que vous en créiez une ou que vous la lisiez. Ces trois facteurs sont clé de la communication graphique. Un même graphique peut être utile et pertinent, ou trompeurs ou exagérés, selon le contexte1.Le public visé le niveau du spectateur en matière de graphiques et de connaissance des données, variera. La conception peut aider ou un obstacle. Par exemple, des graphiques à la beauté à couper le souffle peuvent être trop compliqués pour communiquer clairement les informations.

Il n’y a pas de règles strictes pour comment créer un graphique parfait, seulement les consignes et bonnes pratiques. La visualisation des données est autant un art qu'un la science. Mais lors de la visualisation des données, efforcez-vous, avant tout, d'obtenir clarté et honnêteté. Fournissez suffisamment d'informations pour communiquer clairement et avec précision, et non comment qui submerge l'utilisateur.

Échafaudages, contenus et mouvements trompeurs

Dans son livre How Charts Lie, Alberto Cairo divise les visualisations de données en deux parties: échafaudage et contenu.

L'échafaudage d'un graphique comprend les titres, les axes, les légendes, les étiquettes et la source des les données, le cas échéant.

Cela inclut l'encodage visuel des données et tout texte court . Les méthodes d'encodage visuel des données incluent généralement:

  • comme dans les graphiques à barres,
  • comme dans les nuages de points,
  • angles, aires et arcs proportionnels dans les graphiques à secteurs
  • teinte et couleur
  • plus rarement, largeur et épaisseur2.

Tous ces éléments peuvent être utilisés pour induire en erreur. Démarrage d'un graphique à barres avec une valeur non nulle de référence ou en tronquant les barres les plus longues, peut créer des perceptions inexactes, même si l'intention était d'économiser de l'espace. Découvrez les œuvres de Sarah Leo dissertation sur les erreurs de visualisation des données dans Economist.

Un format inapproprié peut donner l’impression qu’une petite modification est très importante, ou un changement majeur semble très faible. Le Caire suggère de choisir un correspondant au changement proportionnel à l'image, par exemple 3:1 un changement de 30 %, tout en demandant une attention particulière au contexte, car il y a de nombreuses exceptions importantes à la règle. Fluctuations relativement faibles en moyenne (une hausse de 2 °C par rapport à 100 °C, par exemple) est très importante et sera sous-estimée dans un graphique à 50:1. ratio3.

Utiliser des rotations 3D des graphiques et d'autres effets 3D pour avoir un impact visuel que pour représenter des données 3D, est très susceptible d'induire en erreur. tout comme représentations d'objets 3D qui remplacent les barres dans les graphiques à barres. Si le les données ne sont encodées qu'en fonction de la longueur, comme pour un histogramme standard, le lecteur peut interpréter l'objet proportionnellement plus grand comme ayant un volume plus important et donc une valeur plus élevée que nécessaire4.Les concepteurs qui utilisent la 2D des représentations de données, comme des bulles, et encoder les données par rayon ou diamètre ; plutôt que par superficie, créent également des proportions trompeuses5.La 2D comme les diagrammes circulaires, peut rendre difficile la comparaison des segments l'un à l'autre. Les graphiques à secteurs impliquent également que tous les segments forment un tout, ce qui peut être ou non le cas.

Graphique 3D 3D montrant l'impact de l'essence, de l'éthanol et de l'électricité sur le réchauffement climatique Graphique à barres 3D en biais montrant le pourcentage de ventes générées par différentes sources
Exemple de visualisations des données difficiles à lire.

La couleur est son propre sujet. En règle générale :

  • Utilisez 6 divisions de couleur ou moins, car c’est la limite de ce que la plupart des gens pouvez gérer sans confusion.
  • Éviter un large choix de teintes spectrales, car différentes personnes les ordonnent différemment6.
  • Si possible, sélectionnez des nuances d'une seule teinte, qui est plus distinguable en nuances de gris.
  • Tenez compte des différents types daltonisme.

Références

Alberto, au Caire. How Charts Lie: Getting Smarter about Visual Information NY: O.O. Norton, 2019.

Huff, Darrell. Comment exploiter les statistiques ? NY: W.W. Norton, 1954.

Marc Monmonier. How to Lie with Maps, 3e édition Chicago: U of Chicago P, 2018.

Références d'images

"Graphique d'un exemple de structure de comptabilité du débit." TAUser, 2008. GNU FDL Source

"PRG (MTCO2E) pour tous les types de véhicules tout au long du cycle de vie." B2.Team.Leader, 2006. Source


  1. Cairo 72-73, 79. 

  2. Caire 24-26, 36-38. 

  3. Le Caire, 69-70. 

  4. Huff 21-25. 

  5. Cairo 34, 58-59. 

  6. Monmonier 65-66.