Pułapki wizualizacyjne

Wykresy i mapy to atrakcyjne i przekonujące narzędzia do przekazywania informacji i przekazywania informacji. W przypadku niewłaściwego lub celowego zastosowania są również źródłem dezorientacji, nieprawdziwych informacji i nieprawdy.

Listy przebojów jako sztuka, a nie nauka

Specjaliści od uczenia maszynowego często wizualizują potencjalne zbiory danych do trenowania, aby poznać ich przydatność dla modeli, a także wyniki modeli, aby poznać ich wydajność.

Niezależnie od tego, czy tworzysz, czy odczytujesz, zawsze pytaj o kontekst, odbiorców i przeznaczenie wizualizacji. Te 3 czynniki są kluczowe dla komunikacji graficznej. Ten sam wykres może być przydatny i pełen informacji lub wprowadzać w błąd i wyolbrzymiać dane w różnych kontekstach.1 Wybór odbiorcy i poziom jego znajomości wykresów oraz danych będą się różnić. Projekt może pomóc lub przeszkodzić. Na przykład piękne, zapierające dech w piersiach wykresy mogą być zbyt skomplikowane, aby przekazywać informacje w sposób przejrzysty.

Nie ma sztywnych i krótkich reguł tworzenia idealnego wykresu. Są tylko wskazówki i sprawdzone metody. Wizualizacja danych to sztuka co do nauki. Jednak podczas wizualizacji danych staraj się przede wszystkim zadbać o ich przejrzystość i uczciwość. Podaj wystarczającą ilość informacji, aby przekaz był jasny i dokładny, ale nie przesyłaj tak dużo informacji, aby przytłoczyć widza.

Scaffolding, treści i działania, które wprowadzają w błąd

W książce How Charts Lie (Jak kłamią wykresy) Alberto Cairo dzieli wizualizacje danych na 2 części: rusztowanie i treści.

Rusztowanie wykresu obejmuje tytuły, osie, legendy, etykiety oraz źródło danych, jeśli zostały podane.

Obejmuje to wizualne kodowanie danych i wszelkie krótkie adnotacje tekstowe. Metody wizualnego kodowania danych często obejmują:

  • długości, jak w przypadku wykresów słupkowych;
  • pozycja, jak w wykresach punktowych
  • proporcjonalne kąty, powierzchnie i łuki na wykresach kołowych
  • kolor i odcień
  • rzadziej – szerokość i grubość2

Wszystkie te elementy mogą wprowadzać w błąd. Położenie wykresu słupkowego na wartości innej niż zero lub obcięcie najdłuższych słupków może spowodować niedokładne wrażenia, nawet jeśli celem było oszczędność miejsca. Przykładowe przykłady znajdziesz w eseju Sarah Leo na temat błędów w wizualizacji danych w sekcji Economist.

Niewłaściwy format obrazu może sprawić, że mała zmiana może wydawać się bardzo duża, a duża zmiana może wydawać się bardzo mała. Kair sugeruje wybór współczynnika proporcji, który pasuje do przedstawianej zmiany proporcjonalnej (np. 3:1) dla zmiany 30%, ale zachęca też do dokładnego zapoznania się z kontekstem, ponieważ występuje wiele ważnych wyjątków od reguły. Stosunkowo niewielkie wahania średniej temperatury na świecie, np. wzrost o 2 °C na 100 °C, są bardzo istotne i będą niedostatecznie widoczne na wykresie o współczynniku proporcji 50:1.3

Stosowanie obrotów 3D wykresów i innych efektów 3D w celu uzyskania efektu wizualnego, a nie do przedstawienia danych 3D, może wprowadzać w błąd. Podobnie jest z przedstawieniem obiektów 3D, które na wykresach słupkowych zastępują słupki. Jeśli dane są zakodowane tylko na podstawie długości, tak jak w standardowym wykresie słupkowym, czytelnik może zinterpretować proporcjonalnie większy obiekt jako mający większą objętość, a co za tym idzie większą wartość, niż to jest w istocie.4 Projektanci, którzy używają dwuwymiarowych reprezentacji danych, np. bąbelków, i kodują dane na podstawie promienia lub średnicy zamiast na podstawie powierzchni, również tworzą mylące proporcje.5 Reprezentacje dwuwymiarowe, np. wykresy kołowe, mogą utrudniać porównywanie segmentów. Wykresy kołowe sugerują też, że wszystkie segmenty tworzą całość – co może, ale nie musi być prawdą.

Wykres 3D (3 x 4) przedstawiający wpływ benzyny, etanolu i elektryczności na globalne ocieplenie Ustawiony pod kątem wykres słupkowy 3D przedstawiający procent sprzedaży z powodu różnych źródeł
Przykład nieczytelnych wizualizacji danych.

Kolor jest tematem samym w sobie. Przede wszystkim:

  • Użyj maksymalnie 6 podzielonych kolorów, ponieważ jest to limit, który większość osób może ogarnąć bez problemów.
  • Unikaj dużej liczby odcieni widmowych, ponieważ różne osoby porządkują je na różne sposoby.6
  • Jeśli to możliwe, wybierz odcienie w jednym odcieniu, który jest łatwiejszy do odróżnienia w skali szarości.
  • Zapoznaj się z różnymi rodzajami daltonizmu.

Pliki referencyjne

Kair, Alberto. How Charts Lie: Getting Smarter about Visual Information (Jak kłamią wykresy: jak mądrze korzystać z wizualnych informacji). NY: W.W. Norton, 2019.

Huff, Darrell. How to Lie with Statistics (Jak kłamać za pomocą statystyk). NY: W.W. Norton, 1954.

Monmonier, Mark. How to Lie with Maps, 3 ed., Chicago: U of Chicago P, 2018.

Odwołania do obrazów

„Wykres przedstawiający przykładową strukturę rozliczeń przepustowości”. TAUser, 2008 r. GNU FDL. Źródło

„GWP (MTCO2E) dla wszystkich typów pojazdów w całym cyklu życia”. B2.Team.Leader, 2006. Źródło


  1. Kair 72-73, 79. 

  2. Cairo 24-26, 36-38. 

  3. Kair 69-70. 

  4. Huff 21–25. 

  5. Cairo 34, 58–59. 

  6. Monmonier 65–66.