Pułapki wizualizacyjne

Wykresy i mapy to atrakcyjne i przekonujące narzędzia do komunikacji do statystyk i informacji. a także w przypadku nieprawidłowego lub złośliwego wdrożenia, źródeł nieporozumień, nieprawdziwych informacji i nieprawdy.

Listy przebojów jako sztuka, a nie nauka

Specjaliści ML często wizualizują potencjalne zbiory danych do trenowania, aby zrozumieć w przypadku modeli, a także danych wyjściowych modelu do analizowania wydajności.

Zawsze pytaj o odpowiedni kontekst, odbiorców i cel danych zarówno podczas tworzenia, jak i czytania tekstu. Te 3 czynniki to: to klucz do komunikacji graficznej. Ten sam wykres może być przydatny i wnikliwy, wprowadzają w błąd i są przesadzone w różnych kontekstach1. poziom kompetencji użytkowników w zakresie wykresów i danych będzie się różnić. Projektowanie może pomóc, utrudniać. Na przykład piękne, zapierające dech w piersiach wykresy mogą być zbyt skomplikowane, jasno przekazywać informacje.

Nie ma sztywnych, prostych reguł tworzenia idealnego wykresu. wytycznych i sprawdzonych metod. Wizualizacja danych to sztuka nauki. Jednak podczas wizualizacji danych staraj się przede wszystkim zadbać o ich przejrzystość i uczciwość. Podawaj wystarczającą ilość informacji, aby przekazywać informacje w sposób jasny i dokładny. informacji, które przytłaczają widza.

Scaffolding, treści i działania, które wprowadzają w błąd

Alberto Cairo w filmie How Charts Lie dzieli wizualizacje danych na 2 części: rusztowanie i treść.

Rusztowanie wykresu obejmuje tytuły, osie, legendy, etykiety oraz źródło jeśli dane są przekazywane.

Treści obejmują wizualne kodowanie danych i wszelkie krótkie teksty adnotacji. Metody wizualnego kodowania danych często obejmują:

  • długości, tak jak na wykresach słupkowych.
  • pozycji, jak w przypadku wykresów punktowych.
  • proporcjonalne kąty, powierzchnie i łuki na wykresach kołowych
  • kolor i odcień
  • rzadziej – szerokość i grubość2

Wszystkie te elementy mogą wprowadzać w błąd. Rozpoczynanie wykresu słupkowego od wartości innej niż 0 albo obcięcie najdłuższych słupków, może stworzyć niedokładne postrzeganie, nawet jeśli chodzi o oszczędność miejsca. Zobacz filmy Sarah Leo wypracowanie o błędach w wizualizacji danych w narzędziu Economist.

Niewłaściwy format obrazu może sprawić, że mała zmiana może wydawać się bardzo duża. lub duża zmiana wydaje się bardzo mała. Kair sugeruje i zgodne z przedstawioną proporcjonalną zmianą, np. 3:1 dla zmiany o 30%, przy czym zaleca się uważne zwrócenie uwagi na kontekst, ponieważ o wielu ważnych wyjątkach od tej reguły. Względnie niewielkie wahania średniej temperatura globalna, na przykład wzrost o 2C z 100°C, jest bardzo istotny i zostanie zaniżony na wykresie w formacie 50:1 współczynnik proporcji3.

Używanie obrotu wykresów 3D i innych efektów 3D w celu uzyskania odpowiedniego efektu wizualnego niż do reprezentowania danych 3D, z dużym prawdopodobieństwem mogą wprowadzać w błąd. Podobnie jest przedstawiania obiektów 3D, które na wykresach słupkowych zastępują słupki. Jeśli dane są kodowane tylko według długości, tak jak w przypadku standardowego wykresu słupkowego, zinterpretować proporcjonalnie większy obiekt jako mający większą objętość, więc mają wyższą wartość, niż jest to uzasadnione4.Projektanci, którzy używają 2D przedstawianie danych, np. dymki, i kodowanie danych według promienia lub średnicy a nie według obszaru, będą też wprowadzać w błąd proporcje5. takie jak wykresy kołowe, mogą utrudniać porównywanie segmentów. i otwierać przed sobą nawzajem. Wykresy kołowe pokazują też, że wszystkie segmenty stanowią całość, co może mieć miejsce, ale nie musi.

Wykres 3D (3 x 4) przedstawiający wpływ benzyny, etanolu i elektryczności na globalne ocieplenie Ustawiony pod kątem wykres słupkowy 3D przedstawiający procent sprzedaży z powodu różnych źródeł
Przykład nieczytelnych wizualizacji danych.

Kolor stanowi odrębny temat. Przede wszystkim:

  • Podziel kolor na nie więcej niż 6, ponieważ większość osób poradzi sobie bez trudu.
  • Unikaj szerokiej gamy widmowych odcieni, ponieważ porządkują je różne osoby w inny sposób6.
  • Jeśli to możliwe, wybierz odcienie jednego odcienia, czyli więcej są dobrze widoczne w odcieniach szarości.
  • Poznaj różne typy daltonizm.

Pliki referencyjne

Kair, Alberto. Jak wykresy kłamią: jak lepiej prezentować informacje wizualne Nowy Jork: Z.W. Norton, 2019 r.

Uff, Darrell. Jak leżeć na statystykach. Nowy Jork: Norton, 1954 r.

Monmonier, Mark. How to Lie with Maps (Jak kłamać w Mapach), wersja 3 Chicago: U z Chicago P, 2018 roku.

Odwołania do obrazów

„Wykres przedstawiający przykładową strukturę rozliczeń przepustowości”. TAUser, 2008 r. GNU FDL. Źródło

„GWP (MTCO2E) dla wszystkich typów pojazdów w cyklu życia”. B2.Team.Leader, 2006 r. Źródło


  1. Cairo 72-73, 79. 

  2. Cairo 24-26, 36-38. 

  3. Kair 69-70. 

  4. 21–25 lat. 

  5. Cairo 34, 58-59. 

  6. Monmonier 65–66.