Wykresy i mapy to atrakcyjne i przekonujące narzędzia do komunikacji do statystyk i informacji. a także w przypadku nieprawidłowego lub złośliwego wdrożenia, źródeł nieporozumień, nieprawdziwych informacji i nieprawdy.
Listy przebojów jako sztuka, a nie nauka
Specjaliści ML często wizualizują potencjalne zbiory danych do trenowania, aby zrozumieć w przypadku modeli, a także danych wyjściowych modelu do analizowania wydajności.
Zawsze pytaj o odpowiedni kontekst, odbiorców i cel danych zarówno podczas tworzenia, jak i czytania tekstu. Te 3 czynniki to: to klucz do komunikacji graficznej. Ten sam wykres może być przydatny i wnikliwy, wprowadzają w błąd i są przesadzone w różnych kontekstach1. poziom kompetencji użytkowników w zakresie wykresów i danych będzie się różnić. Projektowanie może pomóc, utrudniać. Na przykład piękne, zapierające dech w piersiach wykresy mogą być zbyt skomplikowane, jasno przekazywać informacje.
Nie ma sztywnych, prostych reguł tworzenia idealnego wykresu. wytycznych i sprawdzonych metod. Wizualizacja danych to sztuka nauki. Jednak podczas wizualizacji danych staraj się przede wszystkim zadbać o ich przejrzystość i uczciwość. Podawaj wystarczającą ilość informacji, aby przekazywać informacje w sposób jasny i dokładny. informacji, które przytłaczają widza.
Scaffolding, treści i działania, które wprowadzają w błąd
Alberto Cairo w filmie How Charts Lie dzieli wizualizacje danych na 2 części: rusztowanie i treść.
Rusztowanie wykresu obejmuje tytuły, osie, legendy, etykiety oraz źródło jeśli dane są przekazywane.
Treści obejmują wizualne kodowanie danych i wszelkie krótkie teksty adnotacji. Metody wizualnego kodowania danych często obejmują:
- długości, tak jak na wykresach słupkowych.
- pozycji, jak w przypadku wykresów punktowych.
- proporcjonalne kąty, powierzchnie i łuki na wykresach kołowych
- kolor i odcień
- rzadziej – szerokość i grubość2
Wszystkie te elementy mogą wprowadzać w błąd. Rozpoczynanie wykresu słupkowego od wartości innej niż 0 albo obcięcie najdłuższych słupków, może stworzyć niedokładne postrzeganie, nawet jeśli chodzi o oszczędność miejsca. Zobacz filmy Sarah Leo wypracowanie o błędach w wizualizacji danych w narzędziu Economist.
Niewłaściwy format obrazu może sprawić, że mała zmiana może wydawać się bardzo duża. lub duża zmiana wydaje się bardzo mała. Kair sugeruje i zgodne z przedstawioną proporcjonalną zmianą, np. 3:1 dla zmiany o 30%, przy czym zaleca się uważne zwrócenie uwagi na kontekst, ponieważ o wielu ważnych wyjątkach od tej reguły. Względnie niewielkie wahania średniej temperatura globalna, na przykład wzrost o 2C z 100°C, jest bardzo istotny i zostanie zaniżony na wykresie w formacie 50:1 współczynnik proporcji3.
Używanie obrotu wykresów 3D i innych efektów 3D w celu uzyskania odpowiedniego efektu wizualnego niż do reprezentowania danych 3D, z dużym prawdopodobieństwem mogą wprowadzać w błąd. Podobnie jest przedstawiania obiektów 3D, które na wykresach słupkowych zastępują słupki. Jeśli dane są kodowane tylko według długości, tak jak w przypadku standardowego wykresu słupkowego, zinterpretować proporcjonalnie większy obiekt jako mający większą objętość, więc mają wyższą wartość, niż jest to uzasadnione4.Projektanci, którzy używają 2D przedstawianie danych, np. dymki, i kodowanie danych według promienia lub średnicy a nie według obszaru, będą też wprowadzać w błąd proporcje5. takie jak wykresy kołowe, mogą utrudniać porównywanie segmentów. i otwierać przed sobą nawzajem. Wykresy kołowe pokazują też, że wszystkie segmenty stanowią całość, co może mieć miejsce, ale nie musi.
![Wykres 3D (3 x 4) przedstawiający wpływ benzyny, etanolu i elektryczności na globalne ocieplenie](https://developers.google.cn/static/machine-learning/guides/data-traps/img/3dchart.jpg?hl=pl)
![Ustawiony pod kątem wykres słupkowy 3D przedstawiający procent sprzedaży z powodu różnych źródeł](https://developers.google.cn/static/machine-learning/guides/data-traps/img/ThroughputStructure.jpg?hl=pl)
Kolor stanowi odrębny temat. Przede wszystkim:
- Podziel kolor na nie więcej niż 6, ponieważ większość osób poradzi sobie bez trudu.
- Unikaj szerokiej gamy widmowych odcieni, ponieważ porządkują je różne osoby w inny sposób6.
- Jeśli to możliwe, wybierz odcienie jednego odcienia, czyli więcej są dobrze widoczne w odcieniach szarości.
- Poznaj różne typy daltonizm.
Pliki referencyjne
Kair, Alberto. Jak wykresy kłamią: jak lepiej prezentować informacje wizualne Nowy Jork: Z.W. Norton, 2019 r.
Uff, Darrell. Jak leżeć na statystykach. Nowy Jork: Norton, 1954 r.
Monmonier, Mark. How to Lie with Maps (Jak kłamać w Mapach), wersja 3 Chicago: U z Chicago P, 2018 roku.
Odwołania do obrazów
„Wykres przedstawiający przykładową strukturę rozliczeń przepustowości”. TAUser, 2008 r. GNU FDL. Źródło
„GWP (MTCO2E) dla wszystkich typów pojazdów w cyklu życia”. B2.Team.Leader, 2006 r. Źródło