시각화 트랩

차트, 그래프, 지도는 설득력 있고 설득력 있는 도구임 통찰력과 정보를 제공합니다. 또한 악의적으로 또는 악의적으로 배포되면 혼동, 잘못된 정보, 허위 정보의 출처

과학이 아닌 예술인 차트

ML 실무자는 종종 잠재적 학습 데이터 세트를 시각화하여 ML 모델을 유용성을 높이고 성능 이해를 위한 모델 출력

데이터가 의도하는 맥락, 대상목적에 대해 항상 묻기 어떤 시각화를 만들든 읽는 것이든 말이죠 이 세 가지 요소는 핵심입니다. 동일한 차트가 유용하고 유용하거나 과장된 콘텐츠를 표시합니다.1 의도한 시청자 보는 사람의 그래프와 데이터 활용 능력의 수준이 달라질 수 있습니다. 디자인은 도움이 되거나 하는 것입니다. 예를 들어 놀라울 정도로 아름다운 차트는 지나치게 복잡하여 명확하게 전달하는 것입니다.

완벽한 차트를 만드는 데 있어 절대적으로 정해진 규칙은 없습니다. 가이드라인과 권장사항을 확인할 수 있습니다 데이터 시각화는 제공합니다. 하지만 데이터를 시각화할 때는 무엇보다도 명확하고 정직하게 시각화해야 합니다. 명확하고 정확하게 의사소통하기에 충분한 정보를 제공해서는 안 됩니다. 많은 정보를 압도합니다.

비계, 콘텐츠, 오해의 소지가 있는 움직임

Alberto Cairo는 How Charts Lie에서 데이터 시각화를 두 부분으로 분할합니다. 콘텐츠스캐폴딩입니다

차트의 비계에는 제목, 축, 범례, 라벨 및 데이터입니다(제공된 경우).

콘텐츠에는 데이터의 시각적 인코딩 및 짧은 텍스트 주석을 달 수 있습니다. 데이터를 시각적으로 인코딩하는 방법은 일반적으로 다음과 같습니다.

  • 막대 그래프와 같은 길이
  • 분산형 차트와 같은
  • 원형 차트의 비례 각도, 영역, 호
  • 색상 및 색조
  • 너비 및 두께가 더 드물게 발생합니다.2

이러한 모든 요소는 혼동을 야기하는 데 이용될 수 있습니다. 0이 아닌 값에서 막대 그래프 시작 가장 긴 막대를 자르면 부정확한 인식이 될 수 있습니다. 공간을 절약하려는 의도라도 말이죠 사라 레오의 에세이 Economist의 데이터 시각화 실수 참조

가로 세로 비율이 적절하지 않으면 작은 변화라도 아주 크게 보일 수 있지만 큰 변화가 아주 사소해 보일 수도 있습니다. 카이로는 카이로에서 표시되는 비례 변화와 일치하는 가로세로 비율(예: 광고의 경우 3:1)을 맥락에 대한 세심한 주의를 기울여야 한다는 것을 압니다. 왜냐하면 많은 중요한 예외가 있을 수 있습니다. 평균의 비교적 미세한 변동 예를 들어 지구 기온이 100도에서 2도 상승하면 중요도가 매우 높으며 50:1 비율의 차트에서 과소평가됩니다. 비율3

3D 회전 차트 및 기타 3D 효과를 사용하여 3D 데이터를 표시할 때 혼동을 야기할 가능성이 매우 높습니다. 또한 막대 그래프의 막대를 대체하는 3D 개체를 보여주는 이미지 만약 데이터는 길이로만 인코딩되며, 표준 막대 그래프와 마찬가지로 비례적으로 더 큰 물체를 더 큰 부피가 있는 것으로 해석하지만 따라서 적절하지 않은 값이라고 할 수 있습니다.4 2D를 사용하는 디자이너 풍선과 같은 데이터 표현을 추출하고 반지름이나 지름을 기준으로 데이터를 인코딩 2D는 면적당이 아닌 비율의 혼동을 야기할 수 있습니다.5 2D 그래프와 같은 형태의 데이터를 사용하면 세그먼트를 비교하기가 어려워질 수 있습니다. 대립시킵니다. 또한 원형 차트는 모든 세그먼트를 합하면 전체가 됨을 의미하지만 그렇지 않을 수도 있습니다

휘발유, 에탄올, 전기가 지구 온난화에 미치는 영향을 보여주는 3x4 3D 차트 다양한 소스로 인한 판매 비율을 보여주는 각진 3D 막대 그래프
읽기 어려운 데이터 시각화의 예

색상은 그 자체로 주제입니다. 일반적인 정보는 다음과 같습니다.

  • 6개 이하의 색상 구분을 사용하세요. 대부분 사람이 사용할 수 있는 처리할 수 있습니다
  • 사람마다 취향이 다르기 때문에 다양한 스펙트럼 색조는 피하세요. 6
  • 가능하면 단일 색조의 음영을 선택하세요. 그레이 스케일로 구별 가능합니다.
  • 다양한 유형의 색맹.

참조

카이로, 알베르토 차트의 거짓말: 시각적 정보에 대해 스마트하게 활용하기 뉴욕: W.W. Norton, 2019년.

허프, 대럴. 통계적으로 거짓말하는 방법. 뉴욕: W.W. 노턴, 1954년.

모니어, 마크. How to Lie with Maps, 3rd ed. Chicago: U of Chicago P, 2018.

이미지 참조

"처리량 계산 구조 예시 차트." TAUser, 2008년. GNU FDL. 출처

"수명 주기 동안 모든 차량 유형에 대한 GWP (MTCO2E)." B2.Team.Leader, 2006년 소스


  1. Cairo 72-73, 79. 

  2. Cairo. 24-26, 36-38. 

  3. 카이로 69-70. 

  4. 21~25세 정도요. 

  5. Cairo 34, 58-59. 

  6. Monmonier 만 65~66세입니다.