시각화 트랩

차트, 그래프 및 지도는 통찰력과 정보를 전달하는 매력적이고 설득력 있는 도구입니다. 또한 잘못되거나 악의적으로 배포된 경우 혼란, 잘못된 정보, 허위의 원인이 될 수 있습니다.

과학이 아닌 예술로서의 차트

ML 실무자는 모델에 대한 유용성을 파악하기 위해 잠재적 학습 데이터를 시각화하고 성능을 파악하기 위해 모델 출력을 시각화하는 경우가 많습니다.

데이터 시각화를 만들 때나 읽을 때 항상 의도한 맥락, 사용자, 목적을 묻습니다. 이러한 세 가지 요소는 그래픽 커뮤니케이션의 핵심입니다. 동일한 차트가 상황에 따라 유용하고 유익할 수도 있고 혼동을 야기하고 과장될 수도 있습니다.1 의도한 시청자와 시청자의 그래프 및 데이터 리터러시 수준은 다양합니다. 디자인은 도움이 되기도 하고 방해가 되기도 합니다. 예를 들어 놀라울 정도로 아름다운 차트는 너무 복잡하여 정보를 명확하게 전달할 수 없습니다.

완벽한 차트를 만드는 방법에 대한 엄격한 규칙은 없으며 가이드라인과 권장사항만 있습니다. 데이터 시각화는 과학인 만큼 예술입니다. 하지만 데이터를 시각화할 때는 무엇보다도 명확성과 정직을 위해 노력해야 합니다. 명확하고 정확하게 전달할 만큼 충분한 정보를 제공하되 시청자를 압도할 만큼 많은 정보는 제공하지 마세요.

스케폴딩, 콘텐츠, 혼동을 야기하는 동작

알베르토 카이로의 How Charts Lie에서는 데이터 시각화를 스캐폴딩콘텐츠의 두 부분으로 나눕니다.

차트의 스캐폴딩에는 제목, 축, 범례, 라벨, 데이터 소스(제공되는 경우)가 포함됩니다.

콘텐츠에는 데이터의 시각적 인코딩과 짧은 텍스트 주석이 포함됩니다. 데이터를 시각적으로 인코딩하는 방법에는 일반적으로 다음이 포함됩니다.

  • 길이(막대 그래프의 경우)
  • 산점도에서와 같이
  • 원형 차트의 비례 각도, 면적, 원호
  • 색상 및 색조
  • 드물게 너비와 두께2

이러한 모든 요소는 사용자를 오도하는 데 사용될 수 있습니다. 막대 그래프를 0이 아닌 기준점에서 시작하거나 가장 긴 막대를 자르면 공간을 절약하려는 의도였더라도 부정확한 인상을 줄 수 있습니다. 몇 가지 예는 Economist의 데이터 시각화 실수에 대한 Sarah Leo의 에세이를 참조하세요.

가로세로 비율이 부적절하면 작은 변화로 인해 크게 보이게 할 수도 있고, 변화가 크면 아주 작게 보일 수도 있습니다. 카이로는 묘사 중인 비례적인 변화(예: 30% 변화의 경우 3:1)와 일치하는 가로세로 비율을 선택할 것을 권장하지만, 규칙에는 중요한 예외가 많기 때문에 맥락에 세심한 주의를 기울여야 합니다. 예를 들어 평균 지구 온도의 상대적으로 작은 변동(예: 100C 중 2C 상승)은 매우 중요하며 가로세로 비율이 50:1인 차트에서는 과소평가됩니다.3

3D 데이터를 나타내는 대신 시각적 효과를 위해 차트 및 기타 3D 효과를 3D 회전하면 잘못된 정보가 제공될 가능성이 매우 높습니다. 막대 그래프의 막대를 대체하는 3D 객체의 이미지도 마찬가지입니다. 표준 막대 그래프와 같이 데이터가 길이로만 인코딩된 경우 독자는 비례적으로 더 큰 객체를 볼륨이 더 크고 따라서 값이 더 높다고 해석할 수 있습니다.4 거품과 같은 데이터의 2D 표현을 사용하고 면적이 아닌 반지름이나 직경으로 데이터를 인코딩하는 디자이너도 혼동을 야기하는 비율을 만들 수 있습니다.5 원형 차트와 같은 2D 표현은 세그먼트를 서로 비교하기 어렵게 만들 수 있습니다. 또한 원형 차트는 모든 세그먼트를 합하면 전체가 된다는 것을 의미하기도 하는데, 그렇지 않을 수도 있습니다.

휘발유, 에탄올, 전기가 지구 온난화에 미치는 영향을 보여주는 3x4 3D 차트 다양한 소스별 판매 비율을 보여주는 각도가 있는 3D 막대 그래프
읽기 어려운 데이터 시각화의 예시

색상은 그 자체로 주제입니다. 일반적인 정보는 다음과 같습니다.

  • 대부분의 사용자가 혼란을 겪지 않고 처리할 수 있는 한도가 6개이므로 6개 이하의 색상 구분을 사용하세요.
  • 사람마다 색조를 다르게 주문하므로 다양한 스펙트럼 색조를 사용하지 마세요.6
  • 가능하면 단일 색조의 음영을 선택하세요. 그레이스케일에서 더 쉽게 구분할 수 있습니다.
  • 다양한 유형의 색맹에 유의하세요.

참조

카이로, 알베르토님. 차트의 거짓말: 시각적 정보에 대해 스마트하게 활용하기 뉴욕: W.W. Norton, 2019.

핼프, 대럴 통계를 사용하여 거짓말하는 방법 뉴욕: W.W. Norton, 1954.

몬모니어, 마크 How to Lie with Maps, 3rd ed. Chicago: U of Chicago P, 2018.

이미지 참조

'처리량 회계 구조의 예시 차트' TAUser, 2008년. GNU FDL. 출처

'수명 주기 동안 모든 차량 유형의 GWP(MTCO2E)' B2.Team.Leader, 2006년 소스


  1. 카이로 72~73, 79. 

  2. Cairo. 24-26, 36-38. 

  3. 카이로 69-70. 

  4. Huff 21~25. 

  5. 카이로 34, 58~59. 

  6. Monmonier 65-66.