チャート、グラフ、マップは、洞察や情報を伝達するための説得力のあるツールです。また、不適切または悪意を持ってデプロイされると、混乱、誤った情報、不実の原因となります。
グラフは科学ではなく芸術である
ML の実務担当者は、モデルの有用性を把握するために候補となるトレーニング データセットを可視化し、パフォーマンスを把握するためにモデル出力を可視化することがよくあります。
データ可視化の作成または読み取りのいずれにおいても、データの可視化の意図するコンテキスト、対象、目的について常に検討してください。これらの 3 つの要素は、グラフィックによるコミュニケーションの鍵となります。同じグラフでも、コンテキストによって有用で有益な情報を提供し、または誤解を招き、誇張された情報を伝える場合があります。1 対象となる視聴者や、視聴者のグラフとデータに関するリテラシーのレベルは異なります。設計は、役立つ場合もあれば、妨げになる場合もあります。たとえば、息をのむほど美しいグラフは複雑すぎて、情報を明確に伝えることができない場合があります。
完璧なグラフを作成する方法に厳格なルールはなく、ガイドラインとベスト プラクティスのみがあります。データの可視化は 科学であると同時に 芸術でもありますただし、データを可視化する際は、何よりも明確で誠実なものにするようにしてください。明確かつ正確に伝えるのに十分な情報を提供し、視聴者を圧倒するほどの情報は提供しないでください。
スキャフォールディング、コンテンツ、誤解を招く動き
アルベルト カイロは、How Charts Lie で、データ ビジュアライゼーションをスキャフォールディングとコンテンツの 2 つの部分に分割しています。
グラフのスキャフォールディングには、タイトル、軸、凡例、ラベル、データのソース(指定されている場合)が含まれます。
コンテンツには、データの視覚エンコードと短いテキスト アノテーションが含まれます。データを視覚的にエンコードする方法は通常、以下のとおりです。
- 横棒グラフのような長さ
- 散布図のように
- 円グラフの角度、面積、円弧の比率
- 色と色相
- 幅と太さはまれ2
これらの要素はすべて、誤解を招きかねません。棒グラフをゼロ以外のベースラインから開始したり、最も長いバーを切り捨てたりすると、スペースの節約を意図したものであっても、不正確な認識が生じる可能性があります。例については、Economist のデータ可視化の誤りに関する Sarah Leo のエッセイをご覧ください。
アスペクト比が適切でないと、小さな変化が非常に大きく見えたり、大きな変化が非常に小さく見えたりすることがあります。カイロは、示している変化に比例するアスペクト比(30% の変化の場合は 3:1 など)を選ぶことを提案しますが、ルールには重要な例外が多いため、コンテキストにも細心の注意を払ってください。平均地球温度が 100℃ のうち 2℃ 上昇するなど、比較的小さな変動は非常に重要ですが、アスペクト比が 50:1 のグラフでは過小評価されます。3
3D データを表すのではなく、視覚効果を高めるためにグラフの 3D 回転やその他の 3D 効果を使用すると、誤解が生じる可能性が高くなります。棒グラフの棒の代わりとなる 3D オブジェクトも同様です。データが標準的な棒グラフのように長さのみでエンコードされている場合、読者は、比例して大きいオブジェクトの方が体積が大きいと解釈する可能性があります4。バブルなどのデータの 2D 表現を使用し、面ではなく半径または直径でデータをエンコードする場合、他のセグメントで見づらくなる可能性があります。5円グラフは、すべてのセグメントの合計が全体になることを暗示していますが、これは必ずしもそうとは限りません。
![ガソリン、エタノール、電力が地球温暖化に及ぼす影響を示す 3x4 の 3D チャート](https://developers.google.cn/static/machine-learning/guides/data-traps/img/3dchart.jpg?hl=ja)
![さまざまなソースによる売上の割合を示す斜めの 3D 棒グラフ](https://developers.google.cn/static/machine-learning/guides/data-traps/img/ThroughputStructure.jpg?hl=ja)
色は独自のテーマです。一般的には次のようになります。
- ほとんどの人が混乱なく扱える色の分割は 6 つ以下にしてください。
- スペクトル色の選択肢を広げすぎないでください。ユーザーによって色の注文内容が異なるためです。6
- 可能であれば、グレースケールでより見分けやすい単一の色相の色合いを選択します。
- さまざまな種類の色覚異常に注意してください。
参照
カイロ様、How Charts Lie: Getting Smarter about Visual InformationNY: W.W. Norton, 2019.
ああ、ダレル。How to Lie with Statistics(統計で嘘をつく方法)NY: W.W. Norton, 1954.
Monmonier, Mark. How to Lie with Maps、3rd ed. Chicago: U of Chicago P、2018 年。
画像参照
「スループット アカウンティング構造の例のチャート」TAUser、2008 年。 GNU FDL。出典
「全車種にわたる GWP(MTCO2E)。」B2.Team.Leader、2006 年。 ソース