แผนภูมิ กราฟ และแผนที่เป็นเครื่องมือที่น่าสนใจและโน้มน้าวสำหรับการสื่อสารข้อมูลเชิงลึกและข้อมูล และยังเป็นแหล่งที่มาของความสับสน การให้ข้อมูลที่ไม่ถูกต้อง และไม่เป็นจริงหากนำไปใช้งานอย่างไม่เหมาะสมหรือมุ่งร้าย
แผนภูมิเป็นศิลปะมากกว่าวิทยาศาสตร์
ผู้ปฏิบัติงาน ML มักแสดงภาพชุดข้อมูลการฝึกที่เป็นไปได้เพื่อทำความเข้าใจประโยชน์ของโมเดลและเอาต์พุตโมเดลสำหรับทำความเข้าใจประสิทธิภาพ
อย่าลืมสอบถามเกี่ยวกับบริบท กลุ่มเป้าหมาย และวัตถุประสงค์ของการแสดงข้อมูลเป็นภาพเสมอ ไม่ว่าคุณจะเป็นผู้สร้างหรือผู้อ่าน ปัจจัย 3 ข้อนี้ เป็นกุญแจสำคัญในการสื่อสารด้วยกราฟิก แผนภูมิเดียวกันนั้นอาจมีประโยชน์และข้อมูลเชิงลึก หรือให้ข้อมูลผิดและเกินจริงในบริบทที่ต่างกัน1 ผู้ชมที่ต้องการ รวมถึงระดับการอ่านและการอ่านกราฟของผู้ชมจะแตกต่างกันไป การออกแบบอาจเป็นตัวช่วย หรือเป็นอุปสรรค เช่น แผนภูมิที่สวยงามอาจซับซ้อนเกินกว่าที่จะสื่อข้อมูลได้อย่างชัดเจน
การสร้างแผนภูมิที่สมบูรณ์แบบไม่มีกฎตายตัว มีเพียงหลักเกณฑ์และแนวทางปฏิบัติแนะนำเท่านั้น การแสดงข้อมูลเป็นภาพเป็นทั้งศาสตร์และศิลป์ แต่สิ่งที่สำคัญที่สุดเมื่อแสดงข้อมูลเป็นภาพคือความชัดเจนและความซื่อสัตย์ ให้ข้อมูลที่เพียงพอในการสื่อสารอย่างชัดเจนและถูกต้อง ไม่ใช่ข้อมูลมากจนผู้ชมจะอึดอัด
การนั่งร้าน เนื้อหา และท่าทางที่ทำให้เข้าใจผิด
Alberto Cairo จากบทความ How Charts Lie ได้แบ่งการแสดงข้อมูลผ่านภาพออกเป็น 2 ส่วน ได้แก่ การนั่งร้านและเนื้อหา
นั่งร้านของแผนภูมิประกอบด้วยชื่อ แกน คำอธิบาย ป้ายกำกับ และแหล่งที่มาของข้อมูล (หากระบุไว้)
เนื้อหาประกอบด้วยการเข้ารหัสข้อมูลเป็นภาพและคำอธิบายประกอบที่เป็นข้อความสั้นๆ วิธีการเข้ารหัสข้อมูลแบบภาพโดยทั่วไปมีดังนี้
- ความยาวตามที่แสดงในแผนภูมิแท่ง
- ตำแหน่ง เช่น ในผังกระจาย
- มุม พื้นที่ และเส้นโค้งที่ได้สัดส่วนในแผนภูมิวงกลม
- สีและโทนสี
- น้อยครั้งมาก คือ ความกว้างและความหนา2
องค์ประกอบทั้งหมดนี้สามารถใช้เพื่อทําให้เข้าใจผิดได้ การเริ่มใช้แผนภูมิแท่งจากเส้นฐานที่ไม่ใช่ 0 หรือตัดแท่งที่ยาวที่สุดอาจสร้างการรับรู้ที่ไม่ถูกต้อง แม้ว่ามีเจตนาที่จะประหยัดพื้นที่ก็ตาม ดูตัวอย่างได้ในบทความของ Sarah Leo ที่เรียงความเกี่ยวกับข้อผิดพลาดของการแสดงข้อมูลเป็นภาพใน The Economist
สัดส่วนภาพที่ไม่เหมาะสมอาจทำให้การเปลี่ยนแปลงเล็กน้อยดูมีขนาดใหญ่มาก หรือการเปลี่ยนแปลงครั้งใหญ่ดูเป็นการเปลี่ยนแปลงที่เล็กมาก ไคโรแนะนำให้เลือกสัดส่วนที่ตรงกับการเปลี่ยนแปลงตามสัดส่วนที่แสดง เช่น 3:1 สำหรับการเปลี่ยนแปลง 30% แต่ก็แนะนำให้ใส่ใจกับบริบทด้วย เนื่องจากกฎนี้มีข้อยกเว้นที่สำคัญหลายอย่าง ความผันผวนที่สัมพันธ์กันเพียงเล็กน้อยของอุณหภูมิเฉลี่ยโลก เช่น การเพิ่มขึ้น 2C จาก 100C มีความสําคัญสูงและจะแสดงในแผนภูมิที่มีอัตราส่วน 50:13
การใช้การหมุน 3 มิติของแผนภูมิและเอฟเฟกต์ 3 มิติอื่นๆ เพื่อสร้างความประทับใจทางสายตาแทนที่จะแสดงข้อมูล 3 มิติ มีแนวโน้มที่จะทําให้เข้าใจผิด เช่นเดียวกับการแสดงวัตถุ 3 มิติที่ใช้แทนแท่งในแผนภูมิแท่ง หากข้อมูลเข้ารหัสความยาวเท่านั้น เช่น แผนภูมิแท่งมาตรฐาน ผู้อ่านอาจตีความวัตถุที่มีสัดส่วนใหญ่กว่ามีปริมาณมากกว่า เพื่อให้ได้ค่าสูงกว่าเหมาะสม4 นักออกแบบที่ใช้การนำเสนอข้อมูล 2 มิติ เช่น ลูกโป่ง และเข้ารหัสข้อมูลตามรัศมีหรือเส้นผ่านศูนย์กลางมากกว่าที่จะตีความแต่ละส่วนตามพื้นที่ แผนภูมิวงกลมอาจสร้างสัดส่วนที่ก่อให้เกิดความเข้าใจผิด เช่น แผนภูมิวงกลมอื่นๆ แผนภูมิวงกลมยังบอกเป็นนัยว่าส่วนของทุกกลุ่มรวมกันแล้ว ซึ่งอาจไม่ใช่กรณีเดียวกัน
สีเป็นหัวข้อหนึ่งๆ ในตัว โดยทั่วไปแล้วหมวดหมู่จะทำงานดังนี้
- ใช้การแบ่งสีไม่เกิน 6 ระดับ เนื่องจากเป็นจำนวนที่ผู้คนส่วนใหญ่รับมือได้โดยไม่สับสน
- หลีกเลี่ยงการใช้เฉดสีที่หลากหลาย เนื่องจากผู้ใช้แต่ละคนมีลำดับสีไม่เหมือนกัน6
- หากเป็นไปได้ ให้เลือกเฉดสีเดียว ซึ่งจะแยกแยะได้ง่ายกว่าในโหมดสีเทา
- โปรดระมัดระวัง ตาบอดสีประเภทต่างๆ
ข้อมูลอ้างอิง
Cairo, Alberto How Charts Lie: Getting Smarter about Visual Information นิวยอร์ก: W.W. Norton, 2019
ฮัฟฟ์ ดาร์เรลล์ วิธีโกหกด้วยสถิติ นิวยอร์ก: ดับเบิลยู. นอร์ตัน, 1954
มอนโมเนียร์ มาร์ก How to Lie with Maps, 3rd ed. Chicago: U of Chicago P, 2018
การอ้างอิงรูปภาพ
"แผนภูมิตัวอย่างโครงสร้างทางบัญชีอัตราการส่งข้อมูล" TAUser, 2008 GNU FDL แหล่งที่มา
"GWP (MTCO2E) สำหรับยานพาหนะทุกประเภทตลอดอายุการใช้งาน" B2.Team.Leader, 2006. แหล่งที่มา