แผนภูมิ กราฟ และแผนที่เป็นเครื่องมือที่ดึงดูดใจและจูงใจสำหรับการสื่อสาร ข้อมูลเชิงลึกและข้อมูล นอกจากนี้ เมื่อใช้งานอย่างไม่เหมาะสมหรือเป็นอันตราย ที่ทำให้เกิดความสับสน การให้ข้อมูลที่ไม่ถูกต้อง และความเท็จ
แผนภูมิเป็นศิลปะ ไม่ใช่วิทยาศาสตร์
ผู้ปฏิบัติงานด้าน ML มักแสดงภาพชุดข้อมูลการฝึกที่เป็นไปได้เพื่อทำความเข้าใจ ประโยชน์ของโมเดล รวมถึงเอาต์พุตของโมเดลเพื่อให้เข้าใจประสิทธิภาพ
ถามเกี่ยวกับบริบท กลุ่มเป้าหมาย และวัตถุประสงค์ของข้อมูลที่ต้องการเสมอ ไม่ว่าคุณกำลังสร้างหรืออ่านอยู่ ปัจจัยทั้ง 3 ข้อนี้ เป็นกุญแจสำคัญในการสื่อสารด้วยกราฟิก แผนภูมิเดียวกันอาจมีประโยชน์และให้ข้อมูลเชิงลึก หรือ ทำให้เข้าใจผิดและเกินจริงในบริบทที่แตกต่างกัน1 ผู้ชมที่ต้องการ และ ระดับกราฟและการรู้เท่าทันข้อมูลของผู้ชมจะแตกต่างกันไป การออกแบบช่วยหรือ ตัวขัดขวาง ตัวอย่างเช่น แผนภูมิที่สวยงามจนน่าทึ่งนั้นอาจทำให้ต้อง สื่อสารข้อมูลได้อย่างชัดเจน
ไม่มีกฎที่ยากและเร็วสำหรับวิธีสร้างแผนภูมิที่สมบูรณ์แบบ หลักเกณฑ์และแนวทางปฏิบัติที่ดีที่สุด การแสดงข้อมูลเป็นภาพ ก็เหมือนศิลปะ วิทยาศาสตร์ แต่เมื่อแสดงข้อมูลให้เห็นเป็นภาพ ให้พยายามที่สำคัญที่สุดเพื่อความชัดเจนและซื่อสัตย์ ให้ข้อมูลที่เพียงพอในการสื่อสารอย่างชัดเจนและถูกต้อง ไม่ใช่ ข้อมูลมากมายที่ทำให้ผู้ชมรู้สึกถดถอย
การนั่งร้าน เนื้อหา และท่าทางที่ทำให้เข้าใจผิด
Alberto Cairo จากหัวข้อ How Charts Lie ได้แบ่งการแสดงภาพข้อมูลออกเป็น 2 ส่วน ดังนี้ การนั่งร้านและเนื้อหา
นั่งร้านของแผนภูมิประกอบด้วย ชื่อ แกน คำอธิบาย ป้ายกำกับ และแหล่งที่มาของ ข้อมูลนั้นหากได้รับ
เนื้อหาประกอบด้วยการเข้ารหัสภาพของข้อมูลและข้อความสั้นๆ คำอธิบายประกอบ วิธีการเข้ารหัสข้อมูลภาพโดยทั่วไปมีดังนี้
- ความยาวตามที่แสดงในแผนภูมิแท่ง
- ตำแหน่ง เช่น แผนภูมิกระจาย
- มุม พื้นที่ และเส้นโค้งที่ได้สัดส่วนในแผนภูมิวงกลม
- สีและโทนสี
- น้อยครั้งมาก คือ ความกว้างและความหนา2
องค์ประกอบทั้งหมดนี้สามารถใช้เพื่อทําให้เข้าใจผิดได้ การเริ่มต้นแผนภูมิแท่งที่ไม่ใช่ 0 เกณฑ์พื้นฐานหรือการตัดแท่งที่ยาวที่สุด อาจสร้างการรับรู้ที่ไม่ถูกต้อง แม้ว่ามีเจตนาที่จะ ประหยัดพื้นที่ก็ตาม ดูของ Sarah Leo เรียงความ เกี่ยวกับข้อผิดพลาดของการแสดงข้อมูลผ่านภาพใน Economist เป็นตัวอย่าง
สัดส่วนภาพที่ไม่เหมาะสมอาจทำให้การเปลี่ยนแปลงเล็กๆ น้อยๆ ดูมีขนาดใหญ่มาก หรือการเปลี่ยนแปลงครั้งใหญ่นั้นดูเป็นเรื่องเล็กๆ Cairo แนะนำให้เลือก สัดส่วนที่ตรงกับการเปลี่ยนแปลงตามสัดส่วนที่แสดงอยู่ เช่น 3:1 สำหรับ 30% เปลี่ยนแปลงไปพร้อมๆ กับการพิจารณาบริบทอย่างถี่ถ้วนเนื่องจากมี ข้อยกเว้นสำคัญหลายประการสำหรับกฎนี้ ความผันผวนโดยเฉลี่ยที่สัมพันธ์กันเพียงเล็กน้อย สมมติว่าอุณหภูมิทั่วโลกสูงขึ้น 2C จาก 100C มีนัยสําคัญมากและอธิบายได้ยากในแผนภูมิที่อัตราส่วน 50:1 อัตราส่วน3
ใช้การหมุนแผนภูมิแบบ 3 มิติและเอฟเฟกต์ 3 มิติอื่นๆ เพื่อสร้างเอฟเฟกต์ภาพ มากกว่าการนำเสนอข้อมูล 3 มิติ มีแนวโน้มที่จะทำให้เกิดการเข้าใจผิด เช่นเดียวกับ การแสดงภาพวัตถุ 3 มิติที่ใช้แทนแท่งในแผนภูมิแท่ง หาก ข้อมูลถูกเข้ารหัสตามความยาวเท่านั้น เช่นเดียวกับแผนภูมิแท่งมาตรฐาน ที่อ่านได้ ตีความวัตถุที่ใหญ่กว่าตามสัดส่วนว่ามีปริมาณมากกว่า ดังนั้น จึงมีค่าสูงกว่าและเหมาะสม4 นักออกแบบที่ใช้รูปแบบ 2 มิติ การนำเสนอข้อมูล เช่น ลูกโป่ง และเข้ารหัสข้อมูลตามรัศมีหรือเส้นผ่านศูนย์กลาง มากกว่าพื้นที่จะทำให้มีสัดส่วนที่ทำให้เข้าใจผิด5 2 มิติ แผนภูมิวงกลมอาจทำให้เปรียบเทียบกลุ่มต่างๆ ได้ยาก เปรียบเทียบกันเอง แผนภูมิวงกลมยังบอกเป็นนัยว่า ทุกส่วนรวมกัน ซึ่งอาจจะมีหรือไม่มีก็ได้
![แผนภูมิ 3 มิติ 3x4 ที่แสดงผลกระทบของน้ำมันเบนซิน เอทานอล และไฟฟ้าที่มีต่อภาวะโลกร้อน](https://developers.google.cn/static/machine-learning/guides/data-traps/img/3dchart.jpg?hl=th)
![แผนภูมิแท่ง 3 มิติมุมที่แสดง % ของยอดขายเนื่องจากแหล่งที่มาแตกต่างกัน](https://developers.google.cn/static/machine-learning/guides/data-traps/img/ThroughputStructure.jpg?hl=th)
สีนั้นขึ้นอยู่กับเรื่องนั้นๆ โดยทั่วไปแล้วหมวดหมู่จะทำงานดังนี้
- ใช้การแบ่งสีไม่เกิน 6 ส่วน เพราะนั่นเป็นขีดจำกัดสำหรับสิ่งที่คนส่วนใหญ่ใช้ สามารถรับมือได้โดยไม่เกิดความสับสน
- หลีกเลี่ยงเฉดสีสเปกตรัมที่มีให้เลือกมากมาย เนื่องจากแต่ละคนต่างก็เลือกสเปกตรัม แตกต่างกัน6
- หากเป็นไปได้ ให้เลือกเฉดสีสีเดียว ซึ่งมากกว่า แยกความแตกต่างได้เป็นโทนสีเทา
- โปรดระวังประเภทต่างๆ ของ ตาบอดสี
ข้อมูลอ้างอิง
ไคโร อัลแบร์โต หลักการทำงานของแผนภูมิ: ทำความเข้าใจข้อมูลภาพอย่างชาญฉลาดขึ้น นิวยอร์ก: ดับเบิลยู. Norton, 2019
ฮัฟฟ์ ดาร์เรลล์ วิธีโกหกกับสถิติ นิวยอร์ก: W.W. Norton, 1954
มอนโมเนียร์ มาร์ก How to Lie with Maps, ฉบับที่ 3 ชิคาโก: U of Chicago P, 2018
การอ้างอิงรูปภาพ
"แผนภูมิตัวอย่างโครงสร้างทางบัญชีอัตราการส่งข้อมูล" TAUser, 2008 GNU FDL แหล่งที่มา
"GWP (MTCO2E) สำหรับยานพาหนะทุกประเภทตลอดอายุการใช้งาน" B2.Team.Leader, 2006 แหล่งที่มา