Biểu đồ, đồ thị và bản đồ là những công cụ hấp dẫn và thuyết phục để truyền đạt thông tin chi tiết và thông tin. Khi được triển khai không đúng cách hoặc ác ý, những hệ thống này cũng chính là nguồn gây nhầm lẫn, thông tin sai lệch và sai sự thật.
Biểu đồ là nghệ thuật thay vì khoa học
Những người thực hành học máy thường trực quan hoá các tập dữ liệu huấn luyện tiềm năng để hiểu được tính hữu ích của các tập dữ liệu đó đối với mô hình, cũng như kết quả của mô hình để hiểu được hiệu suất.
Luôn hỏi về ngữ cảnh, đối tượng và mục đích dự kiến của một bản dữ liệu trực quan, cho dù bạn đang tạo hay đọc bản dữ liệu trực quan. Ba yếu tố này là yếu tố quan trọng đối với hoạt động giao tiếp đồ hoạ. Biểu đồ tương tự cũng có thể hữu ích và chi tiết, hoặc gây hiểu lầm và phóng đại trong nhiều bối cảnh.1 Đối tượng người xem mà họ nhắm đến và mức độ hiểu biết về biểu đồ và dữ liệu của người xem sẽ khác nhau. Thiết kế có thể hữu ích hoặc cản trở. Ví dụ: các biểu đồ đẹp mắt có thể quá phức tạp để truyền đạt thông tin một cách rõ ràng.
Không có quy tắc chặt chẽ nào về cách tạo một biểu đồ hoàn hảo, chỉ có các nguyên tắc và phương pháp hay nhất. Trực quan hoá dữ liệu là một nghệ thuật cũng như một khoa học. Tuy nhiên, khi trực quan hoá dữ liệu, hãy cố gắng trên hết là đảm bảo sự rõ ràng và trung thực. Cung cấp đủ thông tin để truyền đạt rõ ràng và chính xác, đồng thời không cung cấp quá nhiều thông tin khiến người xem bị choáng ngợp.
Nội dung, nội dung gây hiểu lầm và các thao tác lừa đảo
Alberto Cairo trong bài viết How Chart Lie (Cách biểu đồ nói dối) phân chia hình ảnh trực quan dữ liệu thành hai phần: scaffolding (giàn giáo) và content (nội dung).
Cấu trúc của biểu đồ bao gồm tiêu đề, trục, chú giải, nhãn và nguồn dữ liệu (nếu có).
Nội dung bao gồm phương thức mã hoá trực quan dữ liệu và bất kỳ chú thích văn bản ngắn nào. Các phương pháp mã hoá dữ liệu trực quan thường bao gồm:
- chiều dài, như trong biểu đồ thanh
- vị trí, như trong biểu đồ phân tán
- góc tỷ lệ, diện tích và cung trong biểu đồ hình tròn
- màu sắc và sắc độ
- hiếm gặp hơn, chiều rộng và chiều dày2
Tất cả các thành phần này đều có thể được dùng để gây hiểu lầm. Việc bắt đầu biểu đồ thanh với đường cơ sở khác 0 hoặc cắt bớt các thanh dài nhất có thể tạo ra nhận thức không chính xác, ngay cả khi mục đích là tiết kiệm không gian. Hãy xem bài luận của Sarah Leo về các lỗi trong việc trực quan hoá dữ liệu trên Economist để biết một số ví dụ.
Tỷ lệ khung hình không phù hợp có thể khiến thay đổi nhỏ dường như rất lớn hoặc thay đổi lớn dường như rất nhỏ. Cairo đề xuất chọn một tỷ lệ khung hình phù hợp với sự thay đổi theo tỷ lệ đang được mô tả, chẳng hạn như 3:1 cho sự thay đổi 30%, nhưng cũng nên chú ý đến ngữ cảnh vì có nhiều trường hợp ngoại lệ quan trọng đối với quy tắc này. Ví dụ: sự biến động tương đối nhỏ về nhiệt độ trung bình trên toàn cầu, chẳng hạn như tăng 2 độ C trong số 100 độ C, là rất đáng kể và sẽ bị đánh giá thấp trong biểu đồ có tỷ lệ khung hình 50:1.3
Việc sử dụng chế độ xoay 3D của biểu đồ và các hiệu ứng 3D khác để tạo tác động trực quan thay vì trình bày dữ liệu 3D rất có thể gây hiểu lầm. Đó cũng là nội dung mô tả các đối tượng 3D thay thế cho các thanh trong biểu đồ thanh. Nếu dữ liệu chỉ được mã hoá theo độ dài, chẳng hạn như biểu đồ thanh chuẩn, thì người đọc có thể diễn giải đối tượng lớn hơn theo tỷ lệ là có thể tích lớn hơn, do đó, có giá trị cao hơn so với mức phù hợp.4 Các nhà thiết kế sử dụng dữ liệu biểu diễn 2D (như bong bóng) và mã hoá dữ liệu theo bán kính hoặc biểu đồ đường kính thay vì theo diện tích cũng sẽ tạo ra tỷ lệ biểu diễn sai lệch.5 Biểu đồ hình tròn cũng ngụ ý rằng tất cả các phân đoạn cộng lại thành một tổng thể, có thể đúng hoặc không đúng.
Màu sắc là chủ thể riêng của màu sắc. Nói chung:
- Hãy sử dụng tối đa 6 bảng màu, vì đó là giới hạn mà hầu hết mọi người có thể xử lý mà không bị nhầm lẫn.
- Tránh sử dụng nhiều sắc thái quang phổ vì mỗi người có cách sắp xếp màu sắc khác nhau.6
- Nếu có thể, hãy chọn sắc độ của một sắc độ duy nhất, dễ phân biệt hơn bằng thang màu xám.
- Hãy lưu ý các loại mù màu khác nhau.
Tài liệu tham khảo
Cairo, Alberto. Cách biểu đồ nói dối: Giúp thông tin trực quan trở nên thông minh hơn. New York: W.W. Norton, năm 2019.
Hừm, Darrell. Cách nói dối với số liệu thống kê. New York: W.W. Norton, 1954.
Monmonier, Mark. Cách nói dối với Maps, phiên bản 3. Chicago: U of Chicago P, 2018.
Nội dung tham khảo về hình ảnh
"Biểu đồ ví dụ về cấu trúc Tính năng kế toán lưu lượng truy cập." TAUser, 2008. GNU FDL. Nguồn
"GWP (MTCO2E) cho tất cả các loại xe trong vòng đời". B2.Team.Leader, 2006. Nguồn