نمودارها، نمودارها و نقشه ها ابزارهای قانع کننده و متقاعدکننده ای برای ارتباط بینش و اطلاعات هستند. آنها همچنین، هنگامی که بد یا بدخواهانه به کار گرفته شوند، منبع سردرگمی، اطلاعات نادرست و نادرست هستند.
نمودارها به عنوان هنر به جای علم
شاغلین ML اغلب مجموعه داده های آموزشی بالقوه را برای درک مفید بودن آنها برای مدل ها و همچنین خروجی های مدل برای درک عملکرد تجسم می کنند.
همیشه در مورد زمینه مورد نظر، مخاطبان و هدف تجسم داده بپرسید، چه در حال ایجاد یا خواندن آن هستید. این سه عامل کلید ارتباطات گرافیکی هستند. همین نمودار می تواند در زمینه های مختلف مفید و روشنگر، یا گمراه کننده و اغراق آمیز باشد. 1 بیننده مورد نظر، و سطح سواد نمودار و داده بیننده، متفاوت خواهد بود. طراحی می تواند کمک کند یا مانع شود. به عنوان مثال، نمودارهای زیبای نفس گیر می توانند بیش از حد پیچیده باشند که اطلاعات را به وضوح منتقل کنند.
هیچ قانون سخت و سریعی برای چگونگی ایجاد یک نمودار کامل وجود ندارد، فقط دستورالعمل ها و بهترین شیوه ها وجود دارد. تجسم داده ها به همان اندازه که یک علم است هنر است. اما هنگام تجسم داده ها، بیش از همه، برای وضوح و صداقت تلاش کنید. اطلاعات کافی برای برقراری ارتباط واضح و دقیق ارائه دهید و نه آنقدر اطلاعات که بیننده را تحت تأثیر قرار دهد.
داربست، محتوا و حرکت های گمراه کننده
آلبرتو قاهره، در چگونه نمودارها دروغ می گویند ، تجسم داده ها را به دو بخش تقسیم می کند: داربست و محتوا .
داربست نمودار شامل عناوین، محورها، افسانهها، برچسبها و منبع دادهها است.
محتوا شامل رمزگذاری بصری داده ها و هرگونه حاشیه نویسی متنی کوتاه است. روش های رمزگذاری بصری داده ها معمولاً عبارتند از:
- طول، مانند نمودار میله ای
- موقعیت، مانند نمودارهای پراکنده
- زوایای متناسب، مساحت ها و کمان ها در نمودارهای دایره ای
- رنگ و رنگ
- به ندرت عرض و ضخامت 2
از همه این عناصر می توان برای گمراه کردن استفاده کرد. شروع یک نمودار میله ای در یک خط پایه غیر صفر، یا کوتاه کردن طولانی ترین میله ها، می تواند تصورات نادرستی ایجاد کند، حتی اگر هدف صرفه جویی در فضا باشد. برای چند نمونه، مقاله سارا لئو در مورد اشتباهات تجسم داده ها را در اکونومیست ببینید.
نسبت تصویر نامناسب می تواند باعث شود که یک تغییر کوچک بسیار بزرگ به نظر برسد یا یک تغییر بزرگ بسیار کوچک به نظر برسد. قاهره پیشنهاد میکند نسبت ابعادی را انتخاب کنید که با تغییر متناسب تصویر شده مطابقت داشته باشد، مثلاً 3:1 برای یک تغییر 30 درصدی، اما همچنین توصیه میکند به زمینه توجه دقیق داشته باشید، زیرا استثناهای مهم زیادی برای این قاعده وجود دارد. نوسانات نسبتاً کوچک در میانگین دمای کره زمین، مثلاً افزایش 2 درجه سانتیگراد از 100 درجه سانتیگراد، بسیار قابل توجه است و در نموداری با نسبت ابعاد 50:1 کمتر از آنچه گفته شده است. 3
استفاده از چرخش های سه بعدی نمودارها و سایر جلوه های سه بعدی برای تأثیر بصری، به جای نمایش داده های سه بعدی، به احتمال زیاد گمراه کننده است. تصاویری از اشیاء سه بعدی که جایگزین میلهها در نمودارهای میلهای میشوند نیز همینطور است. اگر دادهها فقط با طول رمزگذاری شوند، مانند نمودار میلهای استاندارد، خواننده ممکن است شیء نسبتاً بزرگتر را بهعنوان حجم بیشتر و در نتیجه مقدار بالاتر از مقدار مناسب تفسیر کند. 4 طراحانی که از نمایشهای دو بعدی دادهها مانند حبابها استفاده میکنند و دادهها را بر اساس شعاع یا قطر رمزگذاری میکنند تا بر اساس مساحت، همچنین نسبتهای گمراهکننده ایجاد میکنند. 5 نمایش دو بعدی مانند نمودارهای دایره ای می تواند مقایسه بخش ها با یکدیگر را دشوار کند. نمودارهای دایره ای همچنین به این معنا هستند که همه بخش ها به یک کل جمع می شوند، که ممکن است اینطور باشد یا نباشد.
رنگ موضوع خودش است. به طور کلی:
- از 6 یا کمتر تقسیم رنگ استفاده کنید، زیرا این حدی است که اکثر مردم می توانند بدون سردرگمی از پس آن برآیند.
- از انتخاب گسترده رنگ های طیفی خودداری کنید، زیرا افراد مختلف آنها را به طور متفاوتی سفارش می دهند. 6
- در صورت امکان، سایه های یک رنگ را انتخاب کنید که در مقیاس خاکستری قابل تشخیص است.
- از انواع کوررنگی آگاه باشید.
مراجع
قاهره، آلبرتو نمودارها چگونه دروغ می گویند: هوشمندتر شدن در مورد اطلاعات بصری. نیویورک: WW نورتون، 2019.
هاف، دارل. چگونه با آمار دروغ بگوییم نیویورک: WW نورتون، 1954.
مونمونیر، مارک. چگونه با نقشه ها دروغ بگوییم، ویرایش سوم. شیکاگو: U of Chicago P، 2018.
مراجع تصویر
"نمودار نمونه ای از ساختار حسابداری عملیاتی." TAUser، 2008. GNU FDL. منبع
"GWP (MTCO2E) برای همه انواع خودرو در طول چرخه عمر." B2.Team.Leader، 2006. منبع