अहम जानकारी और जानकारी को शेयर करने के लिए, चार्ट, ग्राफ़, और मैप बेहतरीन टूल हैं. गलत तरीके से या नुकसान पहुंचाने के इरादे से इस्तेमाल किए जाने पर, ये भ्रम, गलत जानकारी, और गलत जानकारी का स्रोत भी होते हैं.
चार्ट को विज्ञान के बजाय कला के तौर पर देखना
मशीन लर्निंग के कारोबारी अक्सर संभावित ट्रेनिंग डेटासेट को देखते हैं, ताकि वे यह समझ सकें कि मॉडल उनके लिए कितने काम के हैं. साथ ही, वे परफ़ॉर्मेंस को समझने के लिए मॉडल आउटपुट को भी देखते हैं.
डेटा विज़ुअलाइज़ेशन बनाते या पढ़ते समय, हमेशा इसके कॉन्टेक्स्ट, ऑडियंस, और मकसद के बारे में पूछें. ये तीन बातें ग्राफ़िकल बातचीत के लिए मुख्य हैं. एक ही चार्ट, अलग-अलग कॉन्टेक्स्ट में काम का और अहम जानकारी देने वाला हो सकता है या गुमराह करने वाला और बढ़ा-चढ़ाकर जानकारी देने वाला हो सकता है.1 सही दर्शक, दर्शकों का ग्राफ़ और डेटा के बारे में जानकारी, दोनों अलग-अलग होंगे. डिज़ाइन से मदद मिल सकती है या फिर उससे समस्याएं भी आ सकती हैं. उदाहरण के लिए, शानदार और सुंदर चार्ट इतने जटिल हो सकते हैं कि उनमें साफ़ तौर पर जानकारी न दी जा सके.
बेहतरीन चार्ट बनाने के लिए, कोई ज़रूरी नियम नहीं है. इसके लिए, सिर्फ़ दिशा-निर्देश और सबसे सही तरीके हैं. डेटा को विज़ुअलाइज़ करना, विज्ञान के साथ-साथ कला भी है. हालांकि, डेटा को विज़ुअलाइज़ करते समय, सबसे ज़्यादा साफ़ तौर पर और ईमानदारी से जानकारी देने की कोशिश करें. साफ़-साफ़ और सटीक रूप से बताने के लिए इतनी जानकारी न दें, न कि इतनी ज़्यादा जानकारी कि दर्शकों को परेशानी हो.
स्कैफ़ोल्डिंग, कॉन्टेंट, और गुमराह करने वाले मूव
चार्ट कैसे झूठ बोलते हैं में, अल्बर्टो कैरो ने डेटा विज़ुअलाइज़ेशन को दो हिस्सों में बांटा है: स्केफ़ोल्डिंग और कॉन्टेंट.
चार्ट के अलग-अलग स्ट्रक्चर में टाइटल, ऐक्सिस, लेजेंड, लेबल, और डेटा का सोर्स (अगर दिया गया हो) शामिल होता है.
कॉन्टेंट में डेटा की विज़ुअल एन्कोडिंग और टेक्स्ट के तौर पर छोटी-छोटी व्याख्याएं शामिल होती हैं. विज़ुअल तौर पर डेटा को कोड में बदलने के तरीकों में आम तौर पर ये शामिल हैं:
- लंबाई, जैसे कि बार चार्ट में
- पोज़िशन, जैसे कि स्कैटरपॉट में
- पाई चार्ट में समानुपातिक कोण, क्षेत्रफल, और चाप
- रंग और ह्यू
- शायद ही कभी, चौड़ाई और मोटाई2
इन सभी एलिमेंट का इस्तेमाल, गुमराह करने के लिए किया जा सकता है. बार चार्ट को शून्य से अलग आधार रेखा पर शुरू करने या सबसे लंबे बार को छोटा करने से, गलत नतीजे मिल सकते हैं. भले ही, ऐसा जगह बचाने के मकसद से किया गया हो. कुछ उदाहरणों के लिए, Economist में डेटा विज़ुअलाइज़ेशन की गड़बड़ियों पर, सारा लियो की लिखी एस्से देखें.
आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) में होने वाले बदलाव से छोटा सा बदलाव बहुत बड़ा या बहुत छोटा लग सकता है. कैरो आपको ऐसा स्पेक्ट रेशियो चुनने का सुझाव देता है जो इमेज में दिखाए गए अनुपात में हुए बदलाव से मेल खाता हो. मान लें कि 30% बदलाव के लिए 3:1 है, लेकिन कॉन्टेक्स्ट पर भी ज़्यादा ध्यान देने की सलाह दी जाती है, क्योंकि इस नियम के कई अहम अपवाद हैं. उदाहरण के लिए, दुनिया के औसत तापमान में होने वाले छोटे-मोटे उतार-चढ़ाव. उदाहरण के लिए, अगर तापमान 100 डिग्री सेल्सियस में से 2 डिग्री तक बढ़ जाता है, तो ये काफ़ी अहम होते हैं. इन्हें 50:1 आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) वाले चार्ट में देखा जा सकता है.3
3D डेटा दिखाने के बजाय विज़ुअल असर के लिए चार्ट के 3D रोटेशन और दूसरे 3D इफ़ेक्ट का इस्तेमाल करने से गुमराह होने की संभावना है. इसी तरह, 3D ऑब्जेक्ट को भी बार चार्ट में बार की जगह दिखाया जा सकता है. अगर डेटा को सिर्फ़ लंबाई के हिसाब से कोड किया गया है, तो स्टैंडर्ड बार चार्ट की तरह, रीडर को अनुपात के हिसाब से बड़े ऑब्जेक्ट का मतलब ज़्यादा वॉल्यूम के तौर पर लग सकता है. इसलिए, वह ज़रूरत से ज़्यादा वैल्यू का अनुमान लगा सकता है.4 ऐसे डिज़ाइनर जो डेटा को बबल जैसे 2D फ़ॉर्मैट में दिखाते हैं और डेटा को एरिया के बजाय त्रिज्या या डायमीटर के हिसाब से कोड करते हैं, वे भी गुमराह करने वाले अनुपात बना सकते हैं.5 पाई चार्ट जैसे 2D फ़ॉर्मैट की वजह से, सेगमेंट की आपस में तुलना करना मुश्किल हो सकता है. पाई चार्ट से यह भी पता चलता है कि सभी सेगमेंट एक साथ मिलकर पूरे डेटा को बनाते हैं. हालांकि, ऐसा ज़रूरी नहीं है कि ऐसा हो.
रंग एक विषय है. सामान्य रूप में:
- छह या उससे कम रंगों का इस्तेमाल करें, क्योंकि ज़्यादा से ज़्यादा लोग इससे ज़्यादा रंगों को आसानी से समझ नहीं पाते.
- स्पेक्ट्रल ह्यू की बड़ी रेंज से बचें, क्योंकि अलग-अलग लोग उन्हें अलग-अलग क्रम में लगाते हैं.6
- अगर हो सके, तो एक ही रंग के शेड चुनें, जो ग्रेस्केल में आसानी से पहचाने जा सकते हों.
- अलग-अलग तरह की कलर ब्लाइंडनेस के बारे में जानकारी रखें.
रेफ़रंस
काहिरा, अल्बर्टो. चार्ट कैसे गुमराह करते हैं: विज़ुअल जानकारी के बारे में ज़्यादा जानना. न्यूयॉर्क: डब्ल्यू.डब्ल्यू. नॉर्टन, 2019.
हफ़, डैरिल. आंकड़ों का गलत इस्तेमाल करके झूठ कैसे बोलें. NY: W.W. Norton, 1954.
मोमोनी, मार्क. How to Lie with Maps, तीसरा संस्करण. शिकागो: U of Chicago P, 2018.
इमेज के रेफ़रंस
"थ्रूपुट अकाउंटिंग स्ट्रक्चर के उदाहरण का चार्ट." टीएउपयोगकर्ता, 2008. GNU FDL. सोर्स
"लाइफ़ साइकल में सभी तरह के वाहनों के लिए, GWP (MTCO2E)." B2.Team.Leader, 2006. सोर्स