इस कोर्स में, डेटासेट की क्वालिटी से लेकर कई सामान्य डेटा ट्रैप के बारे में बताया गया है जिसमें विज़ुअलाइज़ेशन और आंकड़ों के विश्लेषण के बारे में बताया गया हो.
मशीन लर्निंग का इस्तेमाल करने वाले लोगों को यह पूछना चाहिए:
- मैं अपने डेटासेट की विशेषताओं और किन स्थितियों के तहत डेटा इकट्ठा किया गया?
- मेरे डेटा में क्वालिटी या पक्षपात से जुड़ी कौनसी समस्याएं हैं? जटिल कारक हैं मौजूद है?
- इन खास चीज़ों का इस्तेमाल करने से कौनसी समस्याएं आ सकती हैं डेटासेट?
- अनुमान लगाने या कैटगरी तय करने वाले मॉडल को ट्रेनिंग देते समय: जिस डेटासेट के लिए मॉडल को ट्रेनिंग दी गई है उसमें सभी ज़रूरी वैरिएबल शामिल हैं?
मशीन लर्निंग का इस्तेमाल करने वाले लोगों को हमेशा इस बात की जांच करनी चाहिए कि जो भी नतीजे मिले हैं, मशीन लर्निंग का इस्तेमाल करने वाले लोगों को पुष्टि करने वाले पक्षपात के लिए खुद को जांचते हैं, फिर उनके नतीजों की जांच करते हैं की मदद से बनाया गया है और जहां डेटा का विरोध है, वहां की जांच इनसे बचें.
आपकी मदद के लिए कुछ और लेख
काहिरा, अल्बर्टो. चार्ट का क्या असर होता है: विज़ुअल की जानकारी को लेकर ज़्यादा स्मार्ट बनें. न्यूयॉर्क: डब्ल्यू॰डब्ल्यू॰ नॉर्टन, 2019.
हफ़, डैरेल. आंकड़ों के साथ झूठ बोलने का तरीका. न्यूयॉर्क: डब्ल्यू॰डब्ल्यू॰ नॉर्टन, 1954.
मोमोनी, मार्क. कैसे करें मैप की मदद से, तीसरा वर्शन. शिकागो: यू ऑफ़ शिकागो पी, 2018.
जोन्स, बेन. डेटा में होने वाली समस्याओं से बचना. होबोकेन, न्यूजर्सी: वाइली, 2020.
व्हीलन, चार्ल्स. छिपे हुए आंकड़े: डेटा से डर को दूर करना. न्यूयॉर्क: डब्ल्यू॰डब्ल्यू॰ नॉर्टन, 2013