इस लेसन में उन सवालों पर फ़ोकस किया गया है जो आपको अपने डेटा के बारे में पूछने चाहिए
और मॉडल के बारे में बात करते हैं.
क्या हर सुविधा मददगार है?
योगदान देने वाली सुविधाओं को हटाने के लिए, आपको अपने मॉडल को लगातार मॉनिटर करना चाहिए
मॉडल की अनुमान लगाने की क्षमता में बहुत कम या कुछ भी नहीं होता है. अगर
जिसमें सुविधा अचानक बदल जाती है, तो आपके मॉडल का व्यवहार भी
अनचाहे तरीकों से बदल सकता है.
साथ ही, यहां दिए गए मिलते-जुलते सवालों पर विचार करें:
- क्या इस सुविधा की उपयोगिता, इसे शामिल करने में आने वाली कीमत को सही ठहराती है?
मॉडल में ज़्यादा सुविधाएं जोड़ना हमेशा दिलचस्प होता है. उदाहरण के लिए,
मान लीजिए कि आपको कोई नई सुविधा मिलती है, जिसके जोड़ से आपके मॉडल के अनुमान
थोड़ा बेहतर. थोड़े बेहतर अनुमान निश्चित तौर पर इससे बेहतर लगते हैं
थोड़ा खराब अनुमान; हालांकि, अतिरिक्त सुविधा के ऐड-ऑन का इस्तेमाल करके
रखरखाव का बोझ ज़्यादा है.
क्या आपका डेटा सोर्स भरोसेमंद है?
आपके इनपुट डेटा की विश्वसनीयता के बारे में पूछे जाने वाले कुछ सवाल:
- क्या सिग्नल हमेशा उपलब्ध रहेगा या यह किसी
भरोसेमंद सोर्स नहीं है? जैसे:
- क्या सिग्नल ऐसे सर्वर से आ रहा है जो बहुत ज़्यादा लोड होने पर क्रैश हो जाता है?
- क्या यह सिग्नल इंसानों से मिल रहा है, जो हर अगस्त में छुट्टी पर जाते हैं?
- क्या आपके मॉडल के इनपुट डेटा को कंप्यूट करने वाला सिस्टम कभी बदला है? अगर ऐसा है, तो:
- कितनी बार?
- आपको कैसे पता चलेगा कि सिस्टम में बदलाव होगा?
इससे आपको मिलने वाले डेटा की अपनी कॉपी बनाने के बारे में सोचें
अपस्ट्रीम प्रोसेस. इसके बाद, अपस्ट्रीम के सिर्फ़ अगले वर्शन पर जाएं
डेटा तब ही इकट्ठा किया जाता है, जब आप पक्का हों कि ऐसा करना सुरक्षित है.
क्या आपका मॉडल, फ़ीडबैक लूप का हिस्सा है?
कभी-कभी कोई मॉडल अपने ही ट्रेनिंग डेटा पर असर डाल सकता है. उदाहरण के लिए,
कुछ मॉडल से मिले नतीजे, जो सीधे तौर पर या किसी अन्य तरीके से इनपुट बन जाते हैं
उस मॉडल की कुछ सुविधाओं का इस्तेमाल करें.
कभी-कभी एक मॉडल किसी अन्य मॉडल को प्रभावित कर सकता है. उदाहरण के लिए, दो विकल्पों पर
स्टॉक की कीमतों का अनुमान लगाने के लिए मॉडल:
- मॉडल A, जो अनुमान लगाने वाला एक खराब मॉडल है.
- मॉडल B.
मॉडल A छोटी है, इसलिए यह गलती से स्टॉक X का स्टॉक खरीदने का फ़ैसला ले लेती है.
इन खरीदारियों से स्टॉक X की कीमत बढ़ जाती है. मॉडल B कीमत का इस्तेमाल करता है
का इस्तेमाल, एक इनपुट सुविधा के रूप में किया है. इसलिए, मॉडल B नतीजे के तौर पर
स्टॉक X के मूल्य के बारे में निष्कर्ष. इसलिए, मॉडल B यह कर सकता है,
मॉडल A के बग्गी के व्यवहार के आधार पर स्टॉक X के शेयर खरीदे या बेचे जाएंगे.
इसके बदले में, मॉडल B का व्यवहार मॉडल A को प्रभावित कर सकता है,
ट्यूलिप की दीवानगी या स्लाइड
कंपनी X का स्टॉक.
व्यायाम: अपनी समझ की जांच करें
इनमें से तीन मॉडल पर किन चीज़ों पर असर पड़ सकता है
फ़ीडबैक लूप?
ट्रैफ़िक का पूर्वानुमान लगाने वाला मॉडल, जो हाइवे के एग्ज़िट पर भीड़ का अनुमान लगाता है
जिसमें समुद्र तट के पास मौजूद भीड़ की जानकारी भी शामिल है.
बीच पर घूमने जाने वाले कुछ लोग, ट्रैफ़िक के हिसाब से अपना प्लान बना सकते हैं
अनुमान. अगर समुद्र तट पर भीड़ है और ट्रैफ़िक बढ़ने का अनुमान है
तो बहुत से लोग वैकल्पिक प्लान बना सकते हैं. यह समुद्र तट को हटा सकता है
इसके बाद, ट्रैफ़िक का अनुमान कम हो जाएगा.
अटेंडेंस बढ़ाने और साइकल को दोहराने के लिए किया जाता है.
किताब का सुझाव देने वाला मॉडल जो ऐसे नॉवेल का सुझाव देता है जो इसके उपयोगकर्ताओं को पसंद आ सकते हैं
उसकी लोकप्रियता के आधार पर (यानी, कितनी बार किताबें पढ़ी गईं
खरीदा गया है).
किताबों के सुझाव देने वाले सिस्टम से खरीदारी करने की संभावना बढ़ जाती है. साथ ही, इन
अतिरिक्त बिक्री को इनपुट के तौर पर मॉडल में वापस दिया जाएगा.
जिससे इन लेखों में इन्हीं किताबों के सुझाव मिलने की संभावना बढ़ जाती है
आने वाले समय में इस्तेमाल करें.
यूनिवर्सिटी रैंकिंग वाला एक मॉडल, जो स्कूलों को अलग-अलग छात्र-छात्राओं के लिए
चयनात्मकता—उन छात्र-छात्राओं का प्रतिशत जिन्होंने आवेदन किया
स्वीकार किया गया.
मॉडल की रैंकिंग, टॉप रेटिंग वाले मॉडल में और ज़्यादा उपयोगकर्ताओं की दिलचस्पी बढ़ा सकती है
और स्कूलों को मिलने वाले आवेदनों की संख्या में बढ़ोतरी हो रही है. अगर ये
स्कूल उतने ही छात्र-छात्राओं को पहले की तरह ही स्वीकार करना जारी रखेंगे, जबकि चयन के अधिकार
बढ़ोतरी (दर्ज किए गए छात्र-छात्राओं का प्रतिशत कम हो जाएगा). यह
इन स्कूलों को बढ़ावा देगा की रैंकिंग करेगा, जिसकी वजह से
छात्र-छात्राओं की दिलचस्पी वगैरह...
चुनाव के नतीजों का मॉडल, जो चुनाव के नतीजे का अनुमान लगाता है
2% मतदाताओं का सर्वे पूरा करके महापौर पद के लिए.
अगर मॉडल, पोल जनरेट होने तक अपना अनुमान पब्लिश नहीं करता है
बंद कर दिया है, तो इसकी भविष्यवाणी का मतदाता को प्रभावित करना संभव नहीं है
व्यवहार.
मकान की कीमतों का अनुमान लगाने वाला मॉडल, जिसका इस्तेमाल करके घर की कीमतों का अनुमान लगाया जाता है
साइज़ (वर्ग मीटर में इलाका), बेडरूम की संख्या, और भौगोलिक जगह
सुविधाओं के रूप में.
किसी घर की लोकेशन को तुरंत नहीं बदला जा सकता,
साइज़ या बेडरूम की संख्या के बारे में बताने के लिए,
जिससे फ़ीडबैक लूप बनने की संभावना कम हो जाती है. हालांकि, संभावित रूप से
बेडरूम (बड़े घर) के साइज़ और संख्या के बीच का संबंध
में और कमरे हो सकते हैं) जिन्हें अलग करना पड़ सकता है.
चेहरे की विशेषताओं के मॉडल से पता चलता है कि कोई व्यक्ति मुस्कुरा रहा है
एक फ़ोटो में, जिसे स्टॉक फ़ोटोग्राफ़ी के डेटाबेस में नियमित रूप से ट्रेनिंग दी गई है
यह डेटा हर महीने अपने-आप अपडेट होता है.
यहां कोई फ़ीडबैक लूप नहीं है, क्योंकि मॉडल के अनुमान उपलब्ध नहीं हैं
फ़ोटो डेटाबेस पर पड़ने वाले किसी असर को खत्म कर सकता है. हालांकि, इनपुट का वर्शन
चिंता का विषय है, क्योंकि हर महीने होने वाले ये अपडेट
का मॉडल पर अचानक असर पड़ता है.