अपनी समझ की जांच करें: प्रोडक्शन के लिए मशीन लर्निंग का इस्तेमाल

पाइपलाइन टेस्टिंग से जुड़े दिशा-निर्देशों को Colab में नहीं दिखाया जा सकता. इसके बजाय, नीचे दिए गए तरीकों की मदद से इन दिशा-निर्देशों का पालन किया जा सकता है. अगले पेज पर, दिशा-निर्देशों को लागू करने से जुड़े संसाधनों के बारे में बताया गया है.

नीचे दिए गए सवालों के लिए, अपने जवाब पर क्लिक करके उसे बड़ा करें.

अपने यूनिकॉर्न के दिखने का अनुमान लगाने वाले डिवाइस को लॉन्च करने के बाद, आपको नए डेटा पर फिर से ट्रेनिंग देकर, अपने अनुमान को नया बनाए रखना होगा. आप ट्रेनिंग के लिए काफ़ी नया डेटा इकट्ठा कर रहे हैं. इसलिए, आप नए डेटा के सैंपल को एक तय समयावधि के लिए सैंपल करके तय करते हैं. आपको यूनिकॉर्न के तौर पर, हर दिन और साल भर के पैटर्न को भी ध्यान में रखना होगा. साथ ही, हर तीन महीने में तेज़ी से नए मॉडल वर्शन लॉन्च किए जा सकते हैं. आप कितने बजे की विंडो चुनना चाहते हैं?
एक दिन, क्योंकि बड़ी विंडो होने पर बहुत ज़्यादा डेटा लगेगा और मॉडल को ट्रेनिंग लेने में ज़्यादा समय लगेगा.
गलत. डेटासेट का साइज़ सीमित करने के लिए, डेटा के सैंपल की दर में बदलाव किया जा सकता है. दिए गए मॉडल को हर तीन महीने में सिर्फ़ अपडेट किया जा सकता है. इसलिए, एक दिन के लिए तैयार किया गया डेटा धीरे-धीरे पुराना हो जाता है.
एक हफ़्ते का समय, ताकि आपका डेटासेट बहुत बड़ा न हो, लेकिन आप अब भी पैटर्न ठीक कर सकें.
गलत. डेटासेट का साइज़ सीमित करने के लिए, डेटा के सैंपल की दर में बदलाव किया जा सकता है. दिए गए मॉडल को हर तीन महीने में सिर्फ़ अपडेट किया जा सकता है. इसलिए, एक हफ़्ते तक चलने वाले डेटा की ट्रेनिंग वाला मॉडल धीरे-धीरे पुराना हो जाएगा.
एक साल, यह पक्का करने के लिए कि आपके मॉडल में डेली या सालाना पैटर्न का कोई असर न हो.
सही! आपको एक प्रतिनिधि डेटासेट चुनना होगा, ताकि आपका मॉडल सभी स्थितियों में अनुमान लगा सके.
आप यूनिकॉर्न के दिखने का सुझाव देते हैं. यह ठीक से काम कर रहा है! आप तीन हफ़्ते बाद वापस लौटते हैं और देखते हैं कि आपके मॉडल की क्वालिटी में काफ़ी गिरावट आई है. मान लें कि तीन हफ़्तों में यूनिकॉर्न के व्यवहार में बहुत ज़्यादा बदलाव होने की संभावना नहीं है. क्वालिटी में कमी की वजह क्या है?
ट्रेनिंग के लिए स्क्यू.
सही. हो सकता है कि यूनिकॉर्न के काम करने के तरीके में कोई बदलाव न हुआ हो, लेकिन हो सकता है कि ट्रेनिंग के डेटा को इकट्ठा करने के बाद, सर्विंग के डेटा में डेटा रिपोर्टिंग या डेटा के फ़ॉर्मैट में कोई बदलाव हुआ हो. ट्रेनिंग डेटा के डेटा स्कीमा का इस्तेमाल करके दिखाए जाने वाले डेटा की जांच करके, ट्रेनिंग में लगने वाली संभावित क्षमता का पता लगाएं.
आप किसी तय सीमा के हिसाब से मॉडल की क्वालिटी की जांच करना भूल गए हैं.
गलत. मॉडल की क्वालिटी की जांच करने से क्वालिटी में कमी आएगी, लेकिन यह नहीं पता चलेगा कि यह कमी क्यों हुई.
आपका मॉडल पुराना है.
यह मानते हुए कि आपके ट्रेनिंग डेटा में, यूनिकॉर्न के काम करने के सभी तरीकों को शामिल किया गया है, जैसा कि पिछले सवाल में बताया गया था.
आप जान-बूझकर अंटार्कटिका के लिए अनुमान पर नज़र रखते हैं, क्योंकि आपके पास वहां ट्रेनिंग के लिए काफ़ी डेटा नहीं है. आपके सुझाव की क्वालिटी में अचानक कुछ दिनों के लिए गिरावट आती है, खास तौर पर सर्दी के दिनों में. इसकी क्या वजह हो सकती है?
पर्यावरण से जुड़ी चीज़ें.
सही. आपको पता चलता है कि अंटार्कटिक में तूफ़ान आपकी अनुमान की क्वालिटी में कमी को लाता है. इन तूफ़ानों के दौरान, यूनिकॉर्न के व्यवहार में बदलाव होता है. इसके अलावा, अंटार्कटिक में तूफ़ान के दौरान डेटा इकट्ठा करना नामुमकिन है. इसका मतलब है कि आपका मॉडल ऐसी स्थितियों के लिए ट्रेनिंग नहीं दे सकता.
आपका मॉडल पुराना हो जाए.
गलत. अगर यह वजह सही थी, तो सिर्फ़ कुछ दिनों के लिए क्वालिटी बदलने की बजाय, आपके मॉडल की क्वालिटी पुरानी होने की वजह से क्वालिटी में लगातार गिरावट आती रहेगी.
किसी वजह की ज़रूरत नहीं है. ML मॉडल में कुछ भी नहीं हो सकता.
गलत. अगर मॉडल की क्वालिटी में उतार-चढ़ाव होता है, तो आपको इसकी वजह की जांच करनी चाहिए. फिर से काम करने की क्षमता बढ़ाने के लिए, अपने मॉडल ट्रेनिंग में कोई भी बदलाव करने से बचें.
आपके यूनिकॉर्न के दिखने का अनुमान लगाने की सुविधा एक साल से चल रही है. आपने कई समस्याओं को हल कर लिया है और अब इनकी क्वालिटी अच्छी है. हालांकि, आपको एक छोटी, लेकिन स्थायी समस्या दिखती है. आपके मॉडल की क्वालिटी, शहरी इलाकों में थोड़ी कम हो गई है. इसकी क्या वजह हो सकती है?
आपके सुझावों की अच्छी क्वालिटी से उपयोगकर्ताओं को यूनिकॉर्न आसानी से मिल जाएंगे. इससे यूनिकॉर्न के दिखने के तरीके पर असर पड़ता है.
सही. यूनिकॉर्न ने शहरी इलाकों में अपने व्यवहार में बदलाव करके लोगों का ध्यान खींचा. जैसे-जैसे आपके मॉडल के अनुमान, बदलते व्यवहार के हिसाब से बदलते हैं, यूनिकॉर्न अपने व्यवहार को बदलना जारी रखते हैं. ऐसी स्थिति में, जहां आपके मॉडल का व्यवहार, ट्रेनिंग डेटा पर ही असर डालता है उसे फ़ीडबैक लूप कहा जाता है. आपको यूनिकॉर्न के काम करने के तरीके में हुए बदलावों से जुड़े सर्विंग डेटा में होने वाले बदलावों का पता लगाने के लिए, अपनी ट्रेनिंग में दिखने वाली स्क्यू डिटेक्शन में बदलाव करना चाहिए.
बहुत ज़्यादा आबादी वाले इलाकों में यूनिकॉर्न के दिखने की रिपोर्ट कई बार की जाती है. इससे आपके ट्रेनिंग डेटा पर असर पड़ता है.
गलत. इस वजह से, ऐप्लिकेशन की क्वालिटी खराब होने की वजह से, यह क्वालिटी लॉन्च नहीं हो पाएगी.
शहरी क्षेत्रों का मॉडल बनाना कठिन है.
गलत. अगर मॉडल को शहरी इलाकों में अनुमान लगाने में परेशानी आ रही थी, तो लॉन्च के बाद इसकी क्वालिटी कम होने लगेगी. इसके बाद, शुरुआत से ही क्वालिटी खराब होने लगेगी.