अब आपके पास यूनिकॉर्न के दिखने का अनुमान लगाने वाला मॉडल डिप्लॉय करने का विकल्प है! डिप्लॉय करते समय, आपकी मशीन लर्निंग (एमएल) पाइपलाइन बिना किसी समस्या के चलनी चाहिए, अपडेट होनी चाहिए, और काम करनी चाहिए. अगर मॉडल को डिप्लॉय करना, डिप्लॉय करें बटन को दबाने जितना आसान होता. माफ़ करें, मशीन लर्निंग के पूरे सिस्टम के लिए, इन चीज़ों की जांच ज़रूरी है:
- इनपुट डेटा की पुष्टि करना.
- फ़ीचर इंजीनियरिंग की पुष्टि करना.
- नए मॉडल के वर्शन की क्वालिटी की पुष्टि करना.
- वीडियो दिखाने वाले इंफ़्रास्ट्रक्चर की पुष्टि करना.
- पाइपलाइन कॉम्पोनेंट के बीच इंटिग्रेशन की जांच करना.
कई सॉफ़्टवेयर इंजीनियर, टेस्ट-ड्रिवन डेवलपमेंट (टीडीडी) का इस्तेमाल करते हैं. टीडीडी में, सॉफ़्टवेयर इंजीनियर "असल" सोर्स कोड लिखने से पहले टेस्ट लिखते हैं. हालांकि, मशीन लर्निंग में टीडीडी का इस्तेमाल करना मुश्किल हो सकता है. उदाहरण के लिए, अपने मॉडल को ट्रेनिंग देने से पहले, लॉस की पुष्टि करने के लिए कोई टेस्ट नहीं लिखा जा सकता. इसके बजाय, आपको मॉडल के डेवलपमेंट के दौरान, संभावित नुकसान का पता लगाना होगा. इसके बाद, संभावित नुकसान के हिसाब से नए मॉडल के वर्शन की जांच करनी होगी.
यूनिकॉर्न मॉडल के बारे में जानकारी
इस सेक्शन में यूनिकॉर्न मॉडल के बारे में बताया गया है. यहां आपके जानने योग्य तथ्य दिए गए हैं:
आपने मशीन लर्निंग का इस्तेमाल करके, कैटगरी तय करने वाला ऐसा मॉडल बनाया है जो यूनीकॉर्न के दिखने का अनुमान लगाता है. आपके डेटासेट में, यूनीकॉर्न के 10,000 दिखने और 10,000 न दिखने की जानकारी है. डेटासेट में जगह, दिन का समय, ऊंचाई, तापमान, नमी, पेड़ों की संख्या, इंद्रधनुष की मौजूदगी वगैरह की जानकारी शामिल होती है.
दोबारा इस्तेमाल की जा सकने वाली ट्रेनिंग की मदद से, मॉडल के अपडेट की जांच करना
हो सकता है कि आपको अपने यूनिकॉर्न मॉडल को बेहतर बनाना हो. उदाहरण के लिए, मान लें कि आपने किसी सुविधा पर कुछ अतिरिक्त फ़ीचर इंजीनियरिंग की है. इसके बाद, बेहतर (या कम से कम पहले जैसे) नतीजे पाने के लिए, मॉडल को फिर से ट्रेन किया है. माफ़ करें, कभी-कभी मॉडल को फिर से ट्रेनिंग देना मुश्किल होता है. प्रयोग को दोहराने की सुविधा को बेहतर बनाने के लिए, ये सुझाव अपनाएं:
रैंडम नंबर जनरेटर को तय सीमा के हिसाब से सेट करें. ज़्यादा जानकारी के लिए, डेटा जनरेट करने के लिए, रैंडमाइज़ेशन का इस्तेमाल करना देखें
मॉडल के कॉम्पोनेंट को तय क्रम में शुरू करें, ताकि यह पक्का किया जा सके कि हर बार चलाने पर, कॉम्पोनेंट को रैंडम नंबर जनरेटर से एक ही रैंडम नंबर मिले. आम तौर पर, एमएल लाइब्रेरी इस ज़रूरत को अपने-आप मैनेज कर लेती हैं.
मॉडल के कई रन का औसत निकालें.
शुरुआती आइटरेशन के लिए भी वर्शन कंट्रोल का इस्तेमाल करें, ताकि अपने मॉडल या पाइपलाइन की जांच करते समय, कोड और पैरामीटर को सही तरीके से पहचाना जा सके.
इन दिशा-निर्देशों का पालन करने के बाद भी, नॉन-डिटरमिनिज़्म के अन्य सोर्स अब भी मौजूद हो सकते हैं.
मशीन लर्निंग एपीआई को कॉल करने की जांच करना
एपीआई कॉल के अपडेट की जांच कैसे की जाती है? अपने मॉडल को फिर से ट्रेन किया जा सकता है, लेकिन इसमें काफ़ी समय लगता है. इसके बजाय, यूनिट टेस्ट लिखकर, रैंडम इनपुट डेटा जनरेट करें और ग्रेडिएंट डिसेंट का एक चरण चलाएं. अगर यह चरण बिना किसी गड़बड़ी के पूरा हो जाता है, तो हो सकता है कि एपीआई के अपडेट से आपके मॉडल पर कोई असर न पड़ा हो.
पाइपलाइन कॉम्पोनेंट के लिए इंटिग्रेशन टेस्ट लिखना
किसी एमएल पाइपलाइन में, एक कॉम्पोनेंट में बदलाव करने से दूसरे कॉम्पोनेंट में गड़बड़ियां हो सकती हैं. इंटिग्रेशन टेस्ट लिखकर देखें कि कॉम्पोनेंट एक साथ काम कर रहे हैं या नहीं. यह टेस्ट, पूरी पाइपलाइन को शुरू से आखिर तक चलाता है.
इंटिग्रेशन टेस्ट लगातार चलाने के अलावा, आपको नए मॉडल और नए सॉफ़्टवेयर वर्शन को पुश करते समय भी इंटिग्रेशन टेस्ट चलाने चाहिए. पूरी पाइपलाइन को चलाने में लगने वाले समय की वजह से, लगातार इंटिग्रेशन टेस्टिंग करना मुश्किल हो जाता है. इंटिग्रेशन की जांच तेज़ी से करने के लिए, डेटा के सबसेट या किसी आसान मॉडल पर ट्रेनिंग दें. जानकारी, आपके मॉडल और डेटा पर निर्भर करती है. लगातार कवरेज पाने के लिए, आपको तेज़ी से चलने वाले टेस्ट में बदलाव करना होगा, ताकि वे मॉडल या सॉफ़्टवेयर के हर नए वर्शन के साथ चल सकें. इस दौरान, धीमे टेस्ट बैकग्राउंड में लगातार चलते रहेंगे.
दिखाने से पहले मॉडल की क्वालिटी की पुष्टि करना
मॉडल के नए वर्शन को प्रोडक्शन में डालने से पहले, क्वालिटी में इन दो तरह की गिरावटों का पता लगाएं:
अचानक परफ़ॉर्मेंस में गिरावट. नए वर्शन में किसी गड़बड़ी की वजह से, वीडियो की क्वालिटी काफ़ी कम हो सकती है. पिछले वर्शन के मुकाबले नए वर्शन की क्वालिटी की जांच करके, उनकी पुष्टि करें.
धीरे-धीरे परफ़ॉर्मेंस में गिरावट आना. अचानक क्वालिटी में गिरावट का पता लगाने वाले आपके टेस्ट से, एक से ज़्यादा वर्शन में मॉडल की क्वालिटी में धीरे-धीरे होने वाली गिरावट का पता नहीं चल सकता. इसके बजाय, पक्का करें कि पुष्टि करने वाले डेटासेट पर आपके मॉडल के अनुमान, तय थ्रेशोल्ड को पूरा करते हों. अगर पुष्टि करने के लिए इस्तेमाल किया गया डेटासेट, लाइव डेटा से अलग है, तो पुष्टि करने के लिए इस्तेमाल किया गया डेटासेट अपडेट करें. साथ ही, पक्का करें कि आपका मॉडल अब भी क्वालिटी थ्रेशोल्ड को पूरा करता हो.
मॉडल और इन्फ़्रास्ट्रक्चर के साथ काम करने की पुष्टि करना
अगर आपका मॉडल, आपके सर्वर से ज़्यादा तेज़ी से अपडेट होता है, तो हो सकता है कि आपके मॉडल में, आपके सर्वर से अलग सॉफ़्टवेयर डिपेंडेंसी हों. इस वजह से, मॉडल के काम न करने की समस्या हो सकती है. मॉडल को सर्वर के सैंडबॉक्स वाले वर्शन में स्टैज करके, पक्का करें कि मॉडल में इस्तेमाल किए गए ऑपरेशन, सर्वर में मौजूद हों.