प्रोडक्शन एमएल सिस्टम: डिप्लॉयमेंट टेस्टिंग

अब यूनिकॉर्न वाला मॉडल इस्तेमाल करने के लिए तैयार हैं. इससे यूनिकॉर्न के दिखने का अनुमान मिलता है! डिप्लॉय करते समय, आपकी मशीन लर्निंग (एमएल) पाइपलाइन चालू होनी चाहिए, अपडेट होती है, और बिना किसी समस्या के काम करते हैं. अगर किसी मॉडल को डिप्लॉय करना, उतना ही आसान होता जितना कि एक बड़ा Deploy बटन. हमें अफ़सोस है कि एक पूरे मशीन लर्निंग सिस्टम में इसके लिए टेस्ट ज़रूरी हैं:

  • इनपुट डेटा की पुष्टि की जा रही है.
  • फ़ीचर इंजीनियरिंग की पुष्टि करना.
  • नए मॉडल के वर्शन की क्वालिटी की पुष्टि करना.
  • सर्विंग इन्फ़्रास्ट्रक्चर की पुष्टि की जा रही है.
  • पाइपलाइन के कॉम्पोनेंट के बीच इंटिग्रेशन की जांच की जा रही है.

कई सॉफ़्टवेयर इंजीनियर, टेस्ट-ड्रिवन डेवलपमेंट (टीडीडी) को पसंद करते हैं. TDD में, सॉफ़्टवेयर इंजीनियर "असल" लिखने से पहले ही टेस्ट लिखते हैं सोर्स कोड. हालांकि, मशीन लर्निंग में TDD मुश्किल हो सकता है. उदाहरण के लिए, अपने मॉडल को ट्रेनिंग देने से पहले, ऐसा कोई टेस्ट नहीं लिखा जा सकता जिससे उसकी नुकसान. इसके बजाय, आपको पहले मॉडल के दौरान होने वाले नुकसान के बारे में जानना होगा डेवलपमेंट और फिर संभावित नुकसान के लिए नए मॉडल वर्शन का परीक्षण करें.

यूनिकॉर्न मॉडल के बारे में जानकारी

इस सेक्शन में यूनिकॉर्न मॉडल के बारे में बताया गया है. यहां आपके जानने योग्य तथ्य दिए गए हैं:

मशीन लर्निंग का इस्तेमाल करके, डेटा की कैटगरी तय करने वाला ऐसा मॉडल बनाया जा रहा है जो अनुमान लगाता है यूनिकॉर्न की तरह दिखता है. आपके डेटासेट में यूनिकॉर्न के 10,000 बार दिखने और 10,000 यूनिकॉर्न नहीं दिख रहे हैं. डेटासेट में जगह की जानकारी होती है, दिन का समय, ऊंचाई, तापमान, नमी, पेड़ों से ढकी जगह, किसी की मौजूदगी इंद्रधनुष देखें.

फिर से जनरेट की जा सकने वाली ट्रेनिंग के साथ मॉडल अपडेट की जांच करें

शायद आप यूनिकॉर्न मॉडल को बेहतर बनाना जारी रखना चाहें. उदाहरण के लिए, किसी खास फ़ीचर पर कुछ अतिरिक्त फ़ीचर इंजीनियरिंग किया जाता है और फिर बेहतर (या कम से कम वही) नतीजे पाने की उम्मीद में, मॉडल को फिर से ट्रेनिंग दें. माफ़ करें, कभी-कभी मॉडल ट्रेनिंग दोबारा करना मुश्किल हो जाता है. दोबारा बनाए जाने की क्षमता को बेहतर बनाने के लिए, इन सुझावों को अपनाएं:

  • निश्चित तौर पर, रैंडम नंबर जनरेटर सीड करें. ज़्यादा जानकारी के लिए, डेटा में किसी भी क्रम में लगाना देखें जनरेशन

  • मॉडल कॉम्पोनेंट को तय क्रम में शुरू करें, ताकि यह पक्का किया जा सके कि कॉम्पोनेंट को हर बार रन करने पर रैंडम नंबर जनरेटर से एक ही रैंडम नंबर. एमएल लाइब्रेरी आम तौर पर इस ज़रूरत को अपने-आप पूरा कर लेती हैं.

  • मॉडल के कई रनों का औसत निकालें.

  • शुरुआती दौरों के लिए भी वर्शन कंट्रोल का इस्तेमाल करें, ताकि अपने मॉडल या पाइपलाइन की जांच करते समय, पिनपॉइंट कोड और पैरामीटर का पता लगाएं.

इन दिशा-निर्देशों का पालन करने के बाद भी, हो सकता है कि नतीजे तय न करने वाले अन्य सोर्स अब भी मौजूद है.

मशीन लर्निंग एपीआई को कॉल टेस्ट करें

एपीआई कॉल के अपडेट को टेस्ट कैसे किया जाता है? आप अपने मॉडल को फिर से ट्रेनिंग दे सकते हैं, लेकिन तो बहुत ज़्यादा समय लगता है. इसके बजाय, रैंडम इनपुट डेटा जनरेट करने के लिए यूनिट टेस्ट लिखें और ग्रेडिएंट ढलान का एक चरण पूरा करें. अगर यह चरण इनके बिना पूरा होता है तो एपीआई में किसी भी अपडेट से शायद आपका मॉडल खराब न हुआ हो.

पाइपलाइन के कॉम्पोनेंट के लिए इंटिग्रेशन टेस्ट लिखना

एमएल पाइपलाइन में, एक कॉम्पोनेंट में बदलाव करने से, दूसरे कॉम्पोनेंट में गड़बड़ियां हो सकती हैं कॉम्पोनेंट. यह जांचना कि कॉम्पोनेंट एक साथ काम कर रहे हैं या नहीं. इसके लिए, इंटिग्रेशन टेस्ट जो पूरी पाइपलाइन को शुरू से आखिर तक चलाता है.

इंटिग्रेशन की लगातार जांच करने के अलावा, आपको इंटिग्रेशन की जांच भी करनी चाहिए Android के नए मॉडल और सॉफ़्टवेयर के नए वर्शन को दमदार बनाने की कोशिश कर रहे हैं. दौड़ने की धीमी रफ़्तार की वजह से इंटिग्रेट करने की प्रोसेस को लगातार टेस्ट करना मुश्किल हो जाता है. इंटिग्रेशन चलाने के लिए ज़्यादा तेज़ी से टेस्ट कर सकता है, डेटा के सबसेट पर या किसी आसान मॉडल का इस्तेमाल करके ट्रेनिंग दे सकता है. जानकारी आपके मॉडल और डेटा पर निर्भर करता है. लगातार कवरेज पाने के लिए, आप तेज़ी से परीक्षण कर सकता है, ताकि वे मॉडल या सॉफ़्टवेयर के हर नए वर्शन के साथ चल सकें. इस दौरान, धीमे टेस्ट बैकग्राउंड में लगातार चलते रहेंगे.

सेवा देने से पहले, मॉडल की क्वालिटी की पुष्टि करें

किसी नए मॉडल वर्शन को प्रोडक्शन में भेजने से पहले, क्वालिटी में गिरावट आने के ये दो तरीके हैं:

  • अचानक गिरावट. नए वर्शन में किसी गड़बड़ी की वजह से काफ़ी समस्याएं आ सकती हैं कम क्वालिटी. नए वर्शन की क्वालिटी की जांच करके उनकी पुष्टि करें को पिछले वर्शन में ले जाया गया है.

  • धीमी गिरावट. अचानक गिरावट का पता लगाने के लिए किए गए आपके टेस्ट में, रफ़्तार की धीमी दर का पता नहीं लगाया जा सकता में गिरावट दिख सकती है. इसके बजाय, देख लें कि पुष्टि करने वाले डेटासेट पर मॉडल के अनुमान, तय थ्रेशोल्ड को पूरा करते हैं. अगर आपके पुष्टि करने वाला डेटासेट, लाइव डेटा से अलग होता है. इसके बाद, पुष्टि करने वाला डेटासेट अपडेट करें डेटासेट की जांच करें और पक्का करें कि आपका मॉडल अब भी क्वालिटी के लिए उसी थ्रेशोल्ड को पूरा करता हो.

सेवा देने से पहले, पुष्टि करें कि मॉडल-इन्फ़्रास्ट्रक्चर कैसे काम करता है

अगर आपके मॉडल को आपके सर्वर से ज़्यादा तेज़ी से अपडेट किया जाता है, तो आपके मॉडल में अलग-अलग सॉफ़्टवेयर डिपेंडेंसी आपके सर्वर से आ सकती हैं. साथ काम नहीं कर रहा है. पक्का करें कि मॉडल में इस्तेमाल की गई कार्रवाइयां इनमें मौजूद हों सर्वर के सैंडबॉक्स वर्शन में मॉडल को स्टेजिंग करके सर्वर बनाते हैं.