वीडियो प्रोडक्शन

अगर आपको एमएल पाइपलाइन को प्रोडक्शन के लिए तैयार करना है, तो आपको ये काम करने होंगे:

  • अपनी पाइपलाइन के लिए कंप्यूट रिसॉर्स का प्रावधान करें
  • जानकारी लॉग करने, मॉनिटर करने, और चेतावनी देने की सुविधा लागू करें

कंप्यूट रिसॉर्स का प्रावधान किया जा रहा है

एमएल पाइपलाइन चलाने के लिए, रैम, सीपीयू, और जीपीयू/TPU जैसे कंप्यूट रिसॉर्स की ज़रूरत होती है. सही कंप्यूट के बिना, पाइपलाइन नहीं चलाई जा सकतीं. इसलिए, यह पक्का करें कि ताकि आपकी पाइपलाइन में ज़रूरी संसाधनों के प्रावधान के लिए काफ़ी कोटा हो प्रोडक्शन में ही चलना चाहिए.

  • विज्ञापन दिखाने, ट्रेनिंग देने, और पुष्टि करने वाले पाइपलाइन. इन पाइपलाइन के लिए ज़रूरी है TPU, जीपीयू या सीपीयू. आपके इस्तेमाल के उदाहरण के आधार पर, आपको ट्रेनिंग देनी होगी और अपनी या एक ही हार्डवेयर का इस्तेमाल करें. उदाहरण के लिए, ट्रेनिंग में सीपीयू पर होते हैं, लेकिन सेवा देने के लिए TPU का इस्तेमाल किया जा सकता है या TPU का इस्तेमाल भी किया जा सकता है. सामान्य तौर पर, यह है आम तौर पर, बड़े हार्डवेयर की मदद से ट्रेनिंग दी जाती है और फिर छोटे हार्डवेयर पर काम किया जाता है.

    हार्डवेयर चुनते समय, इन बातों का ध्यान रखें:

    • क्या आप सस्ते हार्डवेयर की मदद से ट्रेनिंग कर सकते हैं?
    • क्या किसी दूसरे हार्डवेयर का इस्तेमाल करने से परफ़ॉर्मेंस को बेहतर बनाया जा सकता है?
    • यह मॉडल कैसा है और इसकी परफ़ॉर्मेंस को कौनसा हार्डवेयर ऑप्टिमाइज़ करेगा?
    • आपके मॉडल की बनावट के हिसाब से कौनसा हार्डवेयर सबसे सही रहेगा?
  • डेटा पाइपलाइन. डेटा पाइपलाइन को रैम और सीपीयू के लिए कोटा चाहिए आपको यह अनुमान लगाना होगा कि ट्रेनिंग और टेस्ट डेटासेट जनरेट करने के लिए, आपकी पाइपलाइन को कितना कोटा चाहिए.

ऐसा हो सकता है कि आप हर पाइपलाइन के लिए कोटा तय न कर पाएं. इसके बजाय, आप यह कर सकते हैं वह कोटा तय करें जो पाइपलाइन शेयर करते हैं. ऐसे मामलों में, आपके पास सभी पाइपलाइन चलाने, मॉनिटर करने और किसी एक पाइपलाइन को पूरा कोटा खर्च करने से रोकने के लिए, उसमें बदलाव करना.

कोटा का अनुमान लगाया जा रहा है

डेटा और ट्रेनिंग पाइपलाइन के लिए ज़रूरी कोटा का अनुमान लगाने के लिए, अनुमान के आधार पर तैयार किए जा सकते हैं. विज्ञापन दिखाने के कोटा का अनुमान लगाने के लिए, ये तरीके आज़माएं सेवा की क्वेरी प्रति सेकंड का अनुमान लगाएं. इन तरीकों से एक बेसलाइन तय होता है. जैसे प्रयोग के दौरान, किसी समाधान का प्रोटोटाइप बनाना शुरू करते हैं, तो ताकि कोटा का ज़्यादा सटीक अनुमान लगाया जा सके.

कोटा का अनुमान लगाते समय, कोटा का भी ध्यान रखें. ऐसा सिर्फ़ प्रोडक्शन ट्रैक के साथ नहीं किया जा सकता बल्कि मौजूदा प्रयोगों के लिए भी इस्तेमाल किए जा सकते हैं.

अपनी समझ को परखें

सुझाव दिखाने के लिए हार्डवेयर चुनते समय, आपको हमेशा ज़्यादा ताकतवर हार्डवेयर है.
गलत
सही. आम तौर पर, ट्रेनिंग के लिए सेवा के मुकाबले ज़्यादा बड़े हार्डवेयर की ज़रूरत होती है.
सही

लॉगिंग, निगरानी, और सूचना

प्रोडक्शन मॉडल के काम करने के तरीके को लॉग करना और उसे मॉनिटर करना बहुत ज़रूरी होता है. Robust मॉनिटरिंग इन्फ़्रास्ट्रक्चर से इस बात की पुष्टि होती है कि आपके मॉडल भरोसेमंद तरीके से काम कर रहे हैं, मदद मिलती है.

जानकारी इकट्ठा करने और निगरानी करने के अच्छे तरीके, मशीन लर्निंग का इस्तेमाल करने में आने वाली समस्याओं का पता लगाने में मदद करते हैं पाइपलाइन बनाने और कारोबार पर पड़ने वाले संभावित असर को कम करने के लिए किया जा सकता है. समस्याएं आने पर, सूचनाएं पाने की सुविधा को सूचित कर सकता है, और व्यापक लॉग से समस्या का पता लगाना आसान हो जाता है की मुख्य वजह.

आपको इन समस्याओं का पता लगाने के लिए, डेटा इकट्ठा करने की प्रोसेस और मॉनिटरिंग की सुविधा लागू करनी चाहिए एमएल पाइपलाइन के साथ:

पाइपलाइन निगरानी
सेवा में है
  • ट्रेनिंग डेटा के मुकाबले पेश किए गए डेटा में स्क्वी या ड्रिफ़्ट होना
  • अनुमानों में स्क्वी या ड्रिफ़्ट होना
  • डेटा टाइप से जुड़ी समस्याएं, जैसे कि वैल्यू मौजूद नहीं हैं या खराब हैं
  • इस्तेमाल किया गया कोटा
  • मॉडल की क्वालिटी मेट्रिक
Data
  • सुविधा की वैल्यू में स्क्वी और ड्रिफ़्ट
  • लेबल की वैल्यू में स्क्वी और ड्रिफ़्ट होना
  • डेटा टाइप से जुड़ी समस्याएं, जैसे कि वैल्यू मौजूद नहीं हैं या खराब हैं
  • कोटा के इस्तेमाल की दर
  • कोटे की तय सीमा पूरी होने वाली है
ट्रेनिंग
  • ट्रेनिंग में बीता समय
  • ट्रेनिंग में पूरे नहीं हुए नतीजे
  • इस्तेमाल किया गया कोटा
पुष्टि
  • टेस्ट डेटासेट में तिरछा या ड्रिफ़्ट करना

आपको इन बातों के लिए जानकारी देनी चाहिए और जानकारी भी देनी होगी:

  • इंतज़ार का समय. सुझाव देने में कितना समय लगता है?
  • गड़बड़ी. क्या मॉडल ने सुझाव देना बंद कर दिया है?

अपनी समझ को परखें

डेटा को लॉग करने और उसे मॉनिटर करने की मुख्य वजह इनमें से कौनसी है आपकी एमएल पाइपलाइन?
उपयोगकर्ताओं पर असर डालने से पहले ही समस्याओं का पता लगाएं
कोटा और संसाधन के इस्तेमाल को ट्रैक करना
संभावित सुरक्षा समस्याओं की पहचान करना
ऊपर दिए गए सभी जवाब
सही. मशीन लर्निंग पाइपलाइन को लॉग करने और उनकी निगरानी करने से, हमें समस्याओं का गंभीर ना होने से पहले ही उनका विश्लेषण कर लें.

मॉडल को डिप्लॉय करना

मॉडल डिप्लॉयमेंट के लिए, आपको इन चीज़ों का दस्तावेज़ बनाना होगा:

  • डिप्लॉयमेंट शुरू करने और रोल आउट बढ़ाने के लिए अनुमतियां ज़रूरी हैं.
  • किसी मॉडल को प्रोडक्शन में कैसे शामिल किया जाए.
  • मॉडल कहां डिप्लॉय किया जाता है. उदाहरण के लिए, अगर स्टेजिंग या कैनरी हो का इस्तेमाल करें.
  • डिप्लॉयमेंट पूरा न होने पर क्या करें.
  • प्रोडक्शन में पहले से मौजूद मॉडल को रोलबैक करने का तरीका.

मॉडल ट्रेनिंग को ऑटोमेट करने के बाद, आपको की पुष्टि और डिप्लॉयमेंट. अपने-आप डिप्लॉयमेंट की सुविधा इससे डिप्लॉयमेंट में रुकावट आने की संभावना कम हो जाती है. साथ ही, एक व्यक्ति. यह संभावित गलतियों को भी कम करता है, क्षमता बढ़ाता है, और भरोसेमंद है. साथ ही, यह ऑन-कॉल रोटेशन और एसआरई सपोर्ट को चालू करता है.

आम तौर पर, उपयोगकर्ताओं के किसी सबसेट के लिए नए मॉडल डिप्लॉय किए जाते हैं, ताकि यह पता लगाया जा सके कि मॉडल उम्मीद के मुताबिक काम करना. अगर ऐसा है, तो डिप्लॉयमेंट जारी रखें. अगर ऐसा नहीं है, आप डिप्लॉयमेंट को रोल बैक करते हैं और समस्याओं की पहचान और उन्हें डीबग करना शुरू करते हैं.