आम तौर पर, मॉडल को दो तरीकों से ट्रेन किया जा सकता है:
स्टैटिक ट्रेनिंग (इसे ऑफ़लाइन ट्रेनिंग भी कहा जाता है) का मतलब है कि किसी मॉडल को सिर्फ़ एक बार ट्रेन किया जाता है. इसके बाद, कुछ समय के लिए उसी मॉडल का इस्तेमाल किया जाता है.
डाइनैमिक ट्रेनिंग (इसे ऑनलाइन ट्रेनिंग भी कहा जाता है) का मतलब है कि किसी मॉडल को लगातार या कम से कम बार-बार ट्रेन किया जाता है. आम तौर पर, सबसे हाल ही में ट्रेन किया गया मॉडल दिखाया जाता है.
टेबल 1. मुख्य फ़ायदे और नुकसान.
स्टैटिक ट्रेनिंग
डाइनैमिक ट्रेनिंग
फ़ायदे
आसान बनाएं. आपको मॉडल को सिर्फ़ एक बार डेवलप और टेस्ट करना होगा.
ज़्यादा अडैप्टिव. आपका मॉडल, सुविधाओं और लेबल के बीच के संबंध में होने वाले किसी भी बदलाव के साथ अप-टू-डेट रहेगा.
नुकसान
कभी-कभी पुराने हो सकते हैं. अगर समय के साथ, सुविधाओं और लेबल के बीच का संबंध बदलता है, तो आपके मॉडल के अनुमान की परफ़ॉर्मेंस खराब हो जाएगी.
ज़्यादा काम. आपको हमेशा नया प्रॉडक्ट बनाना, उसकी जांच करनी, और उसे रिलीज़ करना होगा.
अगर आपका डेटासेट समय के साथ सचमुच नहीं बदल रहा है, तो स्टैटिक ट्रेनिंग चुनें. ऐसा इसलिए, क्योंकि डाइनैमिक ट्रेनिंग की तुलना में इसे बनाना और मैनेज करना सस्ता होता है. हालांकि, डेटासेट समय के साथ बदलते रहते हैं. भले ही, उनमें ऐसी सुविधाएं हों जो आपके हिसाब से समुद्र के लेवल की तरह एक जैसी हों. अहम जानकारी: स्टैटिक ट्रैनिंग का इस्तेमाल करने पर भी, आपको बदलाव के लिए अपने इनपुट डेटा को मॉनिटर करना होगा.
उदाहरण के लिए, एक मॉडल को इस तरह से ट्रेन किया गया है कि वह यह अनुमान लगा सके कि उपयोगकर्ता, फूल खरीदेंगे या नहीं. समय की कमी की वजह से, मॉडल को सिर्फ़ एक बार ट्रेन किया गया है. इसके लिए, जुलाई और अगस्त के दौरान फूल खरीदने के व्यवहार के डेटासेट का इस्तेमाल किया गया है.
यह मॉडल कई महीनों तक ठीक से काम करता है. हालांकि, वैलेंटाइन्स डे के आस-पास यह गलत अनुमान लगाता है. ऐसा इसलिए होता है, क्योंकि फूलों की बिक्री से जुड़ी छुट्टियों के दौरान, उपयोगकर्ता का व्यवहार काफ़ी बदल जाता है.
स्टैटिक और डाइनैमिक ट्रेनिंग के बारे में ज़्यादा जानने के लिए, एमएल प्रोजेक्ट मैनेज करना कोर्स देखें.
एक्सरसाइज़: देखें कि आपको क्या समझ आया
स्टैटिक (ऑफ़लाइन) ट्रेनिंग के बारे में, इनमें से कौनसे दो स्टेटमेंट सही हैं?
नया डेटा आने पर, मॉडल अप-टू-डेट रहता है.
असल में, अगर मॉडल को ऑफ़लाइन ट्रेन किया जाता है, तो नया डेटा मिलने पर, मॉडल के पास उसे शामिल करने का कोई तरीका नहीं होता. अगर आप जिस डिस्ट्रिब्यूशन से सीखना चाहते हैं वह समय के साथ बदलता है, तो इससे मॉडल का डेटा पुराना हो सकता है.
प्रोडक्शन में लागू करने से पहले, मॉडल की पुष्टि की जा सकती है.
हां, ऑफ़लाइन ट्रेनिंग से, मॉडल को प्रोडक्शन में शामिल करने से पहले, मॉडल की परफ़ॉर्मेंस की पुष्टि करने का भरपूर मौका मिलता है.
ऑनलाइन ट्रेनिंग की तुलना में, ऑफ़लाइन ट्रेनिंग के लिए ट्रेनिंग जॉब को कम मॉनिटर करने की ज़रूरत होती है.
आम तौर पर, ऑफ़लाइन ट्रेनिंग के लिए, ट्रेनिंग के समय निगरानी करने की ज़रूरतें कम होती हैं. इससे आपको प्रॉडक्शन से जुड़ी कई बातों से बचने में मदद मिलती है. हालांकि, अपने मॉडल को जितनी ज़्यादा बार ट्रेन किया जाता है, उतना ही ज़्यादा निवेश मॉनिटरिंग में करना पड़ता है. आपको समय-समय पर पुष्टि भी करनी होगी, ताकि यह पक्का किया जा सके कि आपके कोड (और उसकी डिपेंडेंसी) में किए गए बदलावों से मॉडल की क्वालिटी पर बुरा असर न पड़े.
अनुमान लगाने के समय, इनपुट डेटा की बहुत कम निगरानी की ज़रूरत होती है.
हालांकि, आपको विज्ञापन दिखाने के समय इनपुट डेटा को मॉनिटर करना होगा. अगर इनपुट डिस्ट्रिब्यूशन में बदलाव होता है, तो हो सकता है कि हमारे मॉडल के
अनुमान भरोसेमंद न हों. उदाहरण के लिए, मान लें कि सिर्फ़ गर्मियों के कपड़ों के डेटा पर ट्रेन किया गया मॉडल, अचानक से सर्दियों में कपड़े खरीदने के व्यवहार का अनुमान लगाने के लिए इस्तेमाल किया जा रहा है.
डाइनैमिक (ऑनलाइन) ट्रेनिंग के बारे में इनमें से कौनसी एक बात सही है?
नया डेटा आने पर, मॉडल अप-टू-डेट रहता है.
ऑनलाइन ट्रेनिंग का मुख्य फ़ायदा यह है कि मॉडल को नए डेटा पर ट्रेनिंग देने की अनुमति देकर, डेटा के पुराने होने से जुड़ी कई समस्याओं से बचा जा सकता है.
ट्रेनिंग जॉब की बहुत कम निगरानी की ज़रूरत होती है.
असल में, आपको ट्रेनिंग जॉब पर लगातार नज़र रखनी चाहिए, ताकि यह पक्का किया जा सके कि ये सही तरीके से काम कर रहे हैं या नहीं. आपको मॉडल को पिछले स्नैपशॉट पर वापस ले जाने की सुविधा जैसा, काम करने वाला इन्फ़्रास्ट्रक्चर भी चाहिए. ऐसा तब करना होगा, जब ट्रेनिंग के दौरान कोई गड़बड़ी हो, जैसे कि गड़बड़ी वाली जॉब या इनपुट डेटा में गड़बड़ी.
अनुमान लगाने के समय, इनपुट डेटा की बहुत कम निगरानी की ज़रूरत होती है.
स्टैटिक, ऑफ़लाइन मॉडल की तरह ही, डाइनैमिक तौर पर अपडेट होने वाले मॉडल के इनपुट पर भी नज़र रखना ज़रूरी है. ऐसा हो सकता है कि आपके कारोबार पर, सीज़न के हिसाब से होने वाले बदलावों का ज़्यादा असर न पड़े. हालांकि, इनपुट में अचानक और बड़े बदलाव होने पर, अनुमान भरोसेमंद नहीं हो सकते. जैसे, अपस्ट्रीम डेटा सोर्स के बंद होने पर.