AutoML: शुरू करना

अगर आपको AutoML का इस्तेमाल करना है, तो हो सकता है कि आपके मन में और शुरुआत करने के लिए आपको कौनसे कदम उठाने चाहिए. इस सेक्शन में ज़्यादा जानकारी दी गई है AutoML को सामान्य पैटर्न के तौर पर देखें. साथ ही, जानें कि AutoML कैसे काम करता है. इसके अलावा, यह भी जानें कि आपको अपने प्रोजेक्ट के लिए AutoML का इस्तेमाल शुरू करने से पहले, यह काम करना पड़ सकता है.

AutoML टूल

AutoML टूल दो मुख्य कैटगरी में आते हैं:

  • जिन टूल को कोडिंग की ज़रूरत नहीं होती वे आम तौर पर वेब ऐप्लिकेशन का रूप लेते हैं जिसकी मदद से, यूज़र इंटरफ़ेस के ज़रिए एक्सपेरिमेंट को कॉन्फ़िगर करके चलाया जा सकता है. बिना कोई कोड लिखे आपके डेटा के लिए सबसे अच्छा मॉडल है.
  • एपीआई और सीएलआई टूल में, ऑटोमेशन की बेहतर सुविधाएं मिलती हैं. हालांकि, इनके लिए ज़्यादा सुविधाएं चाहिए (कई बार काफ़ी ज़्यादा) प्रोग्रामिंग और एमएल (मशीन लर्निंग) की विशेषज्ञता होती है.

जिन AutoML टूल को कोडिंग की ज़रूरत होती है वे बिना कोड वाले टूल, लेकिन उनका इस्तेमाल करना ज़्यादा मुश्किल भी हो सकता है. यह मॉड्यूल, फ़ोकस करने वाले पर सहमति दी है, लेकिन ध्यान रखें कि एपीआई और सीएलआई अगर आपको ऑटोमेशन की ज़रूरत है, तो विकल्पों से मदद मिल सकती है.

AutoML वर्कफ़्लो

चलिए, मशीन लर्निंग के एक सामान्य वर्कफ़्लो के बारे में जानते हैं और देखते हैं कि इस्तेमाल करने पर चीज़ें कैसे काम करती हैं AutoML. वर्कफ़्लो के हाई लेवल चरण वही हैं जिनका इस्तेमाल आप ज़रूरत के मुताबिक ट्रेनिंग; मुख्य अंतर यह है कि AutoML आपके लिए कुछ काम पूरा करता है.

सवाल की परिभाषा

किसी भी एमएल वर्कफ़्लो में सबसे पहले अपनी समस्या के बारे में बताना होता है. इसका इस्तेमाल करते समय AutoML, पक्का करें कि आपका चुना गया टूल, आपके एमएल प्रोजेक्ट के मकसद. ज़्यादातर AutoML टूल, निगरानी में रखे गए अलग-अलग तरह के सिस्टम के साथ काम करते हैं मशीन लर्निंग एल्गोरिदम और इनपुट डेटा टाइप.

समस्या की फ़्रेमिंग के बारे में ज़्यादा जानकारी के लिए, मशीन लर्निंग से जुड़ी समस्याओं को फ़्रेमिंग के बारे में जानकारी.

डेटा इकट्ठा करना

AutoML टूल के साथ काम शुरू करने से पहले, आपको अपना डेटा इकट्ठा करना होगा में बदल सकते हैं. प्रॉडक्ट के दस्तावेज़ देखें और पक्का करें कि आपका टूल इन कामों में मदद करता है: आपका डेटा सोर्स, आपके डेटासेट में मौजूद डेटा टाइप, साइज़ में से एक है.

डेटा तैयार करने की सेवा

डेटा तैयार करने की प्रक्रिया में AutoML टूल आपकी मदद कर सकते हैं. हालांकि, ऐसा नहीं होना चाहिए टूल सबकुछ अपने आप कर सकता है, इसलिए आप टूल में आपका डेटा इंपोर्ट कर सकता है. AutoML के लिए डेटा तैयार करना इसके जैसा है मॉडल को मैन्युअल तौर पर ट्रेनिंग देने के लिए आपको क्या करना होगा. अगर आपको इसके बारे में ज़्यादा जानना है, ट्रेनिंग के लिए डेटा तैयार करने के बारे में जानने के लिए, डेटा प्रिपरेशन सेक्शन में जाएं.

अपना डेटा तैयार करने के बारे में ज़्यादा जानने के लिए, यह देखें आंकड़ों के साथ काम करना और कैटगरिकल डेटा के साथ काम करना मॉड्यूल देखें.

AutoML ट्रेनिंग के लिए अपना डेटा इंपोर्ट करने से पहले, आपको इन्हें पूरा करना होगा कदम:

  • अपने डेटा को लेबल करना

    आपके डेटासेट में मौजूद हर उदाहरण के लिए एक लेबल होना चाहिए.

  • डेटा को साफ़ और फ़ॉर्मैट करना

    रीयल-वर्ल्ड का डेटा अक्सर पेचीदा होता है. इसलिए, इस्तेमाल करने से पहले अपना डेटा साफ़ कर लें इसे. AutoML के साथ भी आपको अपने लिए सबसे सही इलाज तय करने की ज़रूरत है डेटासेट और समस्या की शिकायत करें. इसके लिए कुछ एक्सप्लोरेशन की ज़रूरत पड़ सकती है और आपको सबसे बेहतर नतीजे मिलने से पहले, कई AutoML चलाए जा सकते हैं.

  • सुविधा में बदलाव करना

    कुछ AutoML टूल आपके लिए, चुनिंदा सुविधाओं को बदलने को हैंडल करते हैं. हालांकि, अगर आपके द्वारा उपयोग किया जा रहा टूल आपकी आवश्यकता के अनुसार सुविधा ट्रांसफ़ॉर्म का समर्थन नहीं करता या यह अच्छी तरह से काम नहीं करता है. आपको आगे ट्रांसफ़ॉर्मेशन करने पड़ सकते हैं समय की है.

बिना कोड वाले AutoML के साथ मॉडल डेवलपमेंट

ट्रेनिंग के दौरान यह काम AutoML आपके लिए करता है. हालांकि, शुरू करने से पहले ट्रेनिंग के दौरान, आपको अपने एक्सपेरिमेंट को कॉन्फ़िगर करना होगा. AutoML ट्रेनिंग सेट अप करने के लिए चलाएं, तो आपको आम तौर पर इन हाई लेवल चरणों को तय करना होगा:

  1. अपना डेटा इंपोर्ट करना

    डेटा इंपोर्ट करने के लिए, डेटा सोर्स तय करें. इंपोर्ट करने के दौरान प्रोसेस में, AutoML टूल हर डेटा वैल्यू के लिए सिमैंटिक डेटा टाइप असाइन करता है.

  2. अपने डेटा का विश्लेषण करना

    आम तौर पर, AutoML प्रॉडक्ट में ऐसे टूल मौजूद होते हैं जिनकी मदद से, डेटासेट से पहले और ट्रेनिंग के बाद. इसका सबसे सही तरीका है कि आप इन विश्लेषण टूल का इस्तेमाल करें AutoML चलाना शुरू करने से पहले, आपके डेटा को समझने और उसकी पुष्टि करने के लिए.

  3. अपना डेटा बेहतर बनाना

    AutoML टूल अक्सर ऐसे तरीके उपलब्ध कराते हैं जिनकी मदद से, डेटा को बेहतर बनाने के लिए इंपोर्ट करने और ट्रेनिंग से पहले. यहां कुछ ऐसे टास्क दिए गए हैं जिन्हें शायद आप पूरा करना चाहें बेहतर बनाने के लिए:

    • सेमैंटिक चेकिंग: इंपोर्ट के दौरान, AutoML टूल यह पता लगाने की कोशिश करते हैं कि हर सुविधा के लिए सही सिमैंटिक टाइप है, लेकिन ये सिर्फ़ अनुमान हैं. आपको सभी सुविधाओं के लिए तय किए गए टाइप को देखना चाहिए और उन्हें बदलना चाहिए अगर उन्हें ग़लती से असाइन किया गया था.

      उदाहरण के लिए, हो सकता है कि आपके पिन कोड, आपका डेटाबेस. ज़्यादातर AutoML सिस्टम, डेटा को लगातार के तौर पर पहचानेंगे संख्या वाला डेटा. यह पिन कोड और उपयोगकर्ता के लिए गलत होगा हो सकता है कि सिमैंटिक टाइप को बदलना हो जारी रखें.

    • बदलाव: कुछ टूल की मदद से उपयोगकर्ता, डेटा को पसंद के मुताबिक बना सकते हैं रिफ़ाइन करने की प्रोसेस के हिस्से के तौर पर किए गए बदलावों के बारे में बताता है. कभी-कभी ऐसा होता है यह तब ज़रूरी होता है, जब डेटासेट में ऐसी अनुमानित सुविधाएं हों जिन्हें पूरी तरह से बदलना या इस तरह मिलाना जो AutoML टूल के लिए मुश्किल हो मदद के बिना तय कर सकते हैं.

      उदाहरण के लिए, ऐसे हाउसिंग डेटासेट पर विचार करें जिसका इस्तेमाल, अनुमान लगाने के लिए किया जा रहा है किसी घर की सेल में कीमत कितनी होनी चाहिए. मान लें कि कोई ऐसी सुविधा है जो एक ऐसी हाउस लिस्टिंग का ब्यौरा दिया है जिसे description कहते हैं और आप यह करेंगे इस डेटा का उपयोग करके नाम की नई सुविधा description_length. कुछ AutoML सिस्टम, मैन्युअल तरीके से बदलाव लाने के लिए किया जा सकता है. इस उदाहरण के लिए, यहां एक LENGTH फ़ंक्शन हो सकता है की मदद से, ब्यौरे की लंबाई से जुड़ी नई सुविधा जनरेट की जा सकती है. जैसे: LENGTH(description).

  4. AutoML रन पैरामीटर कॉन्फ़िगर करना

    अपना प्रशिक्षण प्रयोग चलाने से पहले अंतिम चरण में से कुछ कॉन्फ़िगरेशन सेटिंग का इस्तेमाल करके, टूल को यह बताया जाता है कि आपको अपने मॉडल को कैसे ट्रेनिंग देनी है. हालांकि, हर AutoML टूल में कॉन्फ़िगरेशन के अलग-अलग विकल्प होते हैं, यहां पर कॉन्फ़िगरेशन से जुड़े कुछ अहम टास्क दिए गए हैं, जिनकी ज़रूरत आपको पड़ सकती है पूरा हुआ:

    • आपको एमएल (मशीन लर्निंग) का वह सवाल चुनना चाहिए जिसे हल करना है. उदाहरण के लिए, क्या आप किसी क्लासिफ़िकेशन या रिग्रेशन की समस्या को हल कर रहे हैं?
    • चुनें कि आपके डेटासेट में कौनसा कॉलम लेबल है.
    • सुविधाओं का वह सेट चुनें जिसका इस्तेमाल मॉडल को ट्रेनिंग देने के लिए करना है.
    • मॉडल खोज में, AutoML के हिसाब से एमएल एल्गोरिदम का सेट चुनें.
    • आकलन की वह मेट्रिक चुनें जिसका इस्तेमाल AutoML सबसे अच्छा मॉडल चुनने के लिए करता है.

AutoML एक्सपेरिमेंट को कॉन्फ़िगर करने के बाद, आप ट्रेनिंग शुरू करने के लिए तैयार हैं दौड़ना. ट्रेनिंग को पूरा होने में थोड़ा समय लग सकता है (घंटों के क्रम में).

मॉडल का आकलन करें

ट्रेनिंग के बाद, AutoML टूल का इस्तेमाल करके नतीजों की जाँच की जा सकती है प्रॉडक्ट से आपको इन कामों में मदद मिलती है:

  • सुविधा की अहमियत बताने वाली मेट्रिक की जांच करके, अपनी सुविधाओं का आकलन करें.
  • इस्तेमाल किए गए आर्किटेक्चर और हाइपर पैरामीटर की जांच करके, अपने मॉडल को समझें उसे बनाने के लिए.
  • इस दौरान इकट्ठा किए गए प्लॉट और मेट्रिक की मदद से, टॉप-लेवल मॉडल की परफ़ॉर्मेंस का आकलन करें ट्रेनिंग दी गई है.

प्रोडक्शन

हालांकि, यह इस मॉड्यूल के दायरे से बाहर है, लेकिन कुछ AutoML सिस्टम आपकी मदद कर सकते हैं अपने मॉडल की जांच करें और उसे डिप्लॉय करें.

मॉडल को फिर से ट्रेनिंग दें

आपको इस मॉडल को नए डेटा के साथ फिर से ट्रेनिंग देनी पड़ सकती है. ऐसा आपके बाद हो सकता है अपनी AutoML ट्रेनिंग का आकलन करें या फिर कुछ सेवाओं के लिए आपका मॉडल प्रोडक्शन में होने के बाद समय. दोनों ही मामलों में, AutoML सिस्टम फिर से ट्रेनिंग देने में मदद कर सकते हैं. ऐसा नहीं है आम तौर पर, यह ऑटोएमएल चलाने के बाद आपके डेटा की दोबारा जांच करता है और एक बेहतर डेटासेट.

आगे क्या करना है

यह मॉड्यूल पूरा करने पर बधाई!

हमारा सुझाव है कि आप अलग-अलग एमएलसीसी मॉड्यूल देखें अपने हिसाब से और अपने हिसाब से मशीन में बदलाव करना. सुझाए गए ऑर्डर का पालन करने के लिए, हमारा सुझाव है कि आप नीचे दिए गए मॉड्यूल पर जाएं: एमएल फ़ेयरनेस.