यहां दिए गए सवालों से, आपको एमएल के मुख्य सिद्धांतों को बेहतर तरीके से समझने में मदद मिलेगी.
अनुमान लगाने की क्षमता
सुपरवाइज़्ड एमएल मॉडल को, लेबल किए गए उदाहरणों वाले डेटासेट का इस्तेमाल करके ट्रेन किया जाता है. मॉडल, सुविधाओं से लेबल का अनुमान लगाना सीखता है. हालांकि, किसी डेटासेट में मौजूद हर फ़ीचर से अनुमान नहीं लगाया जा सकता. कुछ मामलों में, सिर्फ़ कुछ सुविधाओं से लेबल का अनुमान लगाया जाता है. नीचे दिए गए डेटासेट में, कीमत को लेबल के तौर पर इस्तेमाल करें. साथ ही, बाकी कॉलम को सुविधाओं के तौर पर इस्तेमाल करें.
आपके हिसाब से, कार की कीमत का अनुमान लगाने के लिए इनमें से कौनसी तीन सुविधाएं सबसे ज़्यादा मददगार हो सकती हैं?
Make_model, year, miles.
किसी कार की कीमत का अनुमान लगाने के लिए, उसके ब्रैंड/मॉडल, साल, और माइलेज की जानकारी सबसे अहम होती है.
रंग, ऊंचाई, make_model.
किसी कार की ऊंचाई और रंग से, उसकी कीमत का सही अनुमान नहीं लगाया जा सकता.
माइलेज, गियरबॉक्स, make_model.
गियरबॉक्स, कीमत का मुख्य अनुमान लगाने वाला फ़ैक्टर नहीं है.
Tire_size, wheel_base, year.
टायर के साइज़ और व्हील बेस से, कार की कीमत का सटीक अनुमान नहीं लगाया जा सकता.
सुपरवाइज़्ड और अनसुपरवाइज़्ड लर्निंग
समस्या के आधार पर, निगरानी में रखकर या निगरानी में रखे बिना एआई का इस्तेमाल किया जाएगा.
उदाहरण के लिए, अगर आपको पहले से ही उस वैल्यू या कैटगरी के बारे में पता है जिसका अनुमान लगाना है, तो आपको सुपरवाइज़्ड लर्निंग का इस्तेमाल करना होगा. हालांकि, अगर आपको यह जानना है कि आपके डेटासेट में, मिलते-जुलते उदाहरणों के कोई सेगमेंट या ग्रुपिंग हैं या नहीं, तो आपको बिना लेबल वाले डेटा के आधार पर मशीन लर्निंग का इस्तेमाल करना होगा.
मान लें कि आपके पास ऑनलाइन शॉपिंग की वेबसाइट के उपयोगकर्ताओं का डेटासेट है. इसमें ये कॉलम शामिल हैं:
अगर आपको यह समझना है कि साइट पर किस तरह के उपयोगकर्ता आते हैं, तो क्या आपको सुपरवाइज़्ड लर्निंग का इस्तेमाल करना चाहिए या अनसुपरवाइज़्ड लर्निंग का?
अनसुपरवाइज़्ड लर्निंग.
हम चाहते हैं कि मॉडल, मिलते-जुलते खरीदारों के ग्रुप बनाए. इसलिए, हम बिना निगरानी वाली लर्निंग का इस्तेमाल करेंगे. मॉडल के उपयोगकर्ताओं को क्लस्टर में बांटने के बाद, हम हर क्लस्टर के लिए अपने नाम बनाते हैं. उदाहरण के लिए, "छूट पाने के लिए खरीदारी करने वाले," "डील हंटर," "सर्फ़र," "भरोसेमंद," और "घुमक्कड़."
सुपरवाइज़्ड लर्निंग, क्योंकि मुझे यह अनुमान लगाना है कि उपयोगकर्ता किस क्लास से है.
सुपरवाइज़्ड लर्निंग में, डेटासेट में वह लेबल होना चाहिए जिसका आपको अनुमान लगाना है. डेटासेट में, ऐसा कोई लेबल नहीं है जो उपयोगकर्ता की कैटगरी के बारे में बताता हो.
मान लें कि आपके पास घरों में इस्तेमाल होने वाली ऊर्जा का एक डेटासेट है. इसमें ये कॉलम हैं:
नए घर में हर साल इस्तेमाल होने वाले किलोवॉट घंटों का अनुमान लगाने के लिए, किस तरह की एमएल का इस्तेमाल किया जाएगा?
सुपरवाइज़्ड लर्निंग.
सुपरवाइज़्ड लर्निंग को लेबल किए गए उदाहरणों से ट्रेनिंग मिलती है. इस डेटासेट में, "हर साल इस्तेमाल किए गए किलोवॉट घंटे” लेबल होगा, क्योंकि यह वह वैल्यू है जिसका अनुमान मॉडल को लगाना है. ये सुविधाएं होंगी: "स्क्वेयर फ़ुटेज,” "जगह की जानकारी,” और "निर्माण का साल.”
अनसुपरवाइज़्ड लर्निंग.
निगरानी में नहीं रखी गई लर्निंग में, बिना लेबल वाले उदाहरणों का इस्तेमाल किया जाता है. इस उदाहरण में, "हर साल इस्तेमाल की गई किलोवॉट घंटे की संख्या” लेबल होगा, क्योंकि यह वह वैल्यू है जिसका अनुमान मॉडल को लगाना है.
मान लें कि आपके पास फ़्लाइट का एक डेटासेट है, जिसमें ये कॉलम हैं:
अगर आपको हवाई जहाज़ के टिकट की कीमत का अनुमान लगाना है, तो रिग्रेशन या क्लासिफ़िकेशन में से किसका इस्तेमाल किया जाएगा?
रिग्रेशन
रिग्रेशन मॉडल का आउटपुट, संख्या के तौर पर होता है.
कैटगरी
क्लासिफ़िकेशन मॉडल का आउटपुट एक अलग वैल्यू होती है. आम तौर पर, यह एक शब्द होता है. इस मामले में, हवाई जहाज़ के टिकट की कीमत एक संख्यात्मक वैल्यू है.
क्या डेटासेट के आधार पर, एक क्लासिफ़िकेशन मॉडल को ट्रेन किया जा सकता है, ताकि वह हवाई जहाज़ के टिकट की कीमत को "ज़्यादा", "औसत" या "कम" के तौर पर क्लासिफ़ाई कर सके?
हां, लेकिन इसके लिए हमें सबसे पहले airplane_ticket_cost कॉलम में मौजूद संख्या वाली वैल्यू को कैटगरी वाली वैल्यू में बदलना होगा.
डेटासेट से क्लासिफ़िकेशन मॉडल बनाया जा सकता है.
इसके लिए, आपको कुछ ऐसा करना होगा:
- यात्रा शुरू करने वाले एयरपोर्ट से मंज़िल तक जाने वाले एयरपोर्ट तक के टिकट की औसत कीमत पता करें.
- "ज़्यादा", "औसत", और "कम" के लिए थ्रेशोल्ड तय करें.
- अनुमानित लागत की तुलना थ्रेशोल्ड से करें और उस कैटगरी को आउटपुट करें जिसमें वैल्यू आती है.
नहीं. क्लासिफ़िकेशन मॉडल नहीं बनाया जा सकता. airplane_ticket_cost की वैल्यू, कैटगरी वाली नहीं, बल्कि संख्या वाली हैं.
थोड़ी मेहनत करके, क्लासिफ़िकेशन मॉडल बनाया जा सकता है.
नहीं. क्लासिफ़िकेशन मॉडल सिर्फ़ दो कैटगरी का अनुमान लगाते हैं. जैसे, spam या not_spam. इस मॉडल को तीन कैटगरी का अनुमान लगाना होगा.
क्लासिफ़िकेशन मॉडल, कई कैटगरी का अनुमान लगा सकते हैं. इन्हें मल्टीक्लास क्लासिफ़िकेशन मॉडल कहा जाता है.
ट्रेनिंग और आकलन
मॉडल को ट्रेन करने के बाद, हम लेबल किए गए उदाहरणों वाले डेटासेट का इस्तेमाल करके उसका आकलन करते हैं. साथ ही, मॉडल की अनुमानित वैल्यू की तुलना, लेबल की असल वैल्यू से करते हैं.
सवाल के लिए दो सबसे सही जवाब चुनें.
अगर मॉडल के अनुमान सही नहीं हैं, तो उन्हें बेहतर बनाने के लिए क्या किया जा सकता है?
मॉडल को फिर से ट्रेन करें. हालांकि, सिर्फ़ उन सुविधाओं का इस्तेमाल करें जिनके बारे में आपको लगता है कि वे लेबल के बारे में सबसे सटीक अनुमान लगा सकती हैं.
कम सुविधाओं के साथ मॉडल को फिर से ट्रेन करने से, बेहतर अनुमान लगाने वाला मॉडल तैयार किया जा सकता है. हालांकि, इन सुविधाओं में अनुमान लगाने की ज़्यादा क्षमता होनी चाहिए.
ऐसे मॉडल को ठीक नहीं किया जा सकता जिसके अनुमान सही नहीं हैं.
जिस मॉडल के अनुमान सही नहीं हैं उसे ठीक किया जा सकता है. ज़्यादातर मॉडल को तब तक कई राउंड की ट्रेनिंग की ज़रूरत होती है, जब तक वे काम के अनुमान नहीं लगाने लगते.
ज़्यादा बड़े और अलग-अलग तरह के डेटासेट का इस्तेमाल करके, मॉडल को फिर से ट्रेन करें.
ज़्यादा उदाहरणों और वैल्यू की बड़ी रेंज वाले डेटासेट पर ट्रेन किए गए मॉडल, बेहतर अनुमान लगा सकते हैं. ऐसा इसलिए, क्योंकि मॉडल के पास सुविधाओं और लेबल के बीच के संबंध के लिए, बेहतर सामान्य समाधान होता है.
ट्रेनिंग का कोई दूसरा तरीका आज़माएं. उदाहरण के लिए, अगर आपने सुपरवाइज़ किए गए तरीके का इस्तेमाल किया है, तो बिना सुपरवाइज़ किए गए तरीके का इस्तेमाल करके देखें.
ट्रेनिंग के किसी दूसरे तरीके से बेहतर अनुमान नहीं लगाए जा सकते.
अब आप एमएल के अपने सफ़र में अगला चरण पूरा करने के लिए तैयार हैं:
मशीन लर्निंग क्रैश कोर्स. अगर आपको एमएल के बारे में ज़्यादा जानकारी चाहिए और आपको इसे इस्तेमाल करने का तरीका सीखना है.
समस्या को फ़्रेम करना. अगर आपको एमएल मॉडल बनाने और आम गलतियों से बचने के लिए, फ़ील्ड में आज़माए गए तरीके की जानकारी चाहिए.
People + AI Guidebook. अगर आपको लोगों की ज़रूरतों को ध्यान में रखकर एआई प्रॉडक्ट डिज़ाइन करने के बारे में व्यावहारिक सलाह चाहिए.