अपनी समझ को आज़माएं

यहां दिए गए सवालों से, आपको एमएल के बुनियादी सिद्धांतों को बेहतर तरीके से समझने में मदद मिलती है.

अनुमान लगाने की क्षमता

सुपरवाइज़्ड एमएल मॉडल को, लेबल किए गए उदाहरणों वाले डेटासेट का इस्तेमाल करके ट्रेन किया जाता है. मॉडल, सुविधाओं से लेबल का अनुमान लगाने का तरीका सीखता है. हालांकि, किसी डेटासेट में मौजूद हर एलिमेंट में, भविष्य का अनुमान लगाने की सुविधा नहीं होती. कुछ मामलों में, सिर्फ़ कुछ सुविधाएं ही लेबल का अनुमान लगाती हैं. नीचे दिए गए डेटासेट में, कीमत को लेबल के तौर पर और बाकी कॉलम को सुविधाओं के तौर पर इस्तेमाल करें.

वाहन से जुड़े एट्रिब्यूट का लेबल किया गया उदाहरण.

आपके हिसाब से, कार की कीमत का अनुमान लगाने के लिए इनमें से कौनसी तीन सुविधाएं सबसे ज़्यादा अहम हैं?
Tire_size, wheel_base, year.
Color, height, make_model.
मील, गियरबॉक्स, make_model.
Make_model, year, miles.

सुपरवाइज़्ड और अनसुपरवाइज़्ड लर्निंग

समस्या के हिसाब से, आपको निगरानी में रखे गए डिवाइसों या निगरानी में नहीं रखे गए डिवाइसों के लिए, कोई एक तरीका अपनाना होगा. उदाहरण के लिए, अगर आपको पहले से ही उस वैल्यू या कैटगरी के बारे में पता है जिसका अनुमान लगाना है, तो सुपरवाइज़्ड लर्निंग का इस्तेमाल किया जाएगा. हालांकि, अगर आपको यह जानना है कि आपके डेटासेट में, मिलते-जुलते उदाहरणों के सेगमेंटेशन या ग्रुपिंग मौजूद हैं या नहीं, तो आपको बिना निगरानी वाली लर्निंग का इस्तेमाल करना होगा.

मान लें कि आपके पास किसी ऑनलाइन शॉपिंग वेबसाइट के उपयोगकर्ताओं का डेटासेट है और इसमें ये कॉलम शामिल हैं:

ग्राहक के एट्रिब्यूट की लाइन की इमेज.

अगर आपको साइट पर आने वाले उपयोगकर्ताओं के टाइप को समझना है, तो क्या आप सुपरवाइज़्ड या अनसुपरवाइज़्ड लर्निंग का इस्तेमाल करेंगे?
अनसुपरवाइज़्ड लर्निंग.
सुपरवाइज़्ड लर्निंग, क्योंकि मुझे यह अनुमान लगाना है कि उपयोगकर्ता किस क्लास से है.

मान लें कि आपके पास घरों के लिए ऊर्जा खर्च का डेटासेट है, जिसमें ये कॉलम हैं:

होम एट्रिब्यूट की लाइन की इमेज.

नए बनाए गए घर के लिए, हर साल इस्तेमाल किए गए किलोवाट-घंटे का अनुमान लगाने के लिए, किस तरह के एमएल का इस्तेमाल किया जाएगा?
अनसुपरवाइज़्ड लर्निंग.
सुपरवाइज़्ड लर्निंग.

मान लें कि आपके पास फ़्लाइट का डेटासेट है, जिसमें ये कॉलम हैं:

फ़्लाइट डेटा की लाइन की इमेज.

अगर आपको बस के टिकट की कीमत का अनुमान लगाना है, तो क्या आप रेग्रेसन या क्लासिफ़िकेशन का इस्तेमाल करेंगे?
कैटगरी
रिग्रेशन
क्या डेटासेट के आधार पर, कोच टिकट की कीमत को "ज़्यादा", "औसत" या "कम" के तौर पर बांटने के लिए, कैटगरी तय करने वाले मॉडल को ट्रेन किया जा सकता है?
नहीं. क्लासिफ़िकेशन मॉडल नहीं बनाया जा सकता. coach_ticket_cost वैल्यू, कैटगरी वाली नहीं, बल्कि संख्या वाली होती हैं.
नहीं. क्लासिफ़िकेशन मॉडल सिर्फ़ दो कैटगरी का अनुमान लगाते हैं, जैसे कि spam या not_spam. इस मॉडल को तीन कैटगरी का अनुमान लगाना होगा.
हां, लेकिन हमें पहले coach_ticket_cost कॉलम में मौजूद अंकों वाली वैल्यू को कैटगरी वाली वैल्यू में बदलना होगा.

ट्रेनिंग और आकलन

किसी मॉडल को ट्रेन करने के बाद, हम लेबल किए गए उदाहरणों वाले डेटासेट का इस्तेमाल करके उसका आकलन करते हैं. साथ ही, मॉडल की अनुमानित वैल्यू की तुलना लेबल की असल वैल्यू से करते हैं.

सवाल के लिए दो सबसे सही जवाब चुनें.

अगर मॉडल के अनुमान बहुत अलग हैं, तो उन्हें बेहतर बनाने के लिए क्या किया जा सकता है?
मॉडल को फिर से ट्रेन करें. हालांकि, सिर्फ़ उन सुविधाओं का इस्तेमाल करें जिनके बारे में आपको लगता है कि वे लेबल के लिए सबसे ज़्यादा सटीक अनुमान लगा सकती हैं.
बड़े और अलग-अलग तरह के डेटासेट का इस्तेमाल करके, मॉडल को फिर से ट्रेन करें.
ट्रेनिंग का कोई दूसरा तरीका आज़माएं. उदाहरण के लिए, अगर आपने सुपरवाइज़्ड ऐप्रोच का इस्तेमाल किया है, तो अनसुपरवाइज़्ड ऐप्रोच आज़माएं.
ऐसे मॉडल को ठीक नहीं किया जा सकता जिसका अनुमान बहुत दूर है.

अब आप एमएल की अपनी यात्रा में अगला कदम उठाने के लिए तैयार हैं:

  • लोग और एआई की गाइडबुक. अगर आपको एआई का इस्तेमाल करने के लिए, Google के कर्मचारियों, इंडस्ट्री के विशेषज्ञों, और अकादमिक रिसर्च से मिले तरीकों, सबसे सही तरीकों, और उदाहरणों का सेट चाहिए.

  • समस्या को फ़्रेम करना. अगर आपको एमएल मॉडल बनाने और इस दौरान आम तौर पर होने वाली गड़बड़ियों से बचने के लिए, ऐसा तरीका चाहिए जिसे पहले से आज़माया जा चुका हो.

  • मशीन लर्निंग क्रैश कोर्स. अगर आप एआई के बारे में ज़्यादा जानने के लिए, बारीकी से और खुद आज़माकर सीखने के लिए तैयार हैं.