डेटासेट, सामान्यीकरण, और ज़रूरत से ज़्यादा मेल खाने वाले डेटासेट: अपनी जानकारी को परखें

  1. एक स्थिर डेटासेट का उदाहरण इनमें से कौनसा है?

  2. आप एक मॉडल को ट्रेनिंग देने की तैयारी कर रहे हैं. इससे, इस्तेमाल की गई कारों की बिक्री की कीमत का अनुमान लगाया जा सकेगा. इसके लिए, आपको उस डेटासेट का इस्तेमाल करना होगा जिसमें ये सुविधाएं शामिल हैं: year, model, और mileage. डेटासेट की जांच करने पर आपको पता चलता है कि 2, 500 उदाहरणों में से 150 के लिए,माइलेज की वैल्यू मौजूद नहीं हैं. इनमें से किन विकल्पों का इस्तेमाल करना सही होगा? (लागू होने वाले सभी विकल्प चुनें)

    जितने जवाब सही लगते हैं उतने जवाब चुनें.

  3. आप किसी स्ट्रीमिंग सेवा के फ़िल्म के सुझाव देने वाले मॉडल को ट्रेनिंग दे रहे हैं, ताकि यह अनुमान लगाया जा सके कि कोई उपयोगकर्ता दी गई फ़िल्म को पसंद करेगा या नहीं. "उपयोगकर्ता को फ़िल्म पसंद आई" के लिए, इनमें से कौनसा प्रॉक्सी लेबल सही होगा? (लागू होने वाले सभी विकल्प चुनें)

    जितने जवाब सही लगते हैं उतने जवाब चुनें.

  4. सही या गलत: अपने मॉडल को तब तक ट्रेनिंग दें, जब तक कि वह आपके टेस्ट डेटा पर कम नुकसान न पहुंचा दे. यह ओवरफ़िटिंग से बचने का एक अच्छा तरीका है.

  5. नीचे दिए गए वाक्य में खाली जगह भरें:
    रेगुलराइज़ेशन, आपके मॉडल की नए डेटा को सामान्य बनाने की क्षमता को बेहतर बनाता है. इसके लिए, ट्रेनिंग के दौरान ___ का इस्तेमाल किया जाता है.