एमएल प्रैक्टिकल: इमेज क्लासिफ़िकेशन

ओवरफ़िटिंग को रोकना

किसी भी मशीन लर्निंग मॉडल की तरह, कॉन्वोल्यूशनल नेटवर्क को ट्रेन करते समय ओवरफ़िटिंग एक अहम समस्या है: यह मॉडल, ट्रेनिंग डेटा की खास बातों के हिसाब से इतना ट्यून हो जाता है कि वह नए उदाहरणों के लिए सामान्य नहीं हो पाता. सीएनएन बनाते समय, ओवरफ़िट होने से रोकने के लिए, ये दो तकनीकें अपनाई जा सकती हैं:

  • डेटा बढ़ाना: मौजूदा इमेज में अलग-अलग तरह के बदलाव करके, नए वैरिएंट का सेट बनाने के लिए, ट्रेनिंग के उदाहरणों की संख्या और विविधता को कृत्रिम तरीके से बढ़ाना (देखें कि इमेज 7). डेटा बढ़ाने की सुविधा का इस्तेमाल तब करना चाहिए, जब ट्रेनिंग के लिए इस्तेमाल किया जाने वाला ओरिजनल डेटा सेट काफ़ी छोटा हो.
  • ड्रॉपआउट रेगुलराइज़ेशन: ट्रेनिंग ग्रेडिएंट चरण के दौरान, न्यूरल नेटवर्क से यूनिट को रैंडम तरीके से हटाना.

कुत्ते की एक इमेज पर डेटा बढ़ाने का डायग्राम, जिसमें यादृच्छिक बदलावों की मदद से नौ नई इमेज जनरेट की गई हैं सातवीं इमेज. कुत्ते की एक इमेज पर डेटा बढ़ाने का तरीका (Kaggle पर उपलब्ध "कुत्ते बनाम बिल्लियां" डेटासेट से लिया गया उदाहरण). बाईं ओर: ट्रेनिंग सेट में मौजूद कुत्ते की ओरिजनल इमेज. दाईं ओर: ओरिजनल इमेज में बदलाव करके, नौ नई इमेज जनरेट की गई हैं.