यहां कोर्स में सीखी गई बातों के बारे में खास जानकारी दी गई है:
- डिसिज़न ट्री एक ऐसा मॉडल होता है जिसमें शर्तों का एक कलेक्शन होता है. इन शर्तों को ट्री के तौर पर, हैरारकी के हिसाब से व्यवस्थित किया जाता है. शर्तें अलग-अलग कैटगरी में आती हैं:
- ऐक्सिस के साथ अलाइन की गई शर्त में सिर्फ़ एक फ़ीचर शामिल होता है. तिरछी शर्त में कई सुविधाएं शामिल होती हैं.
- बाइनरी कंडीशन के दो संभावित नतीजे हो सकते हैं. नॉन-बाइनरी कंडीशन के दो से ज़्यादा संभावित नतीजे हो सकते हैं.
- किसी डिसीज़न ट्री को ट्रेनिंग देने में, हर नोड पर सबसे अच्छी स्थिति खोजना शामिल होता है. splitter रूटीन, सबसे अच्छी स्थिति तय करने के लिए जानकारी हासिल करने या Gini जैसी मेट्रिक का इस्तेमाल करता है.
- डिसीज़न फ़ॉरेस्ट, एक ऐसा मोड है जो कई डिसीज़न ट्री से बना होता है. डिसीज़न फ़ॉरेस्ट का अनुमान, उसके डिसीज़न ट्री के अनुमान का एग्रीगेशन होता है.
- रैंडम फ़ॉरेस्ट, डिसिज़न ट्री का एक ग्रुप होता है. इसमें हर डिसिज़न ट्री को किसी खास रैंडम नॉइज़ के साथ ट्रेन किया जाता है.
- बैगिंग एक ऐसी तकनीक है जिसमें रैंडम फ़ॉरेस्ट में मौजूद हर डिसिज़न ट्री को उदाहरणों के अलग-अलग सबसेट पर ट्रेन किया जाता है.
- रैंडम फ़ॉरेस्ट के लिए, पुष्टि करने वाले डेटासेट की ज़रूरत नहीं होती. इसके बजाय, ज़्यादातर रैंडम फ़ॉरेस्ट, मॉडल की क्वालिटी का आकलन करने के लिए, out-of-bag-evaluation नाम की एक तकनीक का इस्तेमाल करते हैं.
- ग्रेडिएंट बूस्टर (फ़ैसला) ट्री एक तरह का डिसिज़न फ़ॉरेस्ट है. इसे इनपुट डिसिज़न ट्री में बार-बार बदलाव करके ट्रेन किया जाता है. shrinkage नाम की वैल्यू से यह तय होता है कि ग्रेडिएंट बूस्ड (डिसीज़न) ट्री कितनी तेज़ी से सीखता है और कितनी हद तक ओवरफ़िट हो सकता है.
रेफ़रंस
- Greedy Function Approximation: A Gradient Boosting Machine, J. फ़्रीडमैन.
- स्टैटिस्टिकल लर्निंग के एलिमेंट, ट्रैवर हैस्टी. दसवां चैप्टर.
- जनरलाइज़्ड बूस्टेड मॉडल: gbm पैकेज के बारे में गाइड, G. Ridgeway