डिसिज़न फ़ॉरेस्ट मॉडल, डिसिज़न ट्री से बने होते हैं. डिसिज़न फ़ॉरेस्ट लर्निंग एल्गोरिदम (जैसे, रैंडम फ़ॉरेस्ट) कम से कम डिसिज़न ट्री की जानकारी पर निर्भर करते हैं.
कोर्स के इस सेक्शन में, उदाहरण के तौर पर दिए गए एक छोटे से डेटासेट के बारे में पढ़ा जा सकता है. साथ ही, यह बताया जाएगा कि किसी एक डिसिज़न ट्री को कैसे ट्रेनिंग दी जाती है. अगले सेक्शन में, आपको यह जानकारी मिलेगी कि डिसिज़न फ़ॉरेस्ट को ट्रेनिंग देने के लिए, फ़ैसले ट्री को कैसे जोड़ा जाता है.
YDF में, डिसिज़न ट्री मॉडल को ट्रेनिंग देने के लिए, CART लर्नर का इस्तेमाल करें:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
मॉडल
डिसिज़न ट्री, "सवालों" के कलेक्शन से बना मॉडल होता है. इसे पेड़ के आकार में व्यवस्थित तरीके से व्यवस्थित किया जाता है. आम तौर पर,इन सवालों को स्थिति, स्प्लिट या टेस्ट कहा जाता है. हम इस क्लास में "शर्त" शब्द का इस्तेमाल करेंगे. हर लीफ़ नोड में एक शर्त होती है और हर लीफ़ नोड में एक अनुमान होता है.
आम तौर पर, फूल-पत्तियों वाले पेड़ की जड़ सबसे नीचे होती है. हालांकि, आम तौर पर डिसिज़न ट्री को सबसे ऊपर रूट (पहला नोड) दिखाया जाता है.
पहली इमेज. सिंपल क्लासिफ़िकेशन डिसीज़न ट्री. हरे रंग में दिखाया गया लेजेंड, डिसिज़न ट्री का हिस्सा नहीं है.
डिसिज़न ट्री मॉडल का अनुमान लगाने के लिए, रूट (सबसे ऊपर) से उदाहरण को किसी लीफ़ नोड (सबसे नीचे) पर रूट किया जाता है. हासिल किए गए लीफ़ की वैल्यू, डिसिज़न ट्री का अनुमान है. विज़िट किए गए नोड के सेट को अनुमान पाथ कहा जाता है. उदाहरण के लिए, नीचे दी गई सुविधा की वैल्यू देखें:
num_legs | num_eyes |
---|---|
4 | 2 |
इसका अनुमान कुत्ता होगा. अनुमान पाथ यह होगा:
- num_legs ≥ 3 → हां
- num_eyes ≥ 3 → नहीं
दूसरी इमेज. वह अनुमान पाथ जो लीफ़ *कुत्ता* से ऊपर होता है. इस उदाहरण में दिखाया गया है: *{num_legs : 4, num_eyes : 2}*.
पिछले उदाहरण में, डिसिज़न ट्री की पत्तियों में वर्गीकरण के अनुमान होते हैं. इसका मतलब है कि हर पत्ती में जानवरों की एक प्रजाति मौजूद होती है.
इसी तरह, डिसिज़न ट्री भी पत्तियों को रिग्रेसिव प्रीफ़िक्स (संख्या वाली वैल्यू) के साथ लेबल करके, अंकों वाली वैल्यू का अनुमान लगा सकता है. उदाहरण के लिए, नीचे दिया गया डिसिज़न ट्री, किसी जानवर के 0 से 10 के बीच के अंकों वाले क्यूटनेस स्कोर का अनुमान लगाता है.
तीसरी इमेज. डिसिज़न ट्री, जो संख्या का अनुमान लगाता है.