डिसिज़न ट्री

डिसिज़न फ़ॉरेस्ट मॉडल, डिसिज़न ट्री से बने होते हैं. डिसिज़न फ़ॉरेस्ट लर्निंग एल्गोरिदम (जैसे, रैंडम फ़ॉरेस्ट) कम से कम डिसिज़न ट्री की जानकारी पर निर्भर करते हैं.

कोर्स के इस सेक्शन में, उदाहरण के तौर पर दिए गए एक छोटे से डेटासेट के बारे में पढ़ा जा सकता है. साथ ही, यह बताया जाएगा कि किसी एक डिसिज़न ट्री को कैसे ट्रेनिंग दी जाती है. अगले सेक्शन में, आपको यह जानकारी मिलेगी कि डिसिज़न फ़ॉरेस्ट को ट्रेनिंग देने के लिए, फ़ैसले ट्री को कैसे जोड़ा जाता है.

YDF कोड

YDF में, डिसिज़न ट्री मॉडल को ट्रेनिंग देने के लिए, CART लर्नर का इस्तेमाल करें:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

मॉडल

डिसिज़न ट्री, "सवालों" के कलेक्शन से बना मॉडल होता है. इसे पेड़ के आकार में व्यवस्थित तरीके से व्यवस्थित किया जाता है. आम तौर पर,इन सवालों को स्थिति, स्प्लिट या टेस्ट कहा जाता है. हम इस क्लास में "शर्त" शब्द का इस्तेमाल करेंगे. हर लीफ़ नोड में एक शर्त होती है और हर लीफ़ नोड में एक अनुमान होता है.

आम तौर पर, फूल-पत्तियों वाले पेड़ की जड़ सबसे नीचे होती है. हालांकि, आम तौर पर डिसिज़न ट्री को सबसे ऊपर रूट (पहला नोड) दिखाया जाता है.

डिसिज़न ट्री में दो शर्तें और तीन पत्तियां हैं. पहली स्थिति (रूट) num_legs >= 3 है. वहीं दूसरी शर्त num_eyes >= 3 है. तीन पत्तियां हैं पेंग्विन, मकड़ी,
और कुत्ता.

पहली इमेज. सिंपल क्लासिफ़िकेशन डिसीज़न ट्री. हरे रंग में दिखाया गया लेजेंड, डिसिज़न ट्री का हिस्सा नहीं है.

 

डिसिज़न ट्री मॉडल का अनुमान लगाने के लिए, रूट (सबसे ऊपर) से उदाहरण को किसी लीफ़ नोड (सबसे नीचे) पर रूट किया जाता है. हासिल किए गए लीफ़ की वैल्यू, डिसिज़न ट्री का अनुमान है. विज़िट किए गए नोड के सेट को अनुमान पाथ कहा जाता है. उदाहरण के लिए, नीचे दी गई सुविधा की वैल्यू देखें:

num_legs num_eyes
4 2

इसका अनुमान कुत्ता होगा. अनुमान पाथ यह होगा:

  1. num_legs ≥ 3 → हां
  2. num_eyes ≥ 3 → नहीं

यह तस्वीर 1 जैसी ही है. इस तस्वीर में दो स्थितियों के बीच अनुमान का रास्ता दिखाया गया है. यह रास्ता कुत्ते के लिए पत्ते पर खत्म होता है.

दूसरी इमेज. वह अनुमान पाथ जो लीफ़ *कुत्ता* से ऊपर होता है. इस उदाहरण में दिखाया गया है: *{num_legs : 4, num_eyes : 2}*.

 

पिछले उदाहरण में, डिसिज़न ट्री की पत्तियों में वर्गीकरण के अनुमान होते हैं. इसका मतलब है कि हर पत्ती में जानवरों की एक प्रजाति मौजूद होती है.

इसी तरह, डिसिज़न ट्री भी पत्तियों को रिग्रेसिव प्रीफ़िक्स (संख्या वाली वैल्यू) के साथ लेबल करके, अंकों वाली वैल्यू का अनुमान लगा सकता है. उदाहरण के लिए, नीचे दिया गया डिसिज़न ट्री, किसी जानवर के 0 से 10 के बीच के अंकों वाले क्यूटनेस स्कोर का अनुमान लगाता है.

डिसिज़न ट्री, जिसमें हर लीफ़ में एक अलग फ़्लोटिंग-पॉइंट नंबर होता है.

तीसरी इमेज. डिसिज़न ट्री, जो संख्या का अनुमान लगाता है.