डिसिज़न ट्री

डिसिज़न फ़ॉरेस्ट मॉडल, डिसिज़न ट्री से बने होते हैं. डिसिज़न फ़ॉरेस्ट लर्निंग एल्गोरिदम (जैसे कि किसी भी क्रम में लगाए जाने वाले जंगल) कम से कम कुछ हद तक, डिसिज़न ट्री के बारे में जानकारी हासिल करना.

कोर्स के इस सेक्शन में, उदाहरण के तौर पर दिए गए एक छोटे से डेटासेट को पढ़ें कि एक डिसिज़न ट्री को कैसे ट्रेन किया जाता है. अगले सेक्शन में, आपको इनके बारे में जानकारी मिलेगी डिसिज़न ट्री को ट्रेनिंग देने वाले डिसिज़न ट्री के साथ जोड़ा जाता है.

YDF कोड

YDF में, अलग-अलग डिसिज़न ट्री मॉडल को ट्रेनिंग देने के लिए, CART लर्निंग का इस्तेमाल करें:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

मॉडल

डिसिज़न ट्री "सवालों" के कलेक्शन से मिलकर बना एक मॉडल है व्यवस्थित जो पेड़ के आकार की तरह दिखता है. सवालों को आम तौर पर स्थिति, स्प्लिट या टेस्ट. हम "शर्त" इंच यह कक्षा. बिना लीफ़ के हर नोड में एक शर्त होती है और हर लीफ़ नोड में एक शर्त होती है सुझाव.

आम तौर पर, पेड़-पौधों की जड़ नीचे की ओर उगती है; हालांकि, फ़ैसला आम तौर पर, ट्री के ऊपर रूट (पहला नोड) दिखता है.

डिसिज़न ट्री जिसमें दो शर्तें और तीन पत्तियां हैं. पहला
स्थिति (रूट) num_legs >= 3 है; दूसरी शर्त है
num_eyes >= 3. पत्तियों की तीन पत्तियां पेंग्विन, स्पाइडर, और
और कुत्ता.

पहली इमेज. डेटा की कैटगरी तय करने वाला आसान डिसिज़न ट्री. हरे रंग में दिया गया लेजेंड हिस्सा नहीं है के डिसिज़न ट्री में शामिल किया गया है.

 

डिसिज़न ट्री मॉडल के अनुमान की गणना मूल (ऊपर) लीफ़ के नोड (सबसे नीचे) में से किसी एक तक शर्तें. हासिल की गई लीफ़ की वैल्यू, डिसीज़न ट्री का अनुमान होती है. विज़िट किए गए नोड के सेट को अनुमान पाथ कहा जाता है. उदाहरण के लिए, इन सुविधा की वैल्यू देखें:

num_legs num_eyes
4 2

सुझाव के तौर पर कुत्ते को चुना जाएगा. अनुमान का पाथ यह होगा:

  1. num_legs ≥ 3 → हां
  2. num_eyes ≥ 3 → नहीं

यह इमेज पहली इमेज के जैसा है, लेकिन इस इलस्ट्रेशन में
  दो स्थितियों में अनुमान का पाथ, कुत्ते के लिए पत्ती में खत्म होता है.

दूसरी इमेज. उदाहरण के लिए, पत्ते *कुत्ते* के अनुमान का पाथ *{num_legs : 4, num_eyes : 2}*.

 

पिछले उदाहरण में, डिसिज़न ट्री की पत्तियों में वर्गीकरण शामिल है अनुमान; इसका मतलब है कि हर पत्ती में, किसी जानवर की प्रजाति मौजूद होती है. संभावित प्रजातियों का है.

इसी तरह, डिसिज़न ट्री, पत्तियों को रिग्रेसिव अनुमान (संख्या वाली वैल्यू). उदाहरण के लिए, नीचे दिया गया फ़ैसला पेड़, संख्या में 0 से 10 के बीच किसी जानवर के क्यूटनेस स्कोर का अनुमान लगाता है.

ऐसा डिसीज़न ट्री, जिसमें हर लीफ़ में फ़्लोटिंग-पॉइंट अलग-अलग होता है
  जोड़ें.

तीसरी इमेज. डिसिज़न ट्री जो अंकों वाला अनुमान लगाता है.