वैरिएबल की अहमियत
अलग-अलग अहमियत (जिसे सुविधा का महत्व भी कहा जाता है) वह स्कोर है जिससे पता चलता है कि मॉडल के लिए कोई सुविधा कितनी "ज़रूरी" है. उदाहरण के लिए, अगर दो इनपुट सुविधाओं "f1" और "f2" वाले किसी मॉडल के लिए वैरिएबल की अहमियत {f1=5.8, f2=2.5} है, तो मॉडल के लिए "f1" सुविधा "f2" की तुलना में ज़्यादा "ज़रूरी" है. दूसरे मशीन लर्निंग मॉडल की तरह, वैरिएबल की अहमियत को समझाना यह समझने का एक आसान तरीका है कि डिसिज़न ट्री कैसे काम करता है.
पेड़ों को तय करने के लिए, मॉडल एग्नोस्टिक वैरिएबल की अहमियत को लागू किया जा सकता है. जैसे, परम्यूटेशन वैरिएबल की वैल्यू तय करना.
डिसिज़न ट्री की भी अलग-अलग अहमियत होती है, जैसे:
- किसी दिए गए वैरिएबल के साथ स्प्लिट स्कोर का योग.
- किसी दिए गए वैरिएबल वाले नोड की संख्या.
- सभी ट्री पाथ में, किसी सुविधा के पहली बार दिखने की औसत गहराई.
अलग-अलग क्वालिटी की अहमियत अलग-अलग हो सकती है, जैसे कि:
- सिमैंटिक
- स्केल
- प्रॉपर्टी
साथ ही, वैरिएबल की अहमियत के बारे में अलग-अलग तरह की जानकारी मिलती है:
- मॉडल
- डेटासेट
- ट्रेनिंग की प्रोसेस
उदाहरण के लिए, किसी खास सुविधा वाली शर्तों की संख्या से पता चलता है कि डिसिज़न ट्री उस सुविधा पर कितना ध्यान दे रहा है. इससे यह पता चल सकता है कि कौनसा फ़ीचर कितना अहम है. आखिरकार, लर्निंग एल्गोरिदम इस सुविधा को कई स्थितियों में इस्तेमाल नहीं करता. अगर इससे फ़र्क़ नहीं पड़ता. हालांकि, कई स्थितियों में दिखने वाली समान सुविधा से यह भी पता चलता है कि कोई मॉडल, सुविधा के पैटर्न को सामान्य बनाने की कोशिश तो कर रहा है, लेकिन यह काम नहीं कर रहा है. उदाहरण के लिए, ऐसा तब हो सकता है, जब कोई सुविधा सिर्फ़ एक उदाहरण आइडेंटिफ़ायर हो और उसमें सामान्य जानकारी देने के लिए कोई जानकारी मौजूद न हो.
वहीं दूसरी ओर, क्रमचय वैरिएबल की अहमियत की ज़्यादा अहमियत होने पर, किसी सुविधा को हटाने से मॉडल को नुकसान पहुंचता है. यह मॉडल की अहमियत बताता है. हालांकि, अगर मॉडल शानदार है, तो किसी एक सुविधा को हटाने से शायद मॉडल को नुकसान न पहुंचे.
वैरिएबल की अलग-अलग अहमियत से, मॉडल के अलग-अलग पहलुओं के बारे में जानकारी मिलती है. इसलिए, एक ही समय में अलग-अलग ज़रूरी बातों पर ध्यान देने से काम की जानकारी मिलती है. उदाहरण के लिए, अगर कोई सुविधा सभी वैरिएबल इंपोर्ट के हिसाब से ज़रूरी है, तो हो सकता है कि यह सुविधा अहम हो. एक अन्य उदाहरण में, अगर किसी सुविधा में "नोड की संख्या" वैरिएबल की अहमियत बहुत ज़्यादा है और वैरिएबल की अहमियत छोटी है, तो इस सुविधा को सामान्य बनाना मुश्किल हो सकता है. साथ ही, इससे मॉडल की क्वालिटी खराब हो सकती है.
model.describe()
को कॉल करके और "वैरिएबल महत्व" टैब में देखकर किसी मॉडल की वैरिएबल अहमियत देखी जा सकती है.
ज़्यादा जानकारी के लिए,
मॉडल को समझने का ट्यूटोरियल देखें.