वैरिएबल की अहमियत
वैरिएबल की अहमियत (इसे फ़ीचर की अहमियत भी कहा जाता है) एक स्कोर है. इससे पता चलता है कि मॉडल के लिए कोई फ़ीचर कितनी "अहम" है. उदाहरण के लिए, अगर किसी मॉडल में दो इनपुट फ़ीचर "f1" और "f2" हैं और वैरिएबल की अहमियत {f1=5.8, f2=2.5} है, तो मॉडल के लिए "f1", "f2" की तुलना में ज़्यादा "अहम" है. मशीन लर्निंग के अन्य मॉडल की तरह ही, वैरिएबल की अहमियत से यह समझने में मदद मिलती है कि डिसीज़न ट्री कैसे काम करता है.
डिसीज़न ट्री में, परम्यूटेशन वैरिएबल की अहमियत जैसे वैरिएबल की अहमियत को लागू किया जा सकता है.
डिसीज़न ट्री में भी वैरिएबल की अहमियत होती है. जैसे:
- किसी दिए गए वैरिएबल के साथ स्प्लिट स्कोर का योग.
- किसी दिए गए वैरिएबल वाले नोड की संख्या.
- सभी ट्री पाथ में किसी फ़ीचर की पहली बार दिखने की औसत गहराई.
वैरिएबल की अहमियत, इन बातों के हिसाब से अलग-अलग हो सकती है:
- सिमेंटिक
- स्केल
- प्रॉपर्टी
इसके अलावा, वैरिएबल की अहमियत से इनके बारे में अलग-अलग तरह की जानकारी मिलती है:
- मॉडल
- डेटासेट
- ट्रेनिंग की प्रोसेस
उदाहरण के लिए, किसी खास सुविधा वाली शर्तों की संख्या से पता चलता है कि डिसीज़न ट्री इस खास सुविधा को कितना देख रहा है. इससे वेरिएबल की अहमियत का पता चल सकता है. आखिरकार, अगर किसी सुविधा का कोई फ़ायदा नहीं होता, तो लर्निंग एल्गोरिदम कई स्थितियों में उसका इस्तेमाल नहीं करता. हालांकि, एक ही सुविधा के कई स्थितियों में दिखने से यह भी पता चल सकता है कि मॉडल किसी सुविधा के पैटर्न को सामान्य बनाने की कोशिश कर रहा है, लेकिन वह इसमें कामयाब नहीं हो पा रहा है. उदाहरण के लिए, ऐसा तब हो सकता है, जब कोई सुविधा सिर्फ़ एक उदाहरण के तौर पर दिया गया आइडेंटिफ़ायर हो और उसमें सामान्य जानकारी न हो.
दूसरी ओर, किसी वैरिएबल की अहमियत के लिए, वैरिएशन की संख्या ज़्यादा होने पर वैल्यू ज़्यादा होने का मतलब है कि किसी फ़ीचर को हटाने से मॉडल पर असर पड़ता है. यह वैरिएबल की अहमियत का संकेत है. हालांकि, अगर मॉडल बेहतर है, तो किसी एक सुविधा को हटाने से मॉडल पर असर नहीं पड़ सकता.
वैरिएबल की अलग-अलग अहमियत से, मॉडल के अलग-अलग पहलुओं के बारे में पता चलता है. इसलिए, एक ही समय पर कई वैरिएबल की अहमियत देखना जानकारी देने वाला होता है. उदाहरण के लिए, अगर कोई सुविधा सभी वैरिएबल के हिसाब से अहम है, तो हो सकता है कि वह सुविधा अहम हो. एक और उदाहरण के तौर पर, अगर किसी फ़ीचर में "नोड की संख्या" वैरिएबल की अहमियत ज़्यादा है और "परम्यूटेशन" वैरिएबल की अहमियत कम है, तो हो सकता है कि इस फ़ीचर को सामान्य बनाना मुश्किल हो. साथ ही, इससे मॉडल की क्वालिटी पर असर पड़ सकता है.
model.describe()
को कॉल करें और "वैरिएबल की अहमियत" टैब देखें.
ज़्यादा जानकारी के लिए,
मॉडल को समझने से जुड़ा ट्यूटोरियल देखें.