Değişken önemleri
Değişken önem düzeyi (özellik önemi olarak da bilinir), bir özelliğin model için ne kadar "önemli" olduğunu belirten bir puandır. Örneğin, "f1" ve "f2" giriş özelliklerine sahip bir model için değişken önemleri {f1=5.8, f2=2.5} ise "f1" özelliği model için "f2" özelliğinden daha "önemli" olur. Diğer makine öğrenimi modellerinde olduğu gibi değişken önem, karar ağacının nasıl çalıştığını anlamanın basit bir yoludur.
Karar ağaçlarına, permütasyon değişkeni önem değerleri gibi modelden bağımsız değişken önemleri uygulayabilirsiniz.
Karar ağaçlarının aşağıdakiler gibi belirli değişken önemleri de vardır:
- Belirli bir değişkene göre bölme puanının toplamı.
- Belirli bir değişkene sahip düğüm sayısı.
- Tüm ağaç yollarında bir özelliğin ilk geçtiği yerin ortalama derinliği.
Değişken önemleri, aşağıdaki gibi niteliklere göre farklılık gösterebilir:
- anlambilim
- yararlanın
- mülkler
Ayrıca, değişken önem derecesi aşağıdakiler hakkında farklı türde bilgiler sağlar:
- model
- veri kümesi
- eğitim süreci
Örneğin, belirli bir özelliği içeren koşulların sayısı, bir karar ağacının bu belirli özelliğe ne kadar baktığını gösterir ve değişken önem düzeyini gösterebilir. Ne de olsa öğrenme algoritması, önemli olmasaydı bir özelliği birden fazla koşulda kullanamazdı. Bununla birlikte, aynı özelliğin birden fazla koşulda görünmesi, bir modelin bir özelliğin kalıbını genellemeye çalıştığını ancak bu kalıbı genelleştiremediğini de gösterebilir. Örneğin, bir özellik yalnızca örnek bir tanımlayıcı olduğunda ve genelleştirilecek herhangi bir bilgi olmadığında bu durum görülebilir.
Öte yandan, yüksek permütasyon değişkeni önem için yüksek bir değer, bir özelliği kaldırmanın modele zarar verdiğini gösterir ve bu durum değişkenin öneminin bir göstergesidir. Ancak model sağlamsa herhangi bir özelliği kaldırmak modele zarar vermeyebilir.
Farklı değişken önemleri modellerin farklı yönleri hakkında bilgi verdiğinden, aynı anda birkaç değişken önem derecesine bakmak bilgilendirici olur. Örneğin, bir özellik tüm değişken önem derecelerine göre önemliyse, bu özellik muhtemelen de önemlidir. Başka bir örnek olarak, bir özelliğin "düğüm sayısı" değişken önemi yüksek ve "permütasyon" değişken önem düzeyi küçükse bu özelliğin genelleştirilmesi zor olabilir ve model kalitesine zarar verebilir.
model.describe()
yöntemini çağırıp "değişken önem düzeyi" sekmesine bakarak bir modelin değişken önemini görebilirsiniz.
Daha ayrıntılı bilgi için
Model anlama eğiticisine bakın.