Değişken önemleri
Değişken önemi (özellik önemi olarak da bilinir), bir özelliğin model için ne kadar "önemli" olduğunu gösteren bir puandır. Örneğin, "f1" ve "f2" olmak üzere iki giriş özelliğine sahip belirli bir model için değişken önemleri {f1=5,8, f2=2,5} ise "f1" özelliği model için "f2" özelliğinden daha "önemlidir". Diğer makine öğrenimi modellerinde olduğu gibi, değişken önemi, bir karar ağacının nasıl çalıştığını anlamanın basit bir yoludur.
Karar ağaçlarında değişiklik değişkeni önemleri gibi modelden bağımsız değişken önemlerini uygulayabilirsiniz.
Karar ağaçlarında, değişkenler için belirli önemler de vardır. Örneğin:
- Belirli bir değişkenle bölünmüş puanın toplamı.
- Belirli bir değişkene sahip düğümlerin sayısı.
- Bir özelliğin tüm ağaç yollarında ilk kez ortaya çıkmasının ortalama derinliği.
Değişken önemleri aşağıdaki gibi niteliklere göre farklılık gösterebilir:
- anlam bilimi
- yararlanın
- mülkler
Ayrıca, değişken önemleri aşağıdakiler hakkında farklı türde bilgiler sağlar:
- model
- veri kümesi
- eğitim süreci
Örneğin, belirli bir özelliği içeren koşulların sayısı, bir karar ağacının bu özelliğe ne kadar önem verdiğini gösterir. Bu da değişkenin önemini gösterebilir. Öğrenme algoritması, önemli olmasaydı bir özelliği birden fazla koşulda kullanmazdı. Ancak aynı özelliğin birden fazla koşulda görünmesi, bir modelin bir özelliğin kalıbını genelleştirmeye çalıştığını ancak bunu başaramadığını da gösterebilir. Örneğin, bu durum bir özellik genelleştirilecek bilgi içermeyen örnek bir tanımlayıcı olduğunda ortaya çıkabilir.
Öte yandan, yüksek permütasyon değişkeni önemi için yüksek bir değer, bir özelliğin kaldırılmasının modeli olumsuz etkilediğini gösterir. Bu da değişken öneminin bir göstergesidir. Ancak model güçlüyse bir özelliği kaldırmak modele zarar vermeyebilir.
Farklı değişken önemleri, modellerin farklı yönleri hakkında bilgi verdiğinden aynı anda birden fazla değişken önemine bakmak faydalıdır. Örneğin, tüm değişken önemlerine göre önemli olan bir özellik muhtemelen önemlidir. Başka bir örnek olarak, bir özelliğin "düğüm sayısı" değişken önemi yüksek ve "permütasyon" değişken önemi düşükse bu özelliğin genellenmesi zor olabilir ve model kalitesini olumsuz yönde etkileyebilir.
model.describe()
işlevini çağırıp "değişken önemi" sekmesine bakarak bir modelin değişken önemini görebilirsiniz.
Daha fazla bilgi için
Modelleri anlama eğitimi başlıklı makaleyi inceleyin.