Kursta öğrendiklerinizin kısa bir özetini aşağıda bulabilirsiniz:
- Karar ağacı, hiyerarşik olarak ağaç şeklinde düzenlenmiş bir koşul koleksiyonundan oluşan bir modeldir. Koşullar çeşitli kategorilere ayrılır:
- Ekseni hizalanmış koşul yalnızca tek bir özellik içerir. Eğik koşul birden fazla özellik içerir.
- İkili koşul iki olası sonuca sahiptir. İkiden fazla sonucu olan koşullu değişkenler için ikiden fazla olası sonuç vardır.
- Karar ağacını eğitmek, her düğümde en iyi koşulu aramayı içerir. Bölücü rutini, en iyi koşulu belirlemek için bilgi kazancı veya Gini gibi metrikleri kullanır.
- Karar ormanı, birden fazla karar ağacından oluşan bir moddur. Karar ormanının tahmini, karar ağaçlarının tahminlerinin toplamıdır.
- Rastgele orman, her karar ağacının belirli bir rastgele gürültüyle eğitildiği bir karar ağacı topluluğudur.
- Bagging, rastgele ormandaki her karar ağacının farklı bir örnek alt kümesiyle eğitildiği bir tekniktir.
- Rastgele ormanlar için doğrulama veri kümesi gerekmez. Bunun yerine, çoğu rastgele orman, modelin kalitesini değerlendirmek için out-of-bag-evaluation adlı bir teknik kullanır.
- Gradyan artırmalı (karar) ağaç, giriş karar ağaçlarından iteratif ayarlamalarla eğitilen bir karar ormanı türüdür. Küçültme adlı bir değer, gradyan artırılmış (karar) ağacının öğrenme hızını ve aşırı uyum sağlayabileceği dereceyi kontrol eder.
Referanslar
- Açgözlü İşlev Yaklaştırma: Gradyan Artırıcı Makine, J. Friedman.
- The Elements of Statistical Learning, Trevor Hastie. 10. Bölüm
- Generalized Boosted Models: A guide to the gbm package (Genelleştirilmiş Güçlendirilmiş Modeller: gbm paketi kılavuzu), G. Ridgeway