Bu ders, verilerinizle ilgili sormanız gereken sorulara odaklanıyor
modellerine değineceğiz.
Bu özelliklerin her biri faydalı mı?
Projeye katkı sağlayan özellikleri kaldırmak için modelinizi sürekli olarak
ya da hiç değer taşımadığı anlamına gelir. Giriş verileri
özellik aniden değişiyorsa, modelinizin davranışı da aniden
istenmeyen şekillerde değişiklik gösterebilir.
Aşağıdaki ilgili soruyu da göz önünde bulundurun:
- Özelliğin faydası, ekleme maliyetini haklı çıkarır mı?
Modele her zaman daha fazla özellik eklemek cazip gelebilir. Örneğin,
modelinizin tahminlerini yapan yeni bir özellik bulduğunuzu varsayalım
biraz daha iyi oldu. Biraz daha iyi tahminler kesinlikle
ama daha kötü tahminler Ancak ekstra özellik,
daha küçük bir yük olabilir.
Veri kaynağınız güvenilir mi?
Giriş verilerinizin güvenilirliği hakkında sorabileceğiniz bazı sorular:
- Sinyal her zaman kullanılabilir olacak mı yoksa
güvenilir olmayan bir kaynak mı? Örnek:
- Sinyal, ağır yük altında kilitlenen bir sunucudan mı geliyor?
- Sinyal her ağustos ayında tatile çıkan insanlardan mı geliyor?
- Modelinizin giriş verilerini hesaplayan sistem değişir mi? Öyleyse:
- Ne sıklıkta?
- Bu sistemin değiştiğini nasıl anlayacaksınız?
Dönüşüm izleme aracından aldığınız verilerin bir kopyasını
bir üretim sürecidir. Ardından, yalnızca yukarı akışın bir sonraki sürümüne geçin
verilerinizi güvenli bir şekilde kullanabileceğinizden emin olun.
Modeliniz bir geri bildirim döngüsünün parçası mı?
Bazen bir model kendi eğitim verilerini etkileyebilir. Örneğin,
modellerden elde edilen sonuçlar da (doğrudan veya dolaylı olarak) girdiye dönüşür
özelliklerini vurgular.
Bazen bir model başka bir modeli etkileyebilir. Örneğin iki
hisse senedi fiyatlarını tahmin etmek için modeller:
- A Modeli. Bu, kötü bir tahmin modelidir.
- B Modeli.
A Modeli hatalı olduğundan yanlışlıkla X Stokundan hisse satın almaya karar verir.
Bu satın alma işlemleri X Hissesinin fiyatını artırır. B modeli fiyatı kullanır
olarak düşünebilirsiniz. Böylece, Model B bazı durumlarda yanlış olabilir
hisse senedinin değeri hakkında bazı çıkarımlar olacak. Dolayısıyla, B modeli
Model A'nın hatalı davranışından yola çıkarak X Hissesi'nin hisselerini alabilir veya satabilirsiniz.
Dolayısıyla B Modelinin davranışı, Model A'yı etkileyebilir ve muhtemelen bir
lale çılgınlığı veya
X şirketinin hisse senedi.
Alıştırma: Öğrendiklerinizi sınayın
Aşağıdaki modellerden hangi üçü
nasıl kullanıyorsun?
Otoyol çıkışlarındaki tıkanıklığı tahmin eden bir trafik öngörme modeli
bir diğer özellik de sahildir.
Bazı sahil müdavimleri, planlarını büyük olasılıkla trafiğe dayandırır
tahmin. Kumsalda kalabalıksa ve trafiğin
birçok kişi alternatif planlar yapabilir. Bu durum plajda depresyona neden olabilir
bu da daha hafif bir trafik tahminine neden olur. Bu da,
ve döngü tekrar eder.
Kullanıcılarının hoşuna gidebilecek romanlar öneren bir kitap öneri modeli
(ör. kitapların kaç defa izlendiğine göre)
için geçerlidir).
Kitap önerilerinin satışları artırma olasılığı yüksektir ve bu
ek satışlar da modele girdi olarak geri aktarılır.
Böylece, aynı kitapları gelecekte
duymuş olabilirsiniz.
Okulları kısmen kendi değerlerine göre derecelendiren bir üniversite sıralama modeli
seçicilik: ödevini tamamlayan öğrencilerin oranı,
kabul edilir.
Modelin sıralamaları, en yüksek puana sahip kullanıcılara daha fazla ilgi çekebilir
başvurularının sayısını artırdılar. Bu
aynı sayıda öğrenci kabul etmeye devam ettiğinden, seçicilik
artar (kabul edilen öğrencilerin oranı düşecektir). Bu
bu okulların proje performansını sıralamada daha da yükselir
potansiyel öğrencilerin ilgi alanları vb.
Bir seçimin kazananını tahmin eden bir seçim sonuçları modeli
sandıklar kapandıktan sonra seçmenlerin% 2'sine anket yaparak belediye başkanlığı yarışına karar verdi.
Model, anketler alınana kadar tahminini yayınlamazsa
tahminlerinin seçmenleri etkilemesi mümkün değildir
gösterir.
Ev fiyatlarını tahmin eden bir konut değeri modeli
büyüklük (metrekare cinsinden alan), yatak odası sayısı ve coğrafi konum
özellikler olarak ele alacağız.
Bir evin konumunu hızlı bir şekilde değiştirmek mümkün değildir,
veya fiyat tahminlerine göre yatak odasının sayısını,
geri bildirim döngüsünü riske atma. Ancak potansiyel olarak
büyüklük ile yatak odası sayısı (daha büyük evler) arasında
daha fazla oda olabilir).
Bir kişinin gülümsediğini algılayan bir yüz özelliği modeli
toplanan fotoğraflardan oluşan bir veritabanı kullanılarak düzenli olarak eğitilen bir fotoğrafta
otomatik olarak güncellenir.
Model tahminlerinde mevcut olmayan olduğundan, burada herhangi bir geri bildirim döngüsü
üzerinde büyük bir etkisi olur. Ancak, girişin sürüm belirleme
bu konudaki bir sorundur çünkü bu aylık güncellemeler,
öngörülemeyen etkiler ortaya çıkabilir.