Üretim makine öğrenimi sistemleri: Sorulacak sorular

Bu ders, verilerinizle ilgili sormanız gereken sorulara odaklanıyor modellerine değineceğiz.

Bu özelliklerin her biri faydalı mı?

Projeye katkı sağlayan özellikleri kaldırmak için modelinizi sürekli olarak ya da hiç değer taşımadığı anlamına gelir. Giriş verileri özellik aniden değişiyorsa, modelinizin davranışı da aniden istenmeyen şekillerde değişiklik gösterebilir.

Aşağıdaki ilgili soruyu da göz önünde bulundurun:

  • Özelliğin faydası, ekleme maliyetini haklı çıkarır mı?

Modele her zaman daha fazla özellik eklemek cazip gelebilir. Örneğin, modelinizin tahminlerini yapan yeni bir özellik bulduğunuzu varsayalım biraz daha iyi oldu. Biraz daha iyi tahminler kesinlikle ama daha kötü tahminler Ancak ekstra özellik, daha küçük bir yük olabilir.

Veri kaynağınız güvenilir mi?

Giriş verilerinizin güvenilirliği hakkında sorabileceğiniz bazı sorular:

  • Sinyal her zaman kullanılabilir olacak mı yoksa güvenilir olmayan bir kaynak mı? Örnek:
    • Sinyal, ağır yük altında kilitlenen bir sunucudan mı geliyor?
    • Sinyal her ağustos ayında tatile çıkan insanlardan mı geliyor?
  • Modelinizin giriş verilerini hesaplayan sistem değişir mi? Öyleyse:
    • Ne sıklıkta?
    • Bu sistemin değiştiğini nasıl anlayacaksınız?

Dönüşüm izleme aracından aldığınız verilerin bir kopyasını bir üretim sürecidir. Ardından, yalnızca yukarı akışın bir sonraki sürümüne geçin verilerinizi güvenli bir şekilde kullanabileceğinizden emin olun.

Modeliniz bir geri bildirim döngüsünün parçası mı?

Bazen bir model kendi eğitim verilerini etkileyebilir. Örneğin, modellerden elde edilen sonuçlar da (doğrudan veya dolaylı olarak) girdiye dönüşür özelliklerini vurgular.

Bazen bir model başka bir modeli etkileyebilir. Örneğin iki hisse senedi fiyatlarını tahmin etmek için modeller:

  • A Modeli. Bu, kötü bir tahmin modelidir.
  • B Modeli.

A Modeli hatalı olduğundan yanlışlıkla X Stokundan hisse satın almaya karar verir. Bu satın alma işlemleri X Hissesinin fiyatını artırır. B modeli fiyatı kullanır olarak düşünebilirsiniz. Böylece, Model B bazı durumlarda yanlış olabilir hisse senedinin değeri hakkında bazı çıkarımlar olacak. Dolayısıyla, B modeli Model A'nın hatalı davranışından yola çıkarak X Hissesi'nin hisselerini alabilir veya satabilirsiniz. Dolayısıyla B Modelinin davranışı, Model A'yı etkileyebilir ve muhtemelen bir lale çılgınlığı veya X şirketinin hisse senedi.

Alıştırma: Öğrendiklerinizi sınayın

Aşağıdaki modellerden hangi üçü nasıl kullanıyorsun?
Otoyol çıkışlarındaki tıkanıklığı tahmin eden bir trafik öngörme modeli bir diğer özellik de sahildir.
Bazı sahil müdavimleri, planlarını büyük olasılıkla trafiğe dayandırır tahmin. Kumsalda kalabalıksa ve trafiğin birçok kişi alternatif planlar yapabilir. Bu durum plajda depresyona neden olabilir bu da daha hafif bir trafik tahminine neden olur. Bu da, ve döngü tekrar eder.
Kullanıcılarının hoşuna gidebilecek romanlar öneren bir kitap öneri modeli (ör. kitapların kaç defa izlendiğine göre) için geçerlidir).
Kitap önerilerinin satışları artırma olasılığı yüksektir ve bu ek satışlar da modele girdi olarak geri aktarılır. Böylece, aynı kitapları gelecekte duymuş olabilirsiniz.
Okulları kısmen kendi değerlerine göre derecelendiren bir üniversite sıralama modeli seçicilik: ödevini tamamlayan öğrencilerin oranı, kabul edilir.
Modelin sıralamaları, en yüksek puana sahip kullanıcılara daha fazla ilgi çekebilir başvurularının sayısını artırdılar. Bu aynı sayıda öğrenci kabul etmeye devam ettiğinden, seçicilik artar (kabul edilen öğrencilerin oranı düşecektir). Bu bu okulların proje performansını sıralamada daha da yükselir potansiyel öğrencilerin ilgi alanları vb.
Bir seçimin kazananını tahmin eden bir seçim sonuçları modeli sandıklar kapandıktan sonra seçmenlerin% 2'sine anket yaparak belediye başkanlığı yarışına karar verdi.
Model, anketler alınana kadar tahminini yayınlamazsa tahminlerinin seçmenleri etkilemesi mümkün değildir gösterir.
Ev fiyatlarını tahmin eden bir konut değeri modeli büyüklük (metrekare cinsinden alan), yatak odası sayısı ve coğrafi konum özellikler olarak ele alacağız.
Bir evin konumunu hızlı bir şekilde değiştirmek mümkün değildir, veya fiyat tahminlerine göre yatak odasının sayısını, geri bildirim döngüsünü riske atma. Ancak potansiyel olarak büyüklük ile yatak odası sayısı (daha büyük evler) arasında daha fazla oda olabilir).
Bir kişinin gülümsediğini algılayan bir yüz özelliği modeli toplanan fotoğraflardan oluşan bir veritabanı kullanılarak düzenli olarak eğitilen bir fotoğrafta otomatik olarak güncellenir.
Model tahminlerinde mevcut olmayan olduğundan, burada herhangi bir geri bildirim döngüsü üzerinde büyük bir etkisi olur. Ancak, girişin sürüm belirleme bu konudaki bir sorundur çünkü bu aylık güncellemeler, öngörülemeyen etkiler ortaya çıkabilir.