Sayısal veri: Sonuç

Makine öğrenimi (ML) modellerinin durumu, verilerine göre belirlenir. Feed'inizi sağlıklı veriler modeller ve başarılı olur, model çöp kutunuzu ve tahminlere bir değer katmayacaktır.

Sayısal verilerle çalışmaya yönelik en iyi uygulamalar:

  • Makine öğrenimi modelinizin özellik vektörü veriler için değil veri kümesini içermelidir.
  • En iyi şekilde normalleştirin sayısal özellikler
  • İlk normalleştirme stratejiniz başarılı olmazsa farklı bir strateji düşünün verilerinizi normalleştirmenin bir yoludur.
  • Bağlama olarak da adlandırılır. paketleme normalleştirmekten daha iyidir.
  • Verilerinizin nasıl olması gerektiğini göz önünde bulundurarak doğrulama yazın test etmek için kullanılır. Örnek:
    • Enlemin mutlak değeri hiçbir zaman 90'ı aşmamalıdır. Belgenizi verilerinizde 90'dan büyük bir enlem değerinin görünüp görünmediğini kontrol etmek için test edin.
    • Verileriniz Florida eyaletiyle sınırlıysa testler yazabilirsiniz enlemlerin 24 ile 31 arasında (24 ve 31 dahil) olup olmadığını kontrol etmek için kullanılır.
  • Verilerinizi dağılım grafikleri ve histogramlarla görselleştirin. Şunlara bakın: göz atabilirsiniz.
  • Yalnızca tüm veri kümesiyle ilgili değil, aynı zamanda daha küçük boyutlarla ilgili istatistikleri de toplayın alt kümelerini de oluşturabilirsiniz. Çünkü bazen toplu istatistiklerin veri kümesinin daha küçük bölümlerindeki problemleri belirsizleştirebilir.
  • Tüm veri dönüşümlerinizi belgeleyin.

Veriler en değerli kaynağınızdır; bu nedenle verileri dikkatli bir şekilde kullanın.

Ek Bilgiler

Sırada ne var?

Tebrikler, bu modülü tamamladınız.

Çeşitli MLCC modüllerini incelemenizi öneririz istediğiniz zaman değiştirebilirsiniz. Önerilen bir siparişi uygulamak isterseniz Şu modüle geçmenizi öneririz: Kategorik verileri temsil etme.


.