Veri kümeleri: Verileri dönüştürme

Makine öğrenimi modelleri yalnızca kayan nokta değerleriyle eğitilebilir. Ancak birçok veri kümesi özelliği doğal olarak kayan nokta değerleri değildir. Bu nedenle makine öğreniminin önemli bir parçası, kayan nokta temsillerine uygulayabilirsiniz.

Örneğin, street names ürününün bir özellik olduğunu varsayalım. Çoğu sokak adı "Broadway" gibi dizeler veya "Vilakazi". Modeliniz "Broadway"de eğitilemediği için "Broadway"i dönüştürmeniz gerekir bir sayıya dönüştürülebilir. Kategorik Veriler modülünü nasıl yapılacağını açıklıyor.

Buna ek olarak, çoğu kayan nokta özelliğini de dönüştürmeniz gerekir. Adı verilen bu dönüştürme sürecine normalleştirme, dönüştürme işlemi kayan nokta sayılarının model eğitimini iyileştiren kısıtlı bir aralığa uymasını sağlar. Sayısal Veriler modülünü nasıl yapılacağını açıklıyor.

Çok fazla olduğunda örnek veriler

Bazı kuruluşlar bol miktarda veri sağlar. . Veri kümesi çok fazla örnek içerdiğinde bir alt küme seçmeniz gerekir örnek olarak verilebilir. Mümkün olduğunda, müşterinize en uygun olan alt kümeyi alakalı olabilir.

Kimliği tanımlayabilecek bilgiler içeren filtre örnekleri

İyi veri kümeleri, Kimliği Tanımlayabilecek Bilgiler içeren örnekleri içermez. (PII) Bu politika, gizliliğin korunmasına yardımcı olur ancak modeli etkileyebilir.

Bu konularla ilgili daha fazla bilgi edinmek için kursun sonraki adımlarında Güvenlik ve Gizlilik modülüne bakabilirsiniz.

.