Kategorik veri: Özellik geçişleri

Özellik geçişleri, iki veya daha fazla kategorik ya da kovanın kartezyen çarpımını alma özellikleri hakkında daha fazla bilgi edinin. Örneğin, polinom dönüşümleri, özellik kesişimleri, doğrusal modellerin doğrusal olmayanlıkları ele almasına olanak tanır. Özellik çaprazları ve özellikler arasındaki etkileşimleri de kodlayabilir.

Örneğin, kategorik özelliklere sahip bir yaprak veri kümesi düşünün:

  • smooth, toothed ve lobed değerlerini içeren edges
  • opposite ve alternate değerlerini içeren arrangement

Yukarıdaki sıranın, özellik sütunlarının bir defada aynı sırada olduğunu varsayalım şekilde smooth kenarları ve opposite düzenlemesi olan bir yaprak {(1, 0, 0), (1, 0)} olarak temsil edilir.

Bu iki özelliğin çapraz veya Kartezyen ürünü şöyle olur:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

Burada her bir terimin değeri, temel özellik değerlerinin çarpımıdır; şu bilgileri sağlar:

  • Smooth_Opposite = edges[0] * arrangement[0]
  • Toothed_Opposite = edges[1] * arrangement[0]
  • Lobed_Alternate = edges[2] * arrangement[1]

Veri kümesindeki herhangi bir örnekte, özellik geçişi yalnızca aşağıdaki durumlarda 1'e eşit olur: iki temel özellik çapraz çizgili kategoriler için orijinal tek sıcak vektörler 1'di. Diğer bir deyişle, loblu kenarlı ve alternatif düzenlemeli meşe yaprağı değeri yalnızca Lobed_Alternate için 1'dir ve yukarıdaki özellik çarşısı şöyle olur:

{0, 0, 0, 0, 0, 1}

Bu veri kümesi, yaprakları ağaç türlerine göre sınıflandırmak için kullanılabilir, çünkü bu özellikleri bir tür içinde değişmeyecek.

Çapraz özellikler ne zaman kullanılır?

Alan bilgisi faydalı bir özellik kombinasyonu önerebilir geçmektir. Bu alan bilgisi olmadan, bir işin veya polinom dönüşümlerinin elle tutulur. Çoğunlukla mümkün olan pahalıya mal olacaksa nöral ağları Eğitim sırasında yararlı özellik kombinasyonlarını otomatik olarak bulup uygulama.

Dikkatli olun! İki seyrek özelliğin çapraz geçişlerinde daha da az yeni ve iki orijinal özellikten daha yüksek değildir. Örneğin, A özelliği bir 100 öğeli seyrek özellik ve B özelliği, 200 öğeli seyrek bir özelliktir. A ve B özellik çapraz çizgisi 20.000 öğelik seyrek bir özellik verir.