Dati categorici: incroci di caratteristiche

Gli incroci di caratteristiche sono creati incrociato (considerando il prodotto cartesiano di) due o più categorie o bucket caratteristiche del set di dati. Come polinomiale trasformazioni, gli incroci di caratteristiche consentono ai modelli lineari di gestire le non linearità. Incroci di caratteristiche codificano anche le interazioni tra le caratteristiche.

Ad esempio, considera un set di dati foglia con le caratteristiche categoriche:

  • edges, contenente i valori smooth, toothed e lobed
  • arrangement, contenente i valori opposite e alternate

Supponi che l'ordine riportato sopra sia quello delle colonne delle caratteristiche in una in modo che una foglia con lati smooth e disposizione opposite è rappresentato come {(1, 0, 0), (1, 0)}.

L'incrocio di caratteristiche, o prodotto cartesiano, di queste due caratteristiche sarebbe:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

dove il valore di ogni termine è il prodotto dei valori delle caratteristiche di base, come che:

  • Smooth_Opposite = edges[0] * arrangement[0]
  • Toothed_Opposite = edges[1] * arrangement[0]
  • Lobed_Alternate = edges[2] * arrangement[1]

Per ogni dato esempio nel set di dati, l'incrocio di caratteristiche sarà uguale a 1 solo se entrambe le caratteristiche di base i vettori one-hot originali erano 1 per le categorie incrociate. In altre parole, una foglia di quercia con un bordo lobico e una disposizione alternativa avrebbe un valore 1 solo per Lobed_Alternate e l'incrocio di caratteristiche sopra riportato sarebbe:

{0, 0, 0, 0, 0, 1}

Questo set di dati potrebbe essere usato per classificare le foglie in base alle specie di alberi, poiché le caratteristiche non variano all'interno di una specie.

Quando utilizzare gli incroci di caratteristiche

La conoscenza settoriale può suggerire una combinazione utile di funzionalità da attraversare. Senza questa conoscenza settoriale, può essere difficile determinare incroci di caratteristiche o trasformazioni polinomiali efficaci manualmente. Spesso è possibile, se è costoso dal punto di vista computazionale, reti neurali Trovare e applicare automaticamente combinazioni di funzionalità utili durante l'addestramento.

Attenzione: se si intersecano due caratteristiche sparse, si ottiene un nuovo risultato ancora più scarno rispetto alle due caratteristiche originali. Ad esempio, se la caratteristica A è una La caratteristica sparsa di 100 elementi e la caratteristica B è una caratteristica sparsa di 200 elementi, un incrocio di caratteristiche di A e B restituisce una caratteristica sparsa di 20.000 elementi.