Gli incroci di caratteristiche sono creati incrociato (considerando il prodotto cartesiano di) due o più categorie o bucket caratteristiche del set di dati. Come polinomiale trasformazioni, gli incroci di caratteristiche consentono ai modelli lineari di gestire le non linearità. Incroci di caratteristiche codificano anche le interazioni tra le caratteristiche.
Ad esempio, considera un set di dati foglia con le caratteristiche categoriche:
edges
, contenente i valorismooth
,toothed
elobed
arrangement
, contenente i valoriopposite
ealternate
Supponi che l'ordine riportato sopra sia quello delle colonne delle caratteristiche in una
in modo che una foglia con lati smooth
e disposizione opposite
è rappresentato come {(1, 0, 0), (1, 0)}
.
L'incrocio di caratteristiche, o prodotto cartesiano, di queste due caratteristiche sarebbe:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
dove il valore di ogni termine è il prodotto dei valori delle caratteristiche di base, come che:
Smooth_Opposite = edges[0] * arrangement[0]
Toothed_Opposite = edges[1] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
Per ogni dato esempio nel set di dati, l'incrocio di caratteristiche sarà uguale a 1 solo se
entrambe le caratteristiche di base i vettori one-hot originali erano 1 per le categorie incrociate.
In altre parole, una foglia di quercia con un bordo lobico e una disposizione alternativa avrebbe un
valore 1 solo per Lobed_Alternate
e l'incrocio di caratteristiche sopra riportato sarebbe:
{0, 0, 0, 0, 0, 1}
Questo set di dati potrebbe essere usato per classificare le foglie in base alle specie di alberi, poiché le caratteristiche non variano all'interno di una specie.
Quando utilizzare gli incroci di caratteristiche
La conoscenza settoriale può suggerire una combinazione utile di funzionalità da attraversare. Senza questa conoscenza settoriale, può essere difficile determinare incroci di caratteristiche o trasformazioni polinomiali efficaci manualmente. Spesso è possibile, se dal punto di vista delle risorse computazionali, reti neurali Trovare e applicare automaticamente combinazioni di funzionalità utili durante l'addestramento.
Attenzione: se si intersecano due caratteristiche sparse, si ottiene un nuovo risultato ancora più scarno rispetto alle due caratteristiche originali. Ad esempio, se la caratteristica A è una La caratteristica sparsa di 100 elementi e la caratteristica B è una caratteristica sparsa di 200 elementi, un incrocio di caratteristiche di A e B restituisce una caratteristica sparsa di 20.000 elementi.