Les croisements de caractéristiques sont créés par croisement (en prenant le produit cartésien de) deux ou plus catégoriels ou répartis caractéristiques de l'ensemble de données. Comme une les transformations, les croisements de caractéristiques permettent aux modèles linéaires de gérer les non-linéarités. Croisements de caractéristiques encodent également les interactions entre les caractéristiques.
Prenons l'exemple d'un ensemble de données feuille avec les caractéristiques catégorielles suivantes:
edges
, contenant les valeurssmooth
,toothed
etlobed
arrangement
, contenant les valeursopposite
etalternate
Supposons que l'ordre ci-dessus corresponde à l'ordre des colonnes de caractéristiques dans une requête one-hot
de sorte qu'une feuille avec des bords smooth
et une disposition opposite
est représentée par {(1, 0, 0), (1, 0)}
.
Le croisement de caractéristiques, ou produit cartésien, de ces deux caractéristiques serait le suivant:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
où la valeur de chaque terme est le produit des valeurs des caractéristiques de base, que:
Smooth_Opposite = edges[0] * arrangement[0]
Toothed_Opposite = edges[1] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
Pour tout exemple donné dans l'ensemble de données, le croisement de caractéristiques est égal à 1 uniquement
les deux caractéristiques de base les vecteurs one-hot d'origine étaient de 1 pour les catégories croisées.
C'est-à-dire qu'une feuille de chêne avec un bord lobé et une disposition alternative aurait une
la valeur 1 uniquement pour Lobed_Alternate
, et le croisement de caractéristiques ci-dessus serait le suivant:
{0, 0, 0, 0, 0, 1}
Cet ensemble de données pourrait être utilisé pour classer les feuilles par espèce d'arbre, puisque ces les caractéristiques ne varient pas au sein d'une espèce.
Quand utiliser les croisements de caractéristiques
La connaissance du domaine peut suggérer une combinaison utile de fonctionnalités à traverser. Sans cette connaissance du domaine, il peut être difficile de déterminer des croisements de caractéristiques ou des transformations polynomiales efficaces, manuellement. C'est souvent possible, s'ils sont coûteux en calcul, d'utiliser réseaux de neurones trouver et appliquer automatiquement des combinaisons de caractéristiques utiles pendant l'entraînement.
Attention : le croisement de deux caractéristiques creuses produit des nouvelles que les deux caractéristiques d'origine. Par exemple, si la fonctionnalité A est une caractéristique creuse de 100 éléments et la caractéristique B est une caractéristique creuse de 200 éléments. le croisement de caractéristiques A et B donne une caractéristique creuse de 20 000 éléments.