Krzyżówki są tworzone przez krzyżowanie (pobierając iloczyn kartezjański) co najmniej dwóch lub więcej kategoryzowanych lub grupowanych funkcji zbioru danych. Jak wielomian przekształcenia, krzyże cech pozwalają modelom liniowym obsługiwać krzywe nieliniowe. Krzyżówki kodować interakcje między cechami.
Weźmy na przykład zbiór danych liści z cechami kategorialnymi:
edges
, które zawierają wartoścismooth
,toothed
ilobed
arrangement
, zawierające wartościopposite
ialternate
Załóżmy, że ustalona kolejność jest porządkiem kolumn cech
reprezentacja, aby liść z krawędziami smooth
i rozmieszczeniem opposite
jest reprezentowany jako {(1, 0, 0), (1, 0)}
.
Krzywa cech, czyli iloczyn kartezjański, wyglądałaby następująco:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
gdzie wartość każdego hasła jest iloczynem wartości cech podstawowych, które:
Smooth_Opposite = edges[0] * arrangement[0]
Toothed_Opposite = edges[1] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
W każdym przykładzie w zbiorze danych krzyżówka będzie równa 1 tylko wtedy,
obu funkcji podstawowych oryginalne, gorące wektory stanowią 1 dla przecinających się kategorii.
Oznacza to, że liść dębu z klapowanymi krawędziami i alternatywnym układem ma
tylko wartość 1 dla Lobed_Alternate
, a krzyżyk funkcji powyżej wyglądałby następująco:
{0, 0, 0, 0, 0, 1}
Ten zbiór danych mógłby posłużyć do klasyfikowania liści według gatunków drzew, nie zmieniają się w obrębie gatunku.
Kiedy używać przecinków funkcji
Wiedza na temat danej dziedziny może wskazywać na przydatną kombinację funkcji do przejścia. Bez takiej wiedzy trudno określić, efektywne krzyże cech lub przekształcenia wielomianowe ręcznie. Często jest możliwe, jeśli będzie to kosztowne pod względem obliczeń, można użyć sieci neuronowych do automatycznie znajdować i stosować przydatne kombinacje funkcji podczas trenowania.
Zachowaj ostrożność – przełączenie dwóch rozproszonych funkcji skutkuje jeszcze słabszym wynikiem niż w przypadku tych 2 funkcji. Na przykład, jeśli cecha A jest Funkcja rozproszona o 100 elementach i funkcja B to obiekt rozproszony o długości 200 elementów. krzyż cech A i B zwraca cechę rozproszoną obejmującą 20 000 elementów.