Dane kategorialne: przekrój cech

Krzyżówki są tworzone przez krzyżowanie (pobierając iloczyn kartezjański) co najmniej dwóch lub więcej kategoryzowanych lub grupowanych funkcji zbioru danych. Jak wielomian przekształcenia, krzyże cech pozwalają modelom liniowym obsługiwać krzywe nieliniowe. Krzyżówki kodować interakcje między cechami.

Weźmy na przykład zbiór danych liści z cechami kategorialnymi:

  • edges, które zawierają wartości smooth, toothed i lobed
  • arrangement, zawierające wartości opposite i alternate

Załóżmy, że ustalona kolejność jest porządkiem kolumn cech reprezentacja, aby liść z krawędziami smooth i rozmieszczeniem opposite jest reprezentowany jako {(1, 0, 0), (1, 0)}.

Krzywa cech, czyli iloczyn kartezjański, wyglądałaby następująco:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

gdzie wartość każdego hasła jest iloczynem wartości cech podstawowych, które:

  • Smooth_Opposite = edges[0] * arrangement[0]
  • Toothed_Opposite = edges[1] * arrangement[0]
  • Lobed_Alternate = edges[2] * arrangement[1]

W każdym przykładzie w zbiorze danych krzyżówka będzie równa 1 tylko wtedy, obu funkcji podstawowych oryginalne, gorące wektory stanowią 1 dla przecinających się kategorii. Oznacza to, że liść dębu z klapowanymi krawędziami i alternatywnym układem ma tylko wartość 1 dla Lobed_Alternate, a krzyżyk funkcji powyżej wyglądałby następująco:

{0, 0, 0, 0, 0, 1}

Ten zbiór danych mógłby posłużyć do klasyfikowania liści według gatunków drzew, nie zmieniają się w obrębie gatunku.

Kiedy używać przecinków funkcji

Wiedza na temat danej dziedziny może wskazywać na przydatną kombinację funkcji do przejścia. Bez takiej wiedzy trudno określić, efektywne krzyże cech lub przekształcenia wielomianowe ręcznie. Często jest możliwe, jeśli będzie to kosztowne pod względem obliczeń, można użyć sieci neuronowych do automatycznie znajdować i stosować przydatne kombinacje funkcji podczas trenowania.

Zachowaj ostrożność – przełączenie dwóch rozproszonych funkcji skutkuje jeszcze słabszym wynikiem niż w przypadku tych 2 funkcji. Na przykład, jeśli cecha A jest Funkcja rozproszona o 100 elementach i funkcja B to obiekt rozproszony o długości 200 elementów. krzyż cech A i B zwraca cechę rozproszoną obejmującą 20 000 elementów.