Dane liczbowe: transformacje wielomianowe

Czasem, gdy specjalista ds. systemów uczących się ma wiedzę z danej dziedziny, która sugeruje, że jedna zmienna jest powiązana z kwadratem, sześcianem lub inną potęgą innej warto utworzyć funkcja syntetyczna z jednego istniejących funkcji liczbowych.

Przeanalizujmy następujący rozkład punktów danych, gdzie różowe okręgi oznaczają jedną klasę lub kategorię (np. gatunek drzewa) i zielone trójkąty; innej klasy (lub gatunku drzewa):

Rys. 17. Rozkład punktów danych w postaci y=x^2, pod trójkątami
            i okręgi nad krzywą.
Rysunek 17. Dwie klasy, których nie można rozdzielić wierszem.

Nie można narysować linii prostej, która oddzieli je wyraźnie , ale można narysować krzywą, która ma taką postać:

Rysunek 18. Ta sama grafika co na rysunku 17, tylko tym razem z y=x^2.
            nakłada się, by stworzyć wyraźną granicę między trójkątami
            kręgi.
Rysunek 18. rozdzielanie klas znakiem y = x2.

Jak już wspomnieliśmy w Moduł regresji liniowej, model liniowy z jedną cechą, $x_1$, został opisany równaniem liniowym:

$$y = b + w_1x_1$$

Dodatkowe funkcje są obsługiwane przez dodanie warunków \(w_2x_2\), \(w_3x_3\)itp.

Spadek gradientowy znajduje weight $w_1$ (lub wagi \(w_1\), \(w_2\), \(w_3\)w przypadku dodatkowych funkcji), który minimalizuje utratą modelu. Nie mogą one być jednak rozdzielone linią. Co można zrobić w tej sprawie?

Można zachować zarówno równanie liniowe, jak i zezwolić na nieliniowość definiując nowe hasło \(x_2\), nazywane \(x_1\) kwadratem:

$$x_2 = x_1^2$$

Ta syntetyczna cecha, zwana przekształceniem wielomianowym, jest traktowana jak z inną funkcją. Poprzednia formuła liniowa zmieni się na:

$$y = b + w_1x_1 + w_2x_2$$

Nadal można to potraktować jako regresja liniowa a wagi określane przez opadanie gradientowe, jak zwykle, zawierający element ukryty do kwadratu, transformatę wielomianową. Bez zmiany w trenowaniu modelu liniowego, dodanie transformacji wielomianowej umożliwia modelu do rozdzielania punktów danych za pomocą krzywej form $y = b + szer._1x + szer._2x^2$.

Zazwyczaj dana funkcja liczbowa jest mnożona przez siebie, czyli podniesienie do pewnej mocy. Czasami specjalista ML może wyciągnąć świadome zgadywanie dla odpowiedniego wykładnika. Na przykład wiele relacji w wymiarze fizycznym światy są powiązane z wyrazami podniesionymi do kwadratu, łącznie z przyspieszeniem grawitacyjnym, absorpcja światła lub dźwięku w odległości oraz sprężysta energia potencjalna.

Pokrewne pojęcie w: dane kategorialne to cecha różna, a więcej często łączy 2 różne cechy.