Dane liczbowe: transformacje wielomianowe

Czasem, gdy specjalista ds. systemów uczących się ma wiedzę z danej dziedziny, która sugeruje, że jedna zmienna jest powiązana z kwadratem, sześcianem lub inną potęgą innej warto utworzyć funkcja syntetyczna z jednego istniejących funkcji liczbowych.

Przeanalizujmy następujący rozkład punktów danych, gdzie różowe okręgi oznaczają jedną klasę lub kategorię (np. gatunek drzewa) i zielone trójkąty; innej klasy (lub gatunku drzewa):

Rys. 17. Rozkład punktów danych w postaci y=x^2, pod trójkątami
            i okręgi nad krzywą.
Rysunek 17. Dwie klasy, których nie można rozdzielić wierszem.

Nie można narysować linii prostej, która oddzieli je wyraźnie , ale można narysować krzywą, która ma taką postać:

Rysunek 18. Ta sama grafika co na rysunku 17, tylko tym razem z y=x^2.
            nakłada się, by stworzyć wyraźną granicę między trójkątami
            kręgi.
Rysunek 18. rozdzielanie klas znakiem y = x2.

Jak już wspomnieliśmy w Moduł regresji liniowej, model liniowy z jedną cechą, x1, został opisany równaniem liniowym:

y=b+w1x1

Dodatkowe funkcje są obsługiwane przez dodanie warunków w2x2, w3x3itp.

Spadek gradientowy znajduje weight w1 (lub wagi w1, w2, w3w przypadku dodatkowych funkcji), który minimalizuje utratą modelu. Nie mogą one być jednak rozdzielone linią. Co można zrobić w tej sprawie?

Można zachować zarówno równanie liniowe, jak i zezwolić na nieliniowość definiując nowe hasło x2, nazywane x1 kwadratem:

x2=x12

Ta syntetyczna cecha, zwana przekształceniem wielomianowym, jest traktowana jak z inną funkcją. Poprzednia formuła liniowa zmieni się na:

y=b+w1x1+w2x2

Nadal można to potraktować jako regresja liniowa a wagi określane przez opadanie gradientowe, jak zwykle, zawierający element ukryty do kwadratu, transformatę wielomianową. Bez zmiany w trenowaniu modelu liniowego, dodanie transformacji wielomianowej umożliwia modelu do rozdzielania punktów danych za pomocą krzywej form y=b+szer.1x+szer.2x2.

Zazwyczaj dana funkcja liczbowa jest mnożona przez siebie, czyli podniesienie do pewnej mocy. Czasami specjalista ML może wyciągnąć świadome zgadywanie dla odpowiedniego wykładnika. Na przykład wiele relacji w wymiarze fizycznym światy są powiązane z wyrazami podniesionymi do kwadratu, łącznie z przyspieszeniem grawitacyjnym, absorpcja światła lub dźwięku w odległości oraz sprężysta energia potencjalna.

Pokrewne pojęcie w: dane kategorialne to cecha różna, a więcej często łączy 2 różne cechy.