Jeśli na obrazie powyżej chcesz, aby
b
było bardziej podobne do a
niż do c
, którą miarę powinieneś wybrać?Iloczyn skalarny
Dobrze! Iloczyn skalarny jest proporcjonalny do cosinusa i długości wektorów. Mimo że współczynnik cosinusa jest większy w przypadku kąta utworzonego przez wektory
b
i c
niż w przypadku kąta utworzonego przez wektory b
i c
, większa długość wektora a
powoduje, że iloczyn skalarny a
i b
jest większy niż iloczyn skalarny b
i c
.a
Cosinus
Współczynnik cosinusa zależy tylko od kąta między wektorami, a im mniejszy kąt \(\theta_{bc}\) , tym większa wartość \(\cos(\theta_{bc})\) w porównaniu z \(\cos(\theta_{ab})\).
Odległość euklidesowa
Odległość \(\vec{bc}\) jest mniejsza niż \(\vec{ab}\), co oznacza, że
b
jest bliżej c
niż a
.obliczasz podobieństwo teledysków. Długość wektorów osadzania teledysków jest proporcjonalna do ich popularności. Aby obliczyć podobieństwo, zamiast cosinusa użyj mnożenia skala. Jak zmienia się podobieństwo między teledyskami?
Popularne filmy stają się bardziej podobne do wszystkich filmów.
Na wynik mnożenia wektorów wpływają długości obu wektorów, więc długie wektory popularnych filmów sprawią, że będą one bardziej podobne do wszystkich filmów.
Popularne filmy stają się tylko bardziej podobne do innych popularnych filmów.
Pamiętaj, że iloczyn kropek oblicza się jako \(|a||b|\cos(\theta)\).
Zakładając, że
a
to popularny teledysk, wiemy, że jego długość, \(|a|\)jest większa niż w przypadku niepopularnych filmów.
Im dłuższy ciąg znaków, tym większa jest wartość iloczynu skalarnego niezależnie od wartości \(|b|\). W efekcie popularne filmy stają się bardziej podobne do wszystkich innych filmów, a nie tylko do innych popularnych filmów.
Popularne filmy stają się mniej podobne do siebie niż do mniej popularnych filmów.
Ponieważ iloczyn skalarny rośnie wraz z długością wektora, a popularne filmy mają dużą długość wektora, miara podobieństwa będzie wzrastać, a nie maleć.
Nic się nie zmieni.
Na iloczyn skalarny ma wpływ długość wektora. Duży wektor długości popularnych filmów zmieni (wcześniej cosinusową) miarę podobieństwa.
Przy założeniu takich samych danych jak w poprzednim pytaniu, załóżmy, że zamiast iloczynu skalarów użyjesz cosinusa. Jak zmienia się podobieństwo między teledyskami?
Popularne filmy stają się mniej podobne do wszystkich filmów.
Ponieważ długość wektora nie ma wpływu na cosinus, duża długość wektora popularnych embeddingów wideo nie wpływa na podobieństwo.
Dlatego przejście z iloczynu stycznego na cosinus zmniejsza podobieństwo między popularnymi filmami a wszystkimi innymi filmami.
Popularne filmy stają się bardziej podobne do wszystkich filmów.
Długość wektorów nie ma wpływu na współczynnik cosinusa, więc przejście z produktu dot doprowadziłoby do zmniejszenia podobieństwa wszystkich popularnych filmów.
Popularne filmy stają się bardziej podobne tylko do siebie.
Długość wektorów nie ma wpływu na cosinus, więc przejście z produktu dot doprowadziłoby do zmniejszenia podobieństwa wszystkich popularnych filmów.
Nic się nie zmieni.
Ponieważ długość wektora nie ma wpływu na wartość cosinusa, a na iloczyn skalarny ma, zamiana z iloczynu skalarnego na cosinus zmieni podobieństwa.