Jeśli na obrazie powyżej chcesz, aby b było bardziej podobne do a niż do c, którą miarę powinieneś wybrać?
Iloczyn skalarny
Dobrze! Iloczyn skalarny jest proporcjonalny do cosinusa i długości wektorów. Mimo że współczynnik cosinusa jest większy w przypadku kąta utworzonego przez wektory b i c niż w przypadku kąta utworzonego przez wektory b i c, większa długość wektora a powoduje, że iloczyn skalarny a i b jest większy niż iloczyn skalarny b i c.a
Odległość euklidesowa
Odległość jest mniejsza niż , co oznacza, że b jest bliżej c niż a.
Cosinus
Współczynnik cosinusa zależy tylko od kąta między wektorami, a im mniejszy kąt , tym większa wartość w porównaniu z .
obliczasz podobieństwo teledysków. Długość wektorów osadzania teledysków jest proporcjonalna do ich popularności. Aby obliczyć podobieństwo, zamiast cosinusa użyj mnożenia skala. Jak zmienia się podobieństwo między teledyskami?
Nic się nie zmieni.
Na iloczyn skalarny ma wpływ długość wektora. Duży wektor długości popularnych filmów zmieni (wcześniej cosinusową) miarę podobieństwa.
Popularne filmy stają się bardziej podobne do wszystkich filmów.
Na wynik mnożenia wektorów wpływają długości obu wektorów, więc długie wektory popularnych filmów sprawią, że będą one bardziej podobne do wszystkich filmów.
Popularne filmy stają się tylko bardziej podobne do innych popularnych filmów.
Pamiętaj, że iloczyn kropek oblicza się jako .
Zakładając, że a to popularny teledysk, wiemy, że jego długość, jest większa niż w przypadku niepopularnych filmów.
Im dłuższy ciąg znaków, tym większa jest wartość iloczynu skalarnego niezależnie od wartości . W efekcie popularne filmy stają się bardziej podobne do wszystkich innych filmów, a nie tylko do innych popularnych filmów.
Popularne filmy stają się mniej podobne do siebie niż do mniej popularnych filmów.
Ponieważ iloczyn skalarny rośnie wraz z długością wektora, a popularne filmy mają dużą długość wektora, miara podobieństwa będzie wzrastać, a nie maleć.
Przy założeniu takich samych danych jak w poprzednim pytaniu, załóżmy, że zamiast iloczynu skalarów użyjesz cosinusa. Jak zmienia się podobieństwo między teledyskami?
Popularne filmy stają się bardziej podobne tylko do siebie.
Długość wektorów nie ma wpływu na cosinus, więc przejście z produktu dot doprowadziłoby do zmniejszenia podobieństwa wszystkich popularnych filmów.
Popularne filmy stają się bardziej podobne do wszystkich filmów.
Długość wektorów nie ma wpływu na współczynnik cosinusa, więc przejście z produktu dot doprowadziłoby do zmniejszenia podobieństwa wszystkich popularnych filmów.
Popularne filmy stają się mniej podobne do wszystkich filmów.
Ponieważ długość wektora nie ma wpływu na cosinus, duża długość wektora popularnych embeddingów wideo nie wpływa na podobieństwo.
Dlatego przejście z iloczynu stycznego na cosinus zmniejsza podobieństwo między popularnymi filmami a wszystkimi innymi filmami.
Nic się nie zmieni.
Ponieważ długość wektora nie ma wpływu na wartość cosinusa, a na iloczyn skalarny ma, zamiana z iloczynu skalarnego na cosinus zmieni podobieństwa.
[null,null,["Ostatnia aktualizacja: 2025-02-25 UTC."],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]