Na imagem acima, se você quiser que b seja mais semelhante a
a do que a c, qual medida você deve escolher?
Produto escalar
Correto! O produto escalar é proporcional ao cosseno e aos
comprimentos dos vetores. Portanto, embora o cosseno seja maior para o ângulo
formado por b e c do que para o ângulo formado
por b e a, o comprimento do vetor maior de
a faz com que o produto escalar de a e
b seja maior do que o produto escalar de b e
c.
Distância euclidiana
A distância é menor que , deixando
b mais próximo de c do que de a.
Cosseno
O cosseno depende apenas do ângulo entre os vetores, e o ângulo menor
faz com que seja maior que
.
Você está calculando a similaridade de videoclipes. O comprimento dos
vetores de embedding de videoclipes é proporcional à popularidade deles. Você
muda de cosseno para produto escalar para calcular a similaridade. Como a
semelhança entre os videoclipes muda?
Os vídeos em alta só ficam mais semelhantes a outros vídeos em alta.
O produto escalar é calculado como .
Supondo que a seja um videoclipe popular, sabemos que o
comprimento da incorporação, , é maior do que o de vídeos não populares.
O comprimento maior aumenta o
produto escalar, independentemente do valor de . Assim, os vídeos populares
ficam mais parecidos com todos os outros, não apenas com outros vídeos populares.
Os vídeos em alta ficam mais semelhantes a todos os vídeos em geral.
Como o produto escalar é afetado pelas medidas dos dois vetores, a
grande extensão dos vídeos mais populares os torna mais semelhantes a todos
os vídeos.
Não houve alterações.
O produto escalar é afetado pelo comprimento do vetor. O comprimento de vetor alto de
vídeos populares vai mudar a medida de similaridade (anteriormente cosseno).
Os vídeos mais populares são menos semelhantes entre si do que
vídeos menos populares.
Como o produto escalar aumenta com o comprimento do vetor, e os vídeos populares têm
comprimento de vetor alto, a medida de similaridade vai aumentar, não diminuir.
Considerando a mesma configuração da pergunta anterior, suponha que você volte
para o cosseno do produto escalar. Como a semelhança entre os videoclipes muda?
Os vídeos em alta ficam mais semelhantes a todos os outros.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar
vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Os vídeos em alta ficam mais semelhantes apenas entre si.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar
vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Não houve alterações.
Como o cosseno não é afetado pelo comprimento do vetor, enquanto o produto escalar é,
mudar do produto escalar para o cosseno vai mudar as semelhanças.
Os vídeos em alta ficam menos semelhantes a todos os outros.
Como o cosseno não é afetado pelo comprimento do vetor, o comprimento do vetor grande
das incorporações de vídeo mais conhecidas não contribui para a semelhança.
Assim, a mudança para o cosseno do produto escalar reduz a semelhança
entre os vídeos populares e todos os outros vídeos.
[null,null,["Última atualização 2025-02-25 UTC."],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]