Если на изображении выше вы хотите, чтобы b было больше похоже на a чем на c , какую меру выбрать?
Косинус
Косинус зависит только от угла между векторами, причем меньший угол делает больше, чем .
Скалярное произведение
Правильный! Скалярное произведение пропорционально косинусу и длинам векторов. Таким образом, хотя косинус для угла, образованного b и c , выше, чем для угла, образованного b и a , большая длина вектора a делает скалярное произведение a и b больше, чем скалярное произведение b и c .
Евклидово расстояние
Расстояние меньше, чем , оставляя b ближе к c чем к a .
Вы рассчитываете сходство музыкальных клипов. Длина векторов встраивания музыкальных клипов пропорциональна их популярности. Вы переключаетесь с косинуса на скалярное произведение, чтобы вычислить сходство. Как меняется сходство музыкальных клипов?
Никаких изменений.
Скалярное произведение зависит от длины вектора. Большая векторная длина популярных видео изменит меру сходства (ранее косинусную).
Популярные видео становятся менее похожими друг на друга, чем на менее популярные.
Поскольку скалярное произведение увеличивается с увеличением длины вектора, а популярные видео имеют большую длину вектора, мера сходства будет увеличиваться, а не уменьшаться.
Популярные видео становятся более похожими на все видео в целом.
Поскольку на скалярное произведение влияют длины обоих векторов, большая длина векторов популярных видео сделает их более похожими на все видео.
Популярные видео становятся все более похожими на другие популярные видео.
Напомним, что скалярное произведение рассчитывается как . Предполагая, что a популярный музыкальный клип, мы знаем его длину встраивания, , больше, чем у непопулярных видео. Большая длина увеличивает скалярное произведение независимо от значения . Следовательно, популярные видео становятся более похожими на все другие видео, а не только на другие популярные видео.
Учитывая ту же настройку, что и в предыдущем вопросе, предположим, что вы снова переключаетесь на косинус со скалярного произведения. Как меняется сходство музыкальных клипов?
Никаких изменений.
Поскольку длина вектора не влияет на косинус, в отличие от скалярного произведения, переключение со скалярного произведения на косинус изменит сходство.
Популярные видеоролики становятся только более похожими друг на друга.
Длина векторов не влияет на косинус, поэтому переход от скалярного произведения приведет к уменьшению сходства всех популярных видео.
Популярные видео становятся более похожими на все видео.
Длина векторов не влияет на косинус, поэтому переход от скалярного произведения приведет к уменьшению сходства всех популярных видео.
Популярные видео становятся менее похожими на все видео.
Поскольку длина вектора не влияет на косинус, большая длина вектора популярных вложений видео не способствует сходству. Таким образом, переход от скалярного произведения к косинусу уменьшает сходство между популярными видео и всеми остальными видео.
[null,null,["Последнее обновление: 2025-02-25 UTC."],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]