Dans l'image ci-dessus, si vous souhaitez que b soit plus semblable à a qu'à c, quelle mesure devez-vous choisir ?
Distance euclidienne
La distance est inférieure à , ce qui placeb plus près dec que dea.
Cosinus
Le cosinus ne dépend que de l'angle entre les vecteurs, et plus l'angle est petit, plus est grand que .
Produit scalaire
Bonne réponse ! Le produit scalaire est proportionnel au cosinus et à la longueur des vecteurs. Par conséquent, même si le cosinus est plus élevé pour l'angle formé par b et c que pour l'angle formé par b et a, la plus grande longueur du vecteur a rend le produit scalaire de a et b supérieur au produit scalaire de b et c.
Vous calculez la similarité pour les clips musicaux. La longueur des vecteurs d'embedding des clips musicaux est proportionnelle à leur popularité. Vous passez du cosinus au produit scalaire pour calculer la similarité. Comment la similarité entre les clips musicaux change-t-elle ?
Aucun changement.
Le produit scalaire est affecté par la longueur du vecteur. La longueur élevée des vecteurs des vidéos populaires modifie la mesure de similarité (anciennement cosinus).
Les vidéos populaires deviennent moins similaires les unes aux autres que les vidéos moins populaires.
Étant donné que le produit scalaire augmente avec la longueur du vecteur et que les vidéos populaires ont une longueur de vecteur élevée, la mesure de similarité augmente, et non diminue.
Les vidéos populaires deviennent plus semblables à toutes les vidéos en général.
Étant donné que le produit scalaire est affecté par la longueur des deux vecteurs, la grande longueur des vecteurs des vidéos populaires les rend plus semblables à toutes les vidéos.
Les vidéos populaires ne deviennent que plus similaires aux autres vidéos populaires.
Rappelez-vous que le produit scalaire est calculé comme .
En supposant que a soit un clip musical populaire, nous savons que sa longueur d'intégration, , est supérieure à celle des vidéos peu populaires.
Plus la longueur est grande, plus le produit scalaire augmente, quelle que soit la valeur de . Par conséquent, les vidéos populaires deviennent plus semblables à toutes les autres vidéos, et pas seulement aux autres vidéos populaires.
Pour la même configuration que la question précédente, supposons que vous reveniez au cosinus à partir du produit scalaire. Comment la similarité entre les clips musicaux évolue-t-elle ?
Les vidéos populaires deviennent plus semblables à toutes les vidéos.
Le cosinus n'est pas affecté par la longueur des vecteurs. Par conséquent, si vous passez du produit scalaire au cosinus, les similitudes de toutes les vidéos populaires diminueront.
Les vidéos populaires deviennent moins similaires à toutes les vidéos.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, la grande longueur des vecteurs des représentations vectorielles continues populaires ne contribue pas à la similarité.
Par conséquent, passer du produit scalaire au cosinus réduit la similarité entre les vidéos populaires et toutes les autres vidéos.
Les vidéos populaires ne se ressemblent que les unes aux autres.
Le cosinus n'est pas affecté par la longueur des vecteurs. Par conséquent, si vous passez du produit scalaire au cosinus, les similitudes de toutes les vidéos populaires diminueront.
Aucun changement.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, contrairement au produit scalaire, passer du produit scalaire au cosinus modifie les similarités.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/02/25 (UTC).
[null,null,["Dernière mise à jour le 2025/02/25 (UTC)."],[[["Dot product considers both angle and magnitude of vectors, making vectors with larger magnitudes more similar despite the angle between them."],["Cosine similarity only considers the angle between vectors, disregarding their magnitudes."],["Switching from cosine to dot product for similarity calculation makes popular items (with larger vector magnitudes) more similar to all other items."],["Switching back from dot product to cosine similarity normalizes the effect of magnitude, making popular items less biased towards similarity with all other items."]]],[]]