Dans l'image ci-dessus, si vous souhaitez que
b
soit plus semblable à a
qu'à c
, quelle mesure devez-vous choisir ?Produit scalaire
Bonne réponse ! Le produit scalaire est proportionnel au cosinus et à la longueur des vecteurs. Par conséquent, même si le cosinus est plus élevé pour l'angle formé par
b
et c
que pour l'angle formé par b
et a
, la plus grande longueur du vecteur a
rend le produit scalaire de a
et b
supérieur au produit scalaire de b
et c
.
Cosinus
Le cosinus ne dépend que de l'angle entre les vecteurs, et plus l'angle est petit, plus \(\cos(\theta_{bc})\) est grand que \(\cos(\theta_{ab})\). \(\theta_{bc}\)
Distance euclidienne
La distance \(\vec{bc}\) est inférieure à \(\vec{ab}\), ce qui place
b
plus près dec
que dea
.Vous calculez la similarité pour les clips musicaux. La longueur des vecteurs d'embedding des clips musicaux est proportionnelle à leur popularité. Vous passez du cosinus au produit scalaire pour calculer la similarité. Comment la similarité entre les clips musicaux change-t-elle ?
Les vidéos populaires deviennent plus semblables à toutes les vidéos en général.
Étant donné que le produit scalaire est affecté par la longueur des deux vecteurs, la grande longueur des vecteurs des vidéos populaires les rend plus semblables à toutes les vidéos.
Les vidéos populaires ne deviennent que plus similaires aux autres vidéos populaires.
Rappelez-vous que le produit scalaire est calculé comme \(|a||b|\cos(\theta)\).
En supposant que
a
soit un clip musical populaire, nous savons que sa longueur d'intégration, \(|a|\), est supérieure à celle des vidéos peu populaires.
Plus la longueur est grande, plus le produit scalaire augmente, quelle que soit la valeur de \(|b|\). Par conséquent, les vidéos populaires deviennent plus semblables à toutes les autres vidéos, et pas seulement aux autres vidéos populaires.
Les vidéos populaires deviennent moins similaires les unes aux autres que les vidéos moins populaires.
Étant donné que le produit scalaire augmente avec la longueur du vecteur et que les vidéos populaires ont une longueur de vecteur élevée, la mesure de similarité augmente, et non diminue.
Aucun changement.
Le produit scalaire est affecté par la longueur du vecteur. La longueur élevée des vecteurs des vidéos populaires modifie la mesure de similarité (anciennement cosinus).
Pour la même configuration que la question précédente, supposons que vous reveniez au cosinus à partir du produit scalaire. Comment la similarité entre les clips musicaux évolue-t-elle ?
Les vidéos populaires deviennent moins similaires à toutes les vidéos.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, la grande longueur des vecteurs des représentations vectorielles continues populaires ne contribue pas à la similarité.
Par conséquent, passer du produit scalaire au cosinus réduit la similarité entre les vidéos populaires et toutes les autres vidéos.
Les vidéos populaires deviennent plus semblables à toutes les vidéos.
Le cosinus n'est pas affecté par la longueur des vecteurs. Par conséquent, si vous passez du produit scalaire au cosinus, les similitudes de toutes les vidéos populaires diminueront.
Les vidéos populaires ne se ressemblent que les unes aux autres.
Le cosinus n'est pas affecté par la longueur des vecteurs. Par conséquent, si vous passez du produit scalaire au cosinus, les similitudes de toutes les vidéos populaires diminueront.
Aucun changement.
Étant donné que le cosinus n'est pas affecté par la longueur du vecteur, contrairement au produit scalaire, passer du produit scalaire au cosinus modifie les similarités.