Medidas de similitud: Comprueba tu comprensión

Un gráfico que muestra los puntos a, b y c en relación con un punto central.
En la imagen anterior, si deseas que "b" sea más similar a "a" que "b", significa "c", ¿qué medida deberías elegir?
Punto de producto
Correcto. El producto escalar es proporcional al coseno y a las longitudes de los vectores. Por lo tanto, aunque el coseno es más alto para "b" y "c", la longitud más alta de "a" hace que "a" y "b" sean más similares que "b" y "c".
Coseno
El coseno depende solo del ángulo entre vectores, y el ángulo más pequeño \(\theta_{bc}\) hace \(\cos(\theta_{bc})\) más grande que \(\cos(\theta_{ab})\).
Distancia euclidiana
La distancia \(\vec{bc}\) es menor que \(\vec{ab}\) , lo que hace que “b” sea más similar a “c” que a “a”.
Estás calculando la similitud para los videos musicales. La duración de los vectores de incorporación de los videos musicales es proporcional a su popularidad. Ahora eliges un producto escalar en lugar de coseno para calcular la similitud. ¿Cómo cambia la similitud entre los videos musicales?
Los videos populares se vuelven más similares a todos los videos en general.
Como el producto escalar se ve afectado por la longitud de ambos vectores, la longitud del vector grande de los videos populares los hará más similares a todos los videos.
Los videos populares se vuelven más similares solo a otros videos populares.
Recuerda que el producto escalar se calcula como \(|a||b|\cos(\theta)\). Si suponemos que “a” es un video musical popular, sabemos que su duración de incorporación, \(|a|\), es mayor que la de videos poco populares. La longitud mayor aumenta el producto escalar independientemente del valor de \(|b|\). Por lo tanto, los videos populares se vuelven más similares a todos los demás videos, no solo a otros.
Los videos populares se vuelven menos similares que los menos populares.
Dado que el producto puntual aumenta con la longitud del vector y los videos populares tienen una longitud vectorial alta, la medida de similitud aumentará, no disminuirá.
Sin cambios.
El producto de punto se ve afectado por la longitud del vector, y la longitud del vector alto de los videos populares cambiará la medida de similitud.
En la misma situación que en la pregunta anterior, supongamos que cambias al coseno del producto de puntos. ¿Cómo cambia la similitud entre los videos musicales?
Los videos populares se vuelven menos similares que los menos populares.
Debido a que el coseno no se ve afectado por la longitud del vector, la longitud del vector grande de las incorporaciones de videos populares no contribuye a la similitud. Por lo tanto, el cambio al coseno desde un producto de puntos reduce la similitud de los videos populares.
Los videos populares se vuelven más similares que los menos populares.
Las longitudes vectoriales no afectan el coseno, por lo que cambiar de producto escalar hará que disminuyan las similitudes de todos los videos populares.
Sin cambios.
Dado que el coseno no se ve afectado por la longitud del vector, el uso del coseno tendrá diferentes similitudes.