在上图中,如果您希望
b
与 a
的相似度高于与 c
的相似度,您应选择哪种衡量标准?点积
正确!点积与余弦和向量的长度成正比。因此,即使
b
和 c
所形成的角度的余弦大于 b
和 a
所形成的角度的余弦,但 a
的矢量长度更长,因此 a
和 b
的点积大于 b
和 c
的点积。
余弦
余弦仅取决于向量之间的角度,并且角度越小, \(\theta_{bc}\) \(\cos(\theta_{bc})\) 就越大于 \(\cos(\theta_{ab})\)。
欧几里得距离
距离 \(\vec{bc}\) 小于 \(\vec{ab}\),因此
b
离 c
更近,而不是离 a
更近。您要计算音乐视频的相似度。音乐视频的嵌入向量长度与其热门程度成正比。您可以从余弦函数切换到点积来计算相似度。音乐视频之间的相似性会如何变化?
热门视频通常会与所有视频变得更相似。
由于点积受两个向量的长度影响,因此热门视频的向量长度较长,这会使它们与所有视频的相似度更高。
热门视频只会与其他热门视频更加相似。
回想一下,点积的计算方式为 \(|a||b|\cos(\theta)\)。
假设
a
是热门音乐视频,我们知道它的嵌入长度 \(|a|\)比不受欢迎的视频要长。
长度越长,点积越大,而与 \(|b|\)的值无关。因此,热门视频与所有其他视频(而不仅仅是其他热门视频)的相关性会更高。
热门视频与其他热门视频之间的相似度会低于与不太热门的视频之间的相似度。
由于点积会随着向量长度而增加,而热门视频的向量长度较长,因此相似度测量值会增加,而不是减少。
无任何更改。
点积会受到向量长度的影响。热门视频的矢量长度较长,这会改变(以前是余弦)相似度衡量标准。
假设您从点积切换回余弦,并采用与上一个问题相同的设置。音乐视频之间的相似性会如何变化?
热门视频与所有视频的相似度会降低。
由于余弦不受矢量长度的影响,热门视频嵌入的矢量长度较长不会影响相似性。
因此,从点积切换到余弦会降低热门视频与所有其他视频之间的相似度。
热门视频与所有视频的相似性会增加。
余弦不受向量长度的影响,因此从点积改用余弦会导致所有热门视频的相似度降低。
热门视频只会更相似,
余弦不受向量长度的影响,因此从点积改用余弦会导致所有热门视频的相似度降低。
无任何更改。
由于余弦不受向量长度的影响,而点积受影响,因此从点积切换到余弦会改变相似度。