上記の画像の
b
を
「c
」よりも「a
」とした場合、どの尺度を選ぶとよいですか。内積
正解です。ドット積はコサインと
ベクトルの長さです。したがって、余弦は角度で大きくなりますが、
b
と c
のなす角が、
ベクトルの長さ(長い方のベクトル)を b
と a
で
a
は a
のドット積を生成し、
b
のドット積よりも大きい b
、かつ
c
。
コサイン
コサインはベクトル間の角度にのみ依存し、
他の角度 \(\theta_{bc}\) より大きく \(\cos(\theta_{bc})\)
\(\cos(\theta_{ab})\)。
ユークリッド距離
この距離は \(\vec{bc}\) \(\vec{ab}\)より小さく、離れています
b
は a
よりも c
に近いです。ミュージック ビデオの類似度を計算しています。長さは、
エンベディング ベクトルは人気に比例します。マイページ
類似度を計算するために
コサイン積からドット積に切り替えますどうやって
どうなるでしょうか
人気の動画はすべての動画と似たようなものになります。
ドット積は両方のベクトルの長さの影響を受けるため、
人気動画のベクター長が長いと、他の動画と類似した動画になります
できます。
人気の動画と他の人気の動画との類似度が高くなる。
ドット積は \(|a||b|\cos(\theta)\)として計算されたことを思い出してください。
a
が人気のミュージック ビデオであるとすれば、そのことはわかっています。
エンベディングの長さ \(|a|\)が、人気のない動画よりも長くなっています。
長さを長くすると、
ドット積は \(|b|\)の値に関係なく生成されます。そのため 人気の動画は
人気のある他の動画だけでなく、他のすべての動画に似たものになる。
人気の動画は他の動画の類似性が低く、
おすすめしません
ドット積はベクトルの長さに比例して増加し、
ベクトルの長さが長いと、類似性の尺度は増大しますが、減少しません。
変更なし。
ドット積はベクトル長の影響を受けます。長いベクトル長の
人気の動画に対して類似度(以前のコサイン)が変更されます。
前の質問と同じセットアップで、再び
コサインに変換されます。ミュージック ビデオ間の類似性はどのように変化しますか?
人気の動画はすべての動画との類似性が低くなる。
コサインはベクトルの長さの影響を受けないため、大きなベクトルは
人気のある動画エンベディングの長さは類似性に影響しません。
したがって、ドット積からコサインに切り替えると、類似度が
人気動画とその他すべての動画間の比較です
人気の動画はすべての動画の類似性が高くなります。
コサインはベクトル長の影響を受けないため、
人気動画すべての類似性が低くなる。
人気の動画は相互の類似度が上がります。
コサインはベクトル長の影響を受けないため、
人気動画すべての類似性が低くなる。
変更なし。
コサインはベクトル長の影響を受けないので
ドット積からコサインに切り替えると類似性が変わります。