理解度をチェックする

中心点から点 a、b、c を示すグラフ。
上記の画像の b を 「c」よりも「a」とした場合、どの尺度を選ぶとよいですか。
内積
正解です。ドット積はコサインと ベクトルの長さです。したがって、余弦は角度で大きくなりますが、 bc のなす角が、 ベクトルの長さ(長い方のベクトル)を baaa のドット積を生成し、 b のドット積よりも大きい b、かつ c
コサイン
コサインはベクトル間の角度にのみ依存し、 他の角度 \(\theta_{bc}\) より大きく \(\cos(\theta_{bc})\) \(\cos(\theta_{ab})\)。
ユークリッド距離
この距離は \(\vec{bc}\) \(\vec{ab}\)より小さく、離れています ba よりも c に近いです。
ミュージック ビデオの類似度を計算しています。長さは、 エンベディング ベクトルは人気に比例します。マイページ 類似度を計算するために コサイン積からドット積に切り替えますどうやって どうなるでしょうか
人気の動画はすべての動画と似たようなものになります。
ドット積は両方のベクトルの長さの影響を受けるため、 人気動画のベクター長が長いと、他の動画と類似した動画になります できます。
人気の動画と他の人気の動画との類似度が高くなる
ドット積は \(|a||b|\cos(\theta)\)として計算されたことを思い出してください。 a が人気のミュージック ビデオであるとすれば、そのことはわかっています。 エンベディングの長さ \(|a|\)が、人気のない動画よりも長くなっています。 長さを長くすると、 ドット積は \(|b|\)の値に関係なく生成されます。そのため 人気の動画は 人気のある他の動画だけでなく、他のすべての動画に似たものになる。
人気の動画は他の動画の類似性が低く、 おすすめしません
ドット積はベクトルの長さに比例して増加し、 ベクトルの長さが長いと、類似性の尺度は増大しますが、減少しません。
変更なし。
ドット積はベクトル長の影響を受けます。長いベクトル長の 人気の動画に対して類似度(以前のコサイン)が変更されます。
前の質問と同じセットアップで、再び コサインに変換されます。ミュージック ビデオ間の類似性はどのように変化しますか?
人気の動画はすべての動画との類似性が低くなる
コサインはベクトルの長さの影響を受けないため、大きなベクトルは 人気のある動画エンベディングの長さは類似性に影響しません。 したがって、ドット積からコサインに切り替えると、類似度が 人気動画とその他すべての動画間の比較です
人気の動画はすべての動画の類似性が高くなります
コサインはベクトル長の影響を受けないため、 人気動画すべての類似性が低くなる。
人気の動画は相互の類似度が上がります
コサインはベクトル長の影響を受けないため、 人気動画すべての類似性が低くなる。
変更なし。
コサインはベクトル長の影響を受けないので ドット積からコサインに切り替えると類似性が変わります。