理解度を確認する

中心点を基準としたポイント a、b、c を示すグラフ。
上の画像で、bc よりも a に近づけたい場合、どの指標を選択する必要がありますか?
内積
正解です。ドット積は、ベクトルのコサイン値と長さの両方に比例します。したがって、bc で形成される角度のコサインは ba で形成される角度のコサインよりも大きいものの、a のベクトル長が長いため、ab のドット積は bc のドット積よりも大きくなります。
コサイン
コサインはベクトル間の角度にのみ依存し、角度が小さいほど \(\cos(\theta_{bc})\) は \(\cos(\theta_{ab})\)よりも大きくなります。 \(\theta_{bc}\)
ユークリッド距離
距離 \(\vec{bc}\) は \(\vec{ab}\)よりも小さいため、ba よりも c に近くなります。
ミュージック ビデオの類似度を計算しています。ミュージック ビデオのエンベディング ベクトルの長さは、その人気に比例します。類似性を計算するために、コサインからドット積に切り替えます。ミュージック ビデオの類似性はどのように変化しますか?
人気動画は、一般的なすべての動画とより類似するようになります。
ドット積は両方のベクトルの長さの影響を受けるため、人気動画のベクトルの長さが長いほど、すべての動画との類似性が高くなります。
人気動画は、他の人気動画とより類似するだけです。
ドット積は \(|a||b|\cos(\theta)\)として計算されることを思い出してください。 a が人気のあるミュージック ビデオであると仮定すると、そのエンベディング長 \(|a|\)は、人気のない動画よりも長くなります。長さが長くなるほど、 \(|b|\)の値に関係なくドット積が大きくなります。そのため、人気動画は他の人気動画だけでなく、他のすべての動画と類似性が高くなります。
人気のある動画は、人気が低い動画と比べて、互いに類似性が低くなります
ドット積はベクトルの長さとともに増加し、人気のある動画はベクトルの長さが長いため、類似度測定値は減少するのではなく増加します。
変更なし。
ドット積はベクトルの長さの影響を受けます。人気動画のベクトル長が長くなると、(以前は余弦だった)類似性測定値が変化します。
前の質問と同じ設定で、ドット積から余弦に戻したとします。ミュージック ビデオの類似性はどのように変化しますか?
人気動画は、すべての動画との類似性が低下します。
余弦はベクトルの長さに影響されないため、人気のある動画エンベディングのベクトルの長さが類似性に影響することはありません。したがって、ドット積からコサインに変えると、人気動画と他のすべての動画の類似性が低下します。
人気動画は、すべての動画とより類似するようになります。
コサインはベクトルの長さの影響を受けないため、ドット積から切り替えると、人気のあるすべての動画の類似性が低下します。
人気動画は、互いに類似するだけになります。
コサインはベクトルの長さの影響を受けないため、ドット積から切り替えると、人気のあるすべての動画の類似性が低下します。
変更なし。
コサインはベクトルの長さに影響されませんが、ドット積は影響を受けるため、ドット積からコサインに切り替えると類似性が変化します。