Yerleştirmelerden gelen benzerliği ölçme

Artık herhangi bir örnek çifti için yerleştirme yapabilirsiniz. Gözetimli benzerlik bu yerleştirmeleri alır ve benzerliklerini ölçen bir sayı döndürür. Yerleştirmelerin sayı vektörleri olduğunu unutmayın. İkisi arasındaki benzerliği bulmak için iki vektör \(A = [a_1,a_2,...,a_n]\) ve \(B = [b_1,b_2,...,b_n]\) şu üç benzerlik ölçüsünden birini seçin:

ÖlçümAnlamıFormül Benzerlik arttıkça bu ölçüm...
Öklid uzaklığıVektörlerin uçları arasındaki mesafe \(\sqrt{(a_1-b_1)^2+(a_2-b_2)^2+...+(a_N-b_N)^2}\) Düşüş sayısı
KosinüsVektörler arasındaki \(\theta\) açının kosinüsü \(\frac{a^T b}{|a| \cdot |b|}\) Artışlar
Nokta çarpımKosinüs her iki vektörün uzunluklarıyla çarpılır \(a_1b_1+a_2b_2+...+a_nb_n\) \(=|a||b|cos(\theta)\) Artır. Vektörlerin uzunluğuyla da artar.

Benzerlik ölçüsü seçme

Kosinüsten farklı olarak nokta çarpımı, vektör uzunluğuyla orantılıdır. Bu önemli çünkü eğitimde sık sık gösterilen örnekler kümesi (örneğin, popüler YouTube videoları), uzunluklar. . Şu durumda: popülerliği yakalamak istiyorsanız noktalı ürün türünü seçin. Ancak riskler, popüler örnekler, benzerlik metriğini çarpıtabilir. Bu sapmayı dengelemek için nokta çarpımını hesaplamak için \(\alpha\ < 1\) uzun uzunluğu bir üsse yükseltin \(|a|^{\alpha}|b|^{\alpha}\cos(\theta)\)olarak.

Vektör uzunluğunun benzerlik ölçüsünü nasıl değiştirdiğini daha iyi anlamak için vektör uzunluklarını 1 olarak ayarlayın ve üç ölçümün orantılı hale geldiğine dikkat edin. bir iletişim kurmaktır.

Kanıt: Benzerlik Önlemlerinin Orantılılığı
a ile b'yi \(||a||=1\) ve \(||b||=1\)şeklinde normalleştirdikten sonra, bu üç ölçüm birbiriyle ilişkilidir:
  • Öklid mesafesi = \(||a-b|| = \sqrt{||a||^2 + ||b||^2 - 2a^{T}b} = \sqrt{2-2\cos(\theta_{ab})}\).
  • Nokta çarpım = \( |a||b| \cos(\theta_{ab}) = 1\cdot1\cdot \cos(\theta_{ab}) = cos(\theta_{ab})\).
  • Kosinüs = \(\cos(\theta_{ab})\).
Dolayısıyla, üç benzerlik ölçüsü de birbiriyle eşdeğerdir çünkü \(cos(\theta_{ab})\)ile orantılıdır.

Benzerlik ölçümlerini gözden geçirme

Benzerlik ölçüsü, bir değer çifti arasındaki benzerliği ölçer. karşılaştırabilirsiniz. Manuel ve manuel olmak üzere aşağıdaki gibi karşılaştırılmıştır:

TürNasıl oluşturulur?En uygun cihazlar:Çıkarımlar
ManuelÖzellik verilerini manuel olarak birleştirin. Birleştirilmesi kolay özelliklere sahip küçük veri kümeleri. Benzerlik hesaplamalarının sonuçları hakkında bilgi verir. Eğer özellik benzerlik ölçüsünü manuel olarak güncellemeniz gerekir.
Gözetimlitarafından oluşturulan yerleştirmeler arasındaki mesafeyi gözetimli bir DNN. Birleştirilmesi zor özelliklere sahip büyük veri kümeleri. Sonuçlarla ilgili analiz sağlamaz. Ancak bir DNN otomatik olarak uyum sağlayabilir ve özellik verilerini değiştirebilirsiniz.