Artık herhangi bir örnek çifti için yerleştirme yapabilirsiniz. Gözetimli benzerlik bu yerleştirmeleri alır ve benzerliklerini ölçen bir sayı döndürür. Yerleştirmelerin sayı vektörleri olduğunu unutmayın. İkisi arasındaki benzerliği bulmak için iki vektör \(A = [a_1,a_2,...,a_n]\) ve \(B = [b_1,b_2,...,b_n]\) şu üç benzerlik ölçüsünden birini seçin:
Ölçüm | Anlamı | Formül | Benzerlik arttıkça bu ölçüm... |
---|---|---|---|
Öklid uzaklığı | Vektörlerin uçları arasındaki mesafe | \(\sqrt{(a_1-b_1)^2+(a_2-b_2)^2+...+(a_N-b_N)^2}\) | Düşüş sayısı |
Kosinüs | Vektörler arasındaki \(\theta\) açının kosinüsü | \(\frac{a^T b}{|a| \cdot |b|}\) | Artışlar |
Nokta çarpım | Kosinüs her iki vektörün uzunluklarıyla çarpılır | \(a_1b_1+a_2b_2+...+a_nb_n\) \(=|a||b|cos(\theta)\) | Artır. Vektörlerin uzunluğuyla da artar. |
Benzerlik ölçüsü seçme
Kosinüsten farklı olarak nokta çarpımı, vektör uzunluğuyla orantılıdır. Bu önemli çünkü eğitimde sık sık gösterilen örnekler kümesi (örneğin, popüler YouTube videoları), uzunluklar. . Şu durumda: popülerliği yakalamak istiyorsanız noktalı ürün türünü seçin. Ancak riskler, popüler örnekler, benzerlik metriğini çarpıtabilir. Bu sapmayı dengelemek için nokta çarpımını hesaplamak için \(\alpha\ < 1\) uzun uzunluğu bir üsse yükseltin \(|a|^{\alpha}|b|^{\alpha}\cos(\theta)\)olarak.
Vektör uzunluğunun benzerlik ölçüsünü nasıl değiştirdiğini daha iyi anlamak için vektör uzunluklarını 1 olarak ayarlayın ve üç ölçümün orantılı hale geldiğine dikkat edin. bir iletişim kurmaktır.
- Öklid mesafesi = \(||a-b|| = \sqrt{||a||^2 + ||b||^2 - 2a^{T}b} = \sqrt{2-2\cos(\theta_{ab})}\).
- Nokta çarpım = \( |a||b| \cos(\theta_{ab}) = 1\cdot1\cdot \cos(\theta_{ab}) = cos(\theta_{ab})\).
- Kosinüs = \(\cos(\theta_{ab})\).
Benzerlik ölçümlerini gözden geçirme
Benzerlik ölçüsü, bir değer çifti arasındaki benzerliği ölçer. karşılaştırabilirsiniz. Manuel ve manuel olmak üzere aşağıdaki gibi karşılaştırılmıştır:
Tür | Nasıl oluşturulur? | En uygun cihazlar: | Çıkarımlar |
---|---|---|---|
Manuel | Özellik verilerini manuel olarak birleştirin. | Birleştirilmesi kolay özelliklere sahip küçük veri kümeleri. | Benzerlik hesaplamalarının sonuçları hakkında bilgi verir. Eğer özellik benzerlik ölçüsünü manuel olarak güncellemeniz gerekir. |
Gözetimli | tarafından oluşturulan yerleştirmeler arasındaki mesafeyi gözetimli bir DNN. | Birleştirilmesi zor özelliklere sahip büyük veri kümeleri. | Sonuçlarla ilgili analiz sağlamaz. Ancak bir DNN otomatik olarak uyum sağlayabilir ve özellik verilerini değiştirebilirsiniz. |