Artık herhangi bir örnek çifti için yerleştirmeleriniz var. Gözetimli bir benzerlik ölçümü, bu yerleştirmeleri alır ve benzerliklerini ölçen bir sayı döndürür. Yerleştirmelerin sayı vektörleri olduğunu unutmayın. İki vektör ve arasındaki benzerliği bulmak için aşağıdaki üç benzerlik ölçümünden birini seçin:
Ölçüm | Anlamı | Formül | Benzerlik arttıkça bu ölçüm... |
---|---|---|---|
Öklid uzaklığı | Vektörlerin uçları arasındaki mesafe | Azalma | |
Kosinüs | Vektörler arasındaki açının kosinüsü | Artışlar | |
Nokta çarpım | Kosinin her iki vektörün uzunluğuyla çarpımı | Artışlar Ayrıca vektörlerin uzunluğuyla da artar. |
Benzerlik ölçütü seçme
Kosinüsün aksine, nokta çarpımı vektör uzunluğuna orantılıdır. Bu, eğitim veri kümesinde çok sık görünen örneklerin (ör. popüler YouTube videoları) genellikle uzun uzunluklara sahip yerleştirme vektörlerine sahip olması nedeniyle önemlidir. Popülerliği yakalamak istiyorsanız nokta çarpımını seçin. Ancak popüler örneklerin benzerlik metriğini çarpıtması riski vardır. Bu çarpıklığı dengelemek için uzunluğu bir üssüyle çarparak skaler çarpımı olarak hesaplayabilirsiniz.
Vektör uzunluğunun benzerlik ölçümünü nasıl değiştirdiğini daha iyi anlamak için vektör uzunluklarını 1'e normalize edin ve üç ölçümün birbirine orantılı hale geldiğini fark edin.
- Öklid uzaklığı = .
- Nokta çarpımı = .
- Kosinüs = .
Benzerlik ölçümlerinin incelenmesi
Benzerlik ölçümü, bir örnek çifti ile diğer örnek çiftleri arasındaki benzerliği nicel olarak ifade eder. Manuel ve gözetimli olmak üzere iki tür aşağıda karşılaştırılmıştır:
Tür | Oluşturma | En uygun olduğu durumlar | Çıkarımlar |
---|---|---|---|
Manuel | Özellik verilerini manuel olarak birleştirin. | Birleştirilmesi kolay özelliklere sahip küçük veri kümeleri. | Benzerlik hesaplamalarının sonuçları hakkında bilgi verir. Özellik verileri değişirse benzerlik ölçümünü manuel olarak güncellemeniz gerekir. |
Gözetimli | Gözetimli bir DNN tarafından oluşturulan yerleştirmeler arasındaki mesafeyi ölçme | Birleştirilmesi zor özelliklere sahip büyük veri kümeleri. | Sonuçlar hakkında bilgi vermez. Ancak DNN, değişen özellik verilerine otomatik olarak uyum sağlayabilir. |