요약하자면 유사성 측정은 다른 예의 쌍에 비해 두 사례 간의 유사성을 정량화합니다. 아래 표에서는 두 가지 유사성 측정 방법을 비교합니다.
유형 | 작성자 | 사용 시점 | 의미 |
---|---|---|---|
수동 | 수동으로 특성 데이터 결합 | 데이터 세트는 크기가 작으며 특성이 쉽게 결합됩니다. | 유사성 계산 결과에 대한 통계를 얻지만 특성 데이터가 변경되면 유사성 측정을 업데이트해야 합니다. |
감독 대상 | 감독 DNN을 통해 생성된 임베딩 사이의 거리를 측정합니다. | 데이터 세트는 크기가 크고 특성은 결합하기 어렵습니다. | 결과에 대한 통계는 없지만 DNN은 변화하는 특성 데이터에 자동으로 적응할 수 있습니다. |