후보 생성 후 다른 모델이 생성된 후보 항목의 점수를 매기고 순위를 매깁니다. 표시할 항목 집합을 선택할 수 있습니다. 추천 시스템 다음과 같이 서로 다른 소스를 사용하는 여러 후보 생성기가 있을 수 있습니다. 방법은 다음과 같습니다.
- 행렬 분해 모델의 관련 항목입니다.
- 맞춤설정을 고려한 사용자 기능입니다.
- '지역' vs '원격' items; 즉, 지리 정보를 가져와 고려해야 합니다
- 인기 상품 또는 인기 상품
- 소셜 그래프 즉, 다음 사용자가 좋아하거나 추천한 항목 친구.
시스템은 이러한 다양한 소스를 이를 하나의 모델로 채점하고 확인할 수 있습니다. 예를 들어 시스템은 특정 신경망에 다음 조건에서 사용자가 YouTube에서 동영상을 시청할 확률:
- 검색어 기능 (예: 사용자 시청 기록, 언어, 국가, 시간)
- 동영상 기능 (예: 제목, 태그, 동영상 삽입)
그런 다음 시스템은 후보자 풀에서 동영상의 순위를 매기고 모델의 예측에 사용됩니다.
후보 생성기가 점수를 내도록 해서는 안 되는 이유는 무엇일까요?
후보 생성기는 점수 (유사성 측정 기준)를 계산하고 임베딩의 경우처럼 순위 지정을 위해 임베딩을 사용하고 싶을 수 있습니다. 있습니다. 그러나 다음과 같은 이유로 이 방법은 사용하지 말아야 합니다.
- 일부 시스템은 여러 후보 생성기에 의존합니다. 이러한 서로 다른 생성기를 비교하지 못할 수 있습니다.
- 후보자 풀이 적기 때문에 시스템에서 더 많은 특성과 컨텍스트를 더 잘 포착할 수 있는 더 복잡한 모델이 필요합니다.
점수 산정을 위한 목적 함수 선택
ML 문제 소개에서 기억하시겠지만 프레임 조정, ML은 짓궂은 장난 지팡이처럼 행동할 수 있습니다. 목표를 배우고 하지만 무엇을 원하는지 신중하게 고려해야 합니다. 이 장난꾸러기 추천 시스템에도 적용됩니다 점수의 선택 기능이 항목의 순위에 크게 영향을 줄 수 있으며 궁극적으로는 맞춤 동영상의 품질도 관리할 수 있습니다.
예:
각 매개변수를 사용하면 어떻게 되는지 알아보려면 더하기 아이콘을 클릭하세요. 목표일 수 있습니다
점수 산정의 위치 편향
화면 아래에 표시되는 항목은 아래 항목보다 클릭 가능성이 낮습니다. 항목이 표시되는 것을 볼 수 있습니다. 하지만 동영상을 채점할 때는 시스템은 일반적으로 해당 동영상의 링크가 화면의 어느 위치에 표시될지 알지 못합니다. 마침내 나타날 겁니다. 가능한 모든 위치로 모델을 쿼리하는 것 역시 비용이 많이 듭니다. 여러 위치를 쿼리할 수 있더라도 시스템은 여러 순위 점수에서 일관된 순위를 찾지 못할 수도 있습니다.
솔루션
- 게재순위와 무관한 순위를 만듭니다.
- 모든 후보가 화면 상단에 있는 것처럼 순위를 매깁니다.