점수

후보 생성 후 다른 모델이 생성된 후보 항목의 점수를 매기고 순위를 매깁니다. 표시할 항목 집합을 선택할 수 있습니다. 추천 시스템 다음과 같이 서로 다른 소스를 사용하는 여러 후보 생성기가 있을 수 있습니다. 방법은 다음과 같습니다.

예

행렬 분해 모델의 관련 항목입니다.
맞춤설정을 고려한 사용자 기능입니다.
'지역' vs '원격' items; 즉, 지리 정보를 가져와 고려해야 합니다
인기 상품 또는 인기 상품
소셜 그래프 즉, 다음 사용자가 좋아하거나 추천한 항목 친구.

시스템은 이러한 다양한 소스를 이를 하나의 모델로 채점하고 확인할 수 있습니다. 예를 들어 시스템은 특정 신경망에 다음 조건에서 사용자가 YouTube에서 동영상을 시청할 확률:

검색어 기능 (예: 사용자 시청 기록, 언어, 국가, 시간)
동영상 기능 (예: 제목, 태그, 동영상 삽입)

그런 다음 시스템은 후보자 풀에서 동영상의 순위를 매기고 모델의 예측에 사용됩니다.

후보 생성기가 점수를 내도록 해서는 안 되는 이유는 무엇일까요?

후보 생성기는 점수 (유사성 측정 기준)를 계산하고 임베딩의 경우처럼 순위 지정을 위해 임베딩을 사용하고 싶을 수 있습니다. 있습니다. 그러나 다음과 같은 이유로 이 방법은 사용하지 말아야 합니다.

일부 시스템은 여러 후보 생성기에 의존합니다. 이러한 서로 다른 생성기를 비교하지 못할 수 있습니다.
후보자 풀이 적기 때문에 시스템에서 더 많은 특성과 컨텍스트를 더 잘 포착할 수 있는 더 복잡한 모델이 필요합니다.

점수 산정을 위한 목적 함수 선택

ML 문제 소개에서 기억하시겠지만 프레임 조정, ML은 짓궂은 장난 지팡이처럼 행동할 수 있습니다. 목표를 배우고 하지만 무엇을 원하는지 신중하게 고려해야 합니다. 이 장난꾸러기 추천 시스템에도 적용됩니다 점수의 선택 기능이 항목의 순위에 크게 영향을 줄 수 있으며 궁극적으로는 맞춤 동영상의 품질도 관리할 수 있습니다.

예:

각 매개변수를 사용하면 어떻게 되는지 알아보려면 더하기 아이콘을 클릭하세요. 목표일 수 있습니다

클릭률 극대화

점수 함수가 클릭수 증가를 위해 최적화되면 시스템에서 클릭베이트 동영상 이 점수 산정 함수는 클릭을 생성하지만 제공하는 것이 좋습니다. 사용자 관심이 금세 사라질 수 있습니다

시청 시간 극대화

점수 기능이 시청 시간을 기준으로 최적화되면 시스템에서 매우 긴 동영상을 추천하므로 사용자 경험이 저하될 수 있습니다. 단, 짧은 시계 여러 개는 긴 시계 한 개만큼도 효과적일 수 있습니다.

다양성 향상 및 세션 시청 시간 극대화

길이가 짧은 동영상을 추천하되 알 수 있습니다.

Google Play 이미지
새 게임과 업데이트된 게임과
하단 항목이 강조표시된 추천 앱

점수 산정의 위치 편향

화면 아래에 표시되는 항목은 아래 항목보다 클릭 가능성이 낮습니다. 항목이 표시되는 것을 볼 수 있습니다. 하지만 동영상을 채점할 때는 시스템은 일반적으로 해당 동영상의 링크가 화면의 어느 위치에 표시될지 알지 못합니다. 마침내 나타날 겁니다. 가능한 모든 위치로 모델을 쿼리하는 것 역시 비용이 많이 듭니다. 여러 위치를 쿼리할 수 있더라도 시스템은 여러 순위 점수에서 일관된 순위를 찾지 못할 수도 있습니다.

솔루션

게재순위와 무관한 순위를 만듭니다.
모든 후보가 화면 상단에 있는 것처럼 순위를 매깁니다.

가져오기

순위 다시 지정