콘텐츠 기반 필터링은 항목 기능을 사용하여 다른 항목을 추천합니다. 사용자의 이전 행동이나 명시적인 행동을 기준으로 사용자가 원하는 것과 유사한 의견을 보냅니다.
콘텐츠 기반 필터링을 시연하기 위해 몇 가지 특성을 직접 엔지니어링해 보겠습니다. 'Google Play 스토어'로 이동합니다. 다음 그림은 특성 행렬을 보여줍니다. 각 행은 앱을 나타내고 각 열은 기능을 나타냅니다. 특징 카테고리 (예: 교육, 일반, 건강), 게시자 앱 등이 있습니다. 단순화하기 위해 다음 특성 행렬이 바이너리라고 가정합니다. 0이 아닌 값은 앱에 해당 기능이 있음을 의미합니다.
또한 동일한 특성 공간에서 사용자를 나타냅니다. 일부 사용자 관련 콘텐츠는 사용자가 명시적으로 기능을 제공할 수 있습니다. 예를 들어 사용자가 '엔터테인먼트 앱' 표시됩니다. 다른 기능은 암시적일 수 있지만 이전에 설치한 앱을 기반으로 합니다. 예를 들어 사용자가 Science R Us에서 게시한 다른 앱을 설치했습니다.
모델에서 이 사용자와 관련된 상품을 추천해야 합니다. 이렇게 하려면 먼저 유사성 측정항목 (예: 내적)을 선택합니다. 그런 다음 이러한 유사성에 따라 각 후보 항목을 채점하도록 시스템을 설정합니다. 측정항목입니다. 추천은 이 사용자에게 한정되므로 다른 사용자에 대한 정보는 전혀 사용하지 않았습니다.
내적을 유사성 척도로 사용
사용자가 임베딩 및 앱을 \(x\) 만드는 경우를 생각해 보겠습니다. 임베딩 \(y\) 은 모두 바이너리 벡터입니다. 이후 \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), a 특성이 \(x\) \(y\) 있습니다. 즉, \(\langle x, y \rangle\) 는 특성으로 할 수 있습니다. A 최고 그러면 내적이 더 일반적인 특성을 나타내므로 유사성이 더 높아집니다.
직접 해 보세요.
앞의 앱 문제에서 각 앱의 내적을 계산합니다. 그런 다음 이 정보를 사용하여 아래 질문에 답하세요.