콘텐츠 기반 필터링

콘텐츠 기반 필터링은 항목 기능을 사용하여 다른 항목을 추천합니다. 사용자의 이전 행동이나 명시적인 행동을 기준으로 사용자가 원하는 것과 유사한 의견을 보냅니다.

콘텐츠 기반 필터링을 시연하기 위해 몇 가지 특성을 직접 엔지니어링해 보겠습니다. 'Google Play 스토어'로 이동합니다. 다음 그림은 특성 행렬을 보여줍니다. 각 행은 앱을 나타내고 각 열은 기능을 나타냅니다. 특징 카테고리 (예: 교육, 일반, 건강), 게시자 앱 등이 있습니다. 단순화하기 위해 다음 특성 행렬이 바이너리라고 가정합니다. 0이 아닌 값은 앱에 해당 기능이 있음을 의미합니다.

또한 동일한 특성 공간에서 사용자를 나타냅니다. 일부 사용자 관련 콘텐츠는 사용자가 명시적으로 기능을 제공할 수 있습니다. 예를 들어 사용자가 '엔터테인먼트 앱' 표시됩니다. 다른 기능은 암시적일 수 있지만 이전에 설치한 앱을 기반으로 합니다. 예를 들어 사용자가 Science R Us에서 게시한 다른 앱을 설치했습니다.

모델에서 이 사용자와 관련된 상품을 추천해야 합니다. 이렇게 하려면 먼저 유사성 측정항목 (예: 내적)을 선택합니다. 그런 다음 이러한 유사성에 따라 각 후보 항목을 채점하도록 시스템을 설정합니다. 측정항목입니다. 추천은 이 사용자에게 한정되므로 다른 사용자에 대한 정보는 전혀 사용하지 않았습니다.

추천될 수 있는 사용자와 앱을 보여주는 매트릭스 이미지

내적을 유사성 척도로 사용

사용자가 임베딩 및 앱을 \(x\) 만드는 경우를 생각해 보겠습니다. 임베딩 \(y\) 은 모두 바이너리 벡터입니다. 이후 \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), a 특성이 \(x\) \(y\) 있습니다. 즉, \(\langle x, y \rangle\) 는 특성으로 할 수 있습니다. A 최고 그러면 내적이 더 일반적인 특성을 나타내므로 유사성이 더 높아집니다.

직접 해 보세요.

앞의 앱 문제에서 각 앱의 내적을 계산합니다. 그런 다음 이 정보를 사용하여 아래 질문에 답하세요.

어떤 앱을 추천해야 할까요?
Science R Us에서 만든 교육용 앱입니다.
정답입니다. 이 상품의 내적이 가장 높습니다. 2. 저희 사용자는 과학 및 교육용 앱을 정말 좋아합니다.
Healthcare에서 만든 건강 앱입니다.
이 앱은 1점을 받았습니다. 나쁘지 않은 추천이지만 하지만 최선의 선택은 아닙니다.
TimeWastr에서 만든 캐주얼 앱입니다.
이 앱은 실제로 내적이 0으로 가장 낮습니다. Google의 게임과 같은 캐주얼 앱에 관심이 없는 사용자