머신러닝 용어집: 추천 시스템

이 페이지에는 추천 시스템 용어집이 포함되어 있습니다. 모든 용어집 용어에 대해 여기를 클릭하세요.

C

후보 생성

#recsystems

광고주가 선택한 초기 추천 집합은 추천 시스템. 예를 들어 10만 권의 책을 판매하는 서점입니다. 후보 생성 단계에서는 500권과 같이 특정 사용자에게 적을 만한 도서 목록을 찾을 수 있습니다. 그러나 500권은 사용자에게 추천하기에는 너무 많습니다. 그 후에는 비용이 더 많이 들고 추천 시스템의 단계 (예: 채점순위를 재지정)하여 이러한 500을 훨씬 작게 줄여줍니다. 더 유용한 추천을 제공합니다

협업 필터링

#recsystems

한 사용자의 관심분야를 예측하기 관심분야에 기반합니다. 협업 필터링 추천 시스템에서 자주 사용됩니다.

I

항목 행렬

#recsystems

추천 시스템에서는 다음과 같이 생성된 임베딩 벡터의 행렬입니다. 행렬 분해항목에 대한 잠재 신호를 보유하는 역할을 합니다. 항목 행렬의 각 행에는 단일 잠재 값이 담겨 있습니다. 기능을 사용할 수 있습니다. 영화 추천 시스템을 예로 들어보겠습니다. 각 열 이는 단일 영화를 나타냅니다. 잠재 신호 장르를 대표하거나 해석하기 어려울 수 있습니다. 장르, 스타, 기타 요인에 따라 달라집니다.

항목 행렬에 타겟과 동일한 수의 열이 있습니다. 인수 분해되는 행렬입니다. 예를 들어, 어떤 영화가 10,000편의 영화를 평가하는 추천 시스템인 항목 행렬에는 10,000개의 열이 포함됩니다.

items

#recsystems

추천 시스템에서 확인할 수 있습니다 예를 들어 동영상은 비디오 게임, 도서는 서점에서 추천하는 상품입니다.

M

행렬 분해

#recsystems

수학에서 내적이 제곱에 근사하는 행렬을 찾는 메커니즘 타겟 행렬입니다.

추천 시스템에서 목표 행렬은 사용자의 의도를 항목의 평점입니다. 예를 들어 대상 행렬은 다음과 같을 수 있습니다. 양의 정수는 사용자 평점과 0이 됩니다. 사용자가 영화를 평가하지 않았음을 의미합니다.

  카사블랑카 필라델피아 이야기 블랙 팬서 원더 우먼 펄프 픽션
사용자 1 5.0 3.0 0.0 2.0 0.0
사용자 2 4.0 0.0 0.0 1.0 5.0
사용자 3 3.0 1.0 4.0 5.0 0.0

영화 추천 시스템은 등급 없는 영화만 볼 수 있습니다. 예를 들어 사용자 1은 블랙 팬서를 좋아할까요?

추천 시스템에 대한 한 가지 접근 방식은 행렬을 사용하는 것입니다 분해하여 다음 두 행렬을 생성합니다.

예를 들어 3명의 사용자와 5개의 항목에 대해 행렬 분해를 사용하여 다음 사용자 행렬과 항목 행렬을 생성할 수 있습니다.

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

사용자 행렬과 항목 행렬의 내적이 추천을 산출합니다. 원래 사용자 평가와 예측까지 포함하는 행렬입니다. 영화의 예가 표시됩니다. 예를 들어 카사블랑카에 대한 사용자 1의 평점(5.0)을 가정해 보겠습니다. 점 추천 행렬의 해당 셀에 해당하는 제품이 5.0 정도일 것입니다.

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

그렇다면 사용자 1은 블랙 팬서를 좋아할까요? 내적 사용하기 첫 번째 행과 세 번째 열에 대응하여 예측 문장을 평점 4.3점:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

행렬 분해는 일반적으로 대상 행렬보다 훨씬 더 간결합니다.

R

추천 시스템

#recsystems

각 사용자에 대해 상대적으로 적은 수의 바람직한 그룹을 선택하는 시스템입니다. 항목을 업데이트합니다. 예를 들어 동영상 추천 시스템은 두 개의 동영상을 추천할 수 있습니다. 100,000개 동영상 코퍼스에서 Casablanca를 선택한 다음 The Philadelphia Story for one user, and Wonder Woman블랙 팬서 같은 거죠. 동영상 추천 시스템은 다음과 같은 요소를 기반으로 추천됩니다.

  • 비슷한 사용자가 평가하거나 시청한 영화
  • 장르, 감독, 배우, 타겟 인구통계...

순위 재지정

#recsystems

추천 시스템의 마지막 단계 이 기간 동안 다른 기준에 따라 채점된 항목이 다시 채점될 수 있습니다. 일반적으로 ML 알고리즘이 아닌 알고리즘입니다 순위 재지정은 항목 목록 평가 채점 단계에서 생성되어 다음과 같은 조치를 취합니다.

  • 사용자가 이미 구매한 항목 제거
  • 새로운 항목의 점수를 높입니다.

S

점수 매기기

#recsystems

추천 시스템에서 사용자가 는 후보 생성 단계입니다.

U

사용자 매트릭스

#recsystems

추천 시스템에서는 다음과 같은 방식으로 생성된 임베딩 벡터 행렬 분해 사용자 선호에 대한 잠재 신호가 있습니다. 사용자행렬의 각 행에는 상대 행렬에 대한 정보가 강도를 나타냅니다. 영화 추천 시스템을 예로 들어보겠습니다. 이 시스템에서는 사용자 매트릭스의 잠재 신호가 각 사용자의 관심사를 나타낼 수 있습니다. 특정 장르의 특정 장르에 불과할 수 있으며, 게임과 관련된 복잡한 상호작용을 수행할 수 있습니다

사용자 행렬에는 각 잠재 특성에 대한 열과 각 사용자에 대한 행이 있습니다. 즉, 사용자행렬의 행 수는 타겟의 행과 동일합니다. 인수 분해되는 행렬입니다. 예를 들어, 어떤 영화가 1,000,000명의 사용자에게 추천 시스템을 사용자 매트릭스에는 1,000,000개의 행이 있습니다.

W

Weighted Alternating Least Squares (WALS)

#recsystems

주어진 시간 동안 목적 함수를 최소화하는 알고리즘 행렬 분해추천 시스템을 통해 가중치를 낮추는 것이 좋습니다 WALS는 가중치가 적용된 원본 행렬과 재구성 사이의 제곱 오차를 행 분해와 열 분해 수정을 번갈아 가며 수정하게 됩니다. 이러한 각 최적화는 최소 제곱으로 해결할 수 있습니다. 볼록 최적화. 자세한 내용은 추천 시스템 과정