Glossário de machine learning: sistemas de recomendação

Esta página contém os termos do glossário dos sistemas de recomendação. Para todos os termos do glossário, clique aqui.

C

geração de candidatos

#recsystems

O conjunto inicial de recomendações escolhidas por um sistema de recomendação. Por exemplo, considere um com 100 mil títulos. A fase de geração de candidatos cria uma lista muito menor de livros adequados para um determinado usuário, por exemplo, 500. Mas mesmo 500 livros é demais para recomendar a um usuário. Futuras, mais caras, fases de um sistema de recomendação (como pontuação e reclassificação) reduz esses 500 para um número muito menor mais útil de recomendações.

filtragem colaborativa

#recsystems

Fazer previsões sobre os interesses de um usuário com base nos interesses de muitos outros usuários. Filtragem colaborativa é frequentemente usado em sistemas de recomendação.

I

matriz de itens

#recsystems

Nos sistemas de recomendação, um matriz de vetores de embedding gerados por fatoração de matrizes que contém indicadores latentes sobre cada item. Cada linha da matriz de itens contém o valor de uma única coluna para todos os itens. Por exemplo, considere um sistema de recomendação de filmes. Cada coluna na matriz de itens representa um único filme. Os sinais latentes podem representar gêneros ou ser mais difíceis de interpretar sinais que envolvem interações complexas entre gênero, estrelas, idade do filme ou outros fatores.

A matriz de itens tem o mesmo número de colunas que a meta. que está sendo fatorado. Por exemplo, considerando um filme recomendado que avalia 10.000 títulos de filmes, o matriz de itens terá 10.000 colunas.

itens

#recsystems

Em um sistema de recomendação, as entidades que que um sistema recomenda. Por exemplo, vídeos são os itens que uma loja de vídeos recomenda, enquanto livros são os itens que uma livraria recomenda.

M

fatoração de matrizes

#recsystems

Em matemática, um mecanismo para encontrar as matrizes cujo produto escalar se aproxima de matriz de destino.

Nos sistemas de recomendação, a matriz de destino muitas vezes mantém os usuários classificações de itens. Por exemplo, o destino para um sistema de recomendação de filmes pode ser algo como o a seguir, em que os números inteiros positivos são avaliações dos usuários e 0 significa que o usuário não classificou o filme:

  Casablanca A história da Filadélfia Pantera Negra Mulher-Maravilha Ficção pulp
Usuário 1 5.0 3.0 0,0 2,0 0,0
Usuário 2 4.0 0,0 0,0 1,0 5.0
Usuário 3 3.0 1,0 4.0 5.0 0,0

O sistema de recomendação de filmes visa prever avaliações de usuários para filmes sem classificação. Por exemplo, o Usuário 1 vai gostar de Pantera Negra?

Uma abordagem para sistemas de recomendação é usar fatoração para gerar as duas matrizes a seguir:

  • Uma matriz de usuários, formada pelo número de usuários X os número de dimensões de embedding.
  • Uma matriz de itens, formada pelo número de elementos de embedding dimensões X o número de itens.

Por exemplo, usar a fatoração de matriz em nossos três usuários e cinco itens pode gerar a seguinte matriz de usuário e matriz de item:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

O produto escalar da matriz de usuário e da matriz de item gera uma recomendação matriz que contém não apenas as classificações originais de usuários, mas também as previsões para os filmes que cada usuário ainda não assistiu. Por exemplo, considere a classificação do Usuário 1 de Casablanca, que foi 5,0. O ponto produto correspondente a essa célula na matriz de recomendação deve provavelmente será em torno da versão 5, e ela é:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

E o mais importante: o Usuário 1 vai gostar de Pantera Negra? Pegar o produto escalar que corresponde à primeira linha e a terceira coluna produz uma classificação de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

A fatoração de matrizes normalmente produz uma matriz de usuários e uma matriz de itens que, juntas, são significativamente mais compactas do que a matriz de destino.

R

sistema de recomendação

#recsystems

um sistema que seleciona para cada usuário um conjunto relativamente pequeno de itens de um grande corpus. Por exemplo, um sistema de recomendação de vídeos pode recomendar dois vídeos de um corpus de 100.000 vídeos, selecionando Casablanca e A História da Filadélfia para um usuário, e Mulher Maravilha e Pantera Negra para outro. Um sistema de recomendação de vídeos pode as recomendações se baseiam em fatores como:

  • Filmes que usuários semelhantes avaliaram ou assistiram.
  • Gênero, diretores, atores, público-alvo...

reclassificação

#recsystems

A última etapa de um sistema de recomendação, durante o qual os itens pontuados podem ser reclassificados de acordo com alguns outros (normalmente, não ML). A reclassificação avalia a lista de itens geradas pela fase de pontuação, realizando ações como:

  • Eliminar os itens que o usuário já comprou.
  • Aumentar a pontuação de itens mais atualizados.

S

em lote

#recsystems

A parte de um sistema de recomendação que fornece um valor ou uma classificação para cada item produzido pelo fase de geração de candidatos.

U

matriz de usuários

#recsystems

Nos sistemas de recomendação, uma vetor de embedding gerado por fatoração de matrizes que mantém sinais latentes sobre as preferências do usuário. Cada linha da matriz de usuários contém informações sobre o relativo força de vários sinais latentes para um único usuário. Por exemplo, considere um sistema de recomendação de filmes. Nesse sistema, os sinais latentes na matriz de usuários podem representar o interesse de cada usuário gêneros específicos ou sinais mais difíceis de interpretar que envolvem interações complexas entre múltiplos fatores.

A matriz do usuário tem uma coluna para cada atributo latente e uma linha para cada usuário. Ou seja, a matriz de usuários tem o mesmo número de linhas que o destino que está sendo fatorado. Por exemplo, considerando um filme recomendado para 1.000.000 de usuários, o matriz de usuário terá 1.000.000 linhas.

W

Menores quadrados ponderados alternados (WALS, na sigla em inglês)

#recsystems

Um algoritmo para minimizar a função objetiva durante fatoração de matrizes da sistemas de recomendação, que permitem que uma redução de peso dos exemplos que faltam. O WALS minimiza o valor ponderado erro quadrático médio entre a matriz original e a reconstrução alternar entre a fixação da fatoração de linhas e de colunas. Cada uma dessas otimizações pode ser resolvida por mínimos quadrados otimização convexa. Para mais detalhes, consulte a Curso de sistemas de recomendação.