Glossário de machine learning: sistemas de recomendação

Esta página contém os termos do glossário de sistemas de recomendação. Para conferir todos os termos do glossário, clique aqui.

C

geração de candidatos

#recsystems

O conjunto inicial de recomendações escolhido por um sistema de recomendação. Por exemplo, considere uma livraria que oferece 100.000 títulos. A fase de geração de candidatos cria uma lista muito menor de livros adequados para um usuário específico, digamos 500. Mas mesmo 500 livros são muitos para recomendar a um usuário. Fases subsequentes e mais caras de um sistema de recomendação (como pontuação e reclassificação) reduzem essas 500 para um conjunto de recomendações muito menor e mais útil.

Consulte a Visão geral da geração de candidatos no curso de sistemas de recomendação para mais informações.

filtragem colaborativa

#recsystems

Fazer previsões sobre os interesses de um usuário com base nos interesses de muitos outros usuários. A filtragem colaborativa é usada com frequência em sistemas de recomendação.

Consulte Filtragem colaborativa no curso de sistemas de recomendação para mais informações.

I

matriz de itens

#recsystems

Em sistemas de recomendação, uma matriz de vetores de inserção gerada por fatoração de matrizes que contém sinais latentes sobre cada item. Cada linha da matriz de itens contém o valor de um único recurso latente para todos os itens. Por exemplo, considere um sistema de recomendação de filmes. Cada coluna na matriz de itens representa um único filme. Os sinais latentes podem representar gêneros ou podem ser sinais mais difíceis de interpretar que envolvem interações complexas entre gênero, estrelas, idade do filme ou outros fatores.

A matriz de itens tem o mesmo número de colunas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes que avalia 10.000 títulos, a matriz de itens terá 10.000 colunas.

itens

#recsystems

Em um sistema de recomendação, as entidades que um sistema recomenda. Por exemplo, os vídeos são os itens que uma locadora de vídeos recomenda, enquanto os livros são os itens que uma livraria recomenda.

M

fatoração de matrizes

#recsystems

Na matemática, um mecanismo para encontrar as matrizes cujo produto escalar se aproxima de uma matriz de destino.

Em sistemas de recomendação, a matriz de destino muitas vezes contém as classificações dos usuários em itens. Por exemplo, a matriz de destino de um sistema de recomendação de filmes pode ser semelhante a esta, em que os números positivos são classificações do usuário e 0 significa que o usuário não classificou o filme:

  Casablanca A história de Filadélfia Pantera Negra Mulher-Maravilha Pulp Fiction
Usuário 1 5.0 3.0 0,0 2,0 0,0
Usuário 2 4.0 0,0 0,0 1,0 5.0
Usuário 3 3.0 1,0 4.0 5.0 0,0

O sistema de recomendação de filmes tem como objetivo prever as classificações dos usuários para filmes sem classificação. Por exemplo, o usuário 1 vai gostar de Pantera Negra?

Uma abordagem para sistemas de recomendação é usar a fatoração de matrizes para gerar as duas matrizes a seguir:

  • Uma matriz de usuários, formada pelo número de usuários X o número de dimensões de inserção.
  • Uma matriz de itens, moldada como o número de dimensões de embedding X o número de itens.

Por exemplo, usar a fatoração de matrizes em três usuários e cinco itens pode gerar a seguinte matriz de usuários e de itens:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

O produto escalar da matriz de usuários e da matriz de itens gera uma matriz de recomendações que contém não apenas as classificações originais do usuário, mas também previsões dos filmes que cada usuário não assistiu. Por exemplo, considere a nota do usuário 1 para Casablanca, que foi 5,0. O produto de ponto correspondente a essa célula na matriz de recomendação deve ser de aproximadamente 5, 0 e é:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Mais importante, o Usuário 1 vai gostar de Pantera Negra? O produto escalar correspondente à primeira linha e à terceira coluna gera uma classificação previsivelmente de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

A fatoração de matrizes geralmente gera uma matriz de usuários e uma matriz de itens que, juntas, são significativamente mais compactas do que a matriz de destino.

R

sistema de recomendação

#recsystems

Um sistema que seleciona para cada usuário um conjunto relativamente pequeno de itens desejáveis de um grande corpus. Por exemplo, um sistema de recomendação de vídeos pode recomendar dois vídeos de um corpus de 100.000 vídeos, selecionando Casablanca e História de Filadélfia para um usuário e Mulher Maravilha e Pantera Negra para outro. Um sistema de recomendação de vídeos pode basear as recomendações em fatores como:

  • Filmes que usuários semelhantes assistiram ou classificaram.
  • Gênero, diretores, atores, público-alvo...

reclassificação

#recsystems

A fase final de um sistema de recomendação, em que os itens com pontuação podem ser reavaliados de acordo com algum outro algoritmo (normalmente, não de ML). A reclassificação avalia a lista de itens gerada pela fase de pontuação, realizando ações como:

  • Eliminar itens que o usuário já comprou.
  • Aumentar a pontuação de itens mais recentes.

S

em lote

#recsystems

Parte de um sistema de recomendação que fornece um valor ou classificação para cada item produzido pela fase de geração de candidatos.

U

matriz de usuários

#recsystems

Em sistemas de recomendação, um vetor de embedding gerado por fatoração de matriz que contém indicadores latentes sobre as preferências do usuário. Cada linha da matriz de usuários contém informações sobre a força relativa de vários indicadores latentes para um único usuário. Por exemplo, considere um sistema de recomendação de filmes. Nesse sistema, os indicadores latentes na matriz de usuários podem representar o interesse de cada usuário em gêneros específicos ou podem ser indicadores mais difíceis de interpretar que envolvem interações complexas em vários fatores.

A matriz de usuários tem uma coluna para cada característica latente e uma linha para cada usuário. Ou seja, a matriz do usuário tem o mesmo número de linhas que a matriz alvo que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes para 1.000.000 de usuários, a matriz de usuários terá 1.000.000 de linhas.

W

Mínimos quadrados ponderados alternados (WALS)

#recsystems

Um algoritmo para minimizar a função objetivo durante a fatorização de matrizes em sistemas de recomendação, que permite uma redução de peso dos exemplos ausentes. O WALS minimiza o erro quadrado ponderado entre a matriz original e a reconstrução alternando a correção da fatoração de linha e da coluna. Cada uma dessas otimizações pode ser resolvida pela otimização convexa de mínimos quadrados. Para mais detalhes, consulte o curso sobre sistemas de recomendação.