Pontuação

Após a geração de candidatos, outro modelo pontua e classifica os candidatos candidatos para selecionar o conjunto de itens a serem exibidos. O sistema de recomendação pode ter vários geradores candidatos que usam fontes diferentes, como da seguinte forma:

Exemplos
  • Itens relacionados de um modelo de fatoração de matrizes.
  • Recursos do usuário que consideram a personalização.
  • "Local" x "distante" items; ou seja, pegar informações geográficas em conta.
  • Itens mais procurados ou em alta.
  • Um gráfico social; ou seja, os itens que os usuários gostaram amigos.

O sistema combina essas diferentes fontes em um conjunto comum de candidatos que são pontuados por um único modelo e classificados de acordo com essa pontuação. Por exemplo, o sistema pode treinar um modelo para prever probabilidade de um usuário assistir a um vídeo no YouTube considerando o seguinte:

  • recursos de consulta (por exemplo, histórico de exibição do usuário, idioma, país, hora)
  • recursos de vídeo (por exemplo, título, tags, incorporação de vídeo)

O sistema pode então classificar os vídeos no grupo de candidatos de acordo com para a previsão do modelo.

Por que não deixar a pontuação do gerador de candidatos?

Como os geradores candidatos calculam uma pontuação (como a medida de similaridade no espaço de embedding), você pode ficar tentado a usá-los para classificar como muito bem. No entanto, evite essa prática pelos seguintes motivos:

  • Alguns sistemas dependem de vários geradores de candidatos. A pontuação dessas geradores diferentes pode não ser comparável.
  • Com um conjunto menor de candidatos, o sistema pode usar mais atributos e um modelo mais complexo que pode capturar melhor o contexto.

Escolher uma função objetiva para pontuação

Como você deve se lembrar, no curso Introduction to ML Problems Enquadramento, O ML pode agir como um gênio da travessura: muito feliz em aprender o objetivo que fornecer, mas tenha cuidado com o que quer. Essa travessura também se aplica aos sistemas de recomendação. A escolha de pontuação pode afetar drasticamente a classificação dos itens e, em última instância, a qualidade das recomendações.

Exemplo:

Clique nos ícones de adição para saber o que acontece como resultado do uso de cada objetivo.

Uma imagem do Google Play
 da loja, que exibe jogos novos e atualizados, bem como
 apps recomendados com os itens na parte de baixo destacados.

Viés de posicionamento na pontuação

Os itens que aparecem mais abaixo na tela têm menos probabilidade de receber cliques do que itens que aparecem mais acima na tela. No entanto, ao pontuar vídeos, sistema geralmente não sabe em que parte da tela um link para esse vídeo no final das contas. Consultar o modelo com todas as posições possíveis é muito caro. Mesmo que a consulta de múltiplas posições fosse viável, o sistema ainda não encontrar uma classificação consistente em várias pontuações de classificação.

Soluções

  • Criar classificações independentes de posição.
  • Classifique todos os candidatos como se estivessem na primeira posição da tela.