Nova classificação

No estágio final de um sistema de recomendação, ele pode reclassificar candidatos a considerar critérios ou restrições adicionais. Uma de reclassificação é usar filtros que removam alguns candidatos.

Outra abordagem de reclassificação é transformar manualmente a pontuação retornada de acordo com a classificação.

Esta seção discute brevemente atualidade, diversidade e imparcialidade. Esses fatores estão entre muitos que podem ajudar a melhorar sua recomendação sistema. Alguns desses fatores geralmente exigem a modificação de estágios diferentes do processo. Cada seção oferece soluções que podem ser aplicadas individual ou coletivamente.

Atualização

A maioria dos sistemas de recomendação visa incorporar as informações de uso mais recentes, como o histórico do usuário atual e os itens mais recentes. Como manter o modelo atualizado ajuda o modelo a fazer boas recomendações.

Soluções

  • Executar o treinamento novamente com a maior frequência possível para aprender sobre os dados mais recentes. Recomendamos fazer a inicialização com estado salvo do treinamento para que o modelo não tenha para reaprender do zero. A inicialização com estado salvo pode reduzir significativamente o treinamento tempo de resposta. Por exemplo, na fatoração de matrizes, inicie com estado salvo os embeddings para itens que estavam presentes na instância anterior do modelo.
  • Crie uma "média" para representar novos usuários na fatoração de matrizes de modelos de machine learning. Não é preciso ter a mesma incorporação para cada usuário, pode criar clusters com base nos recursos do usuário.
  • Use uma DNN, como um modelo softmax ou de duas torres. Como o modelo leva vetores de atributo como entrada, ele pode ser executado em uma consulta ou item que não foi vistos durante o treinamento.
  • Adicionar a idade do documento como um recurso. Por exemplo, o YouTube pode adicionar a idade de um vídeo ou o horário da última visualização como um atributo.

Uma imagem de quatro vídeos recomendados sobre corujas.

Diversidade

Se o sistema sempre recomendar itens "mais próximos", à consulta na incorporação, os candidatos tendem a ser muito parecidos uns com os outros. Isso a falta de diversidade pode causar uma experiência ruim ou entediante para o usuário. Por exemplo: se o YouTube apenas recomenda vídeos muito semelhantes ao vídeo que o usuário está que está assistindo, como nada além de vídeos de corujas (como mostrado na ilustração), é provável que o usuário perca o interesse rapidamente.

Soluções

  • Treine vários geradores de candidatos usando fontes diferentes.
  • Treine vários rankings usando diferentes funções de objetivos.
  • Reclassifique itens com base no gênero ou em outros metadados para garantir diversidade.

Justiça

Seu modelo deve tratar todos os usuários de maneira justa. Portanto, certifique-se seu modelo não está aprendendo vieses inconscientes com os dados de treinamento.

Soluções

  • Incluir perspectivas diversas no design e no desenvolvimento.
  • Treine modelos de ML em conjuntos de dados abrangentes. Adicionar dados auxiliares quando seus dados são muito esparsos (por exemplo, quando certas categorias são sub-representados).
  • Acompanhar métricas (por exemplo, acurácia e erro absoluto) em cada informações demográficas para observar vieses.
  • Criar modelos separados para grupos menos favorecidos.