No estágio final de um sistema de recomendação, ele pode reclassificar candidatos a considerar critérios ou restrições adicionais. Uma de reclassificação é usar filtros que removam alguns candidatos.
Outra abordagem de reclassificação é transformar manualmente a pontuação retornada de acordo com a classificação.
Esta seção discute brevemente atualidade, diversidade e imparcialidade. Esses fatores estão entre muitos que podem ajudar a melhorar sua recomendação sistema. Alguns desses fatores geralmente exigem a modificação de estágios diferentes do processo. Cada seção oferece soluções que podem ser aplicadas individual ou coletivamente.
Atualização
A maioria dos sistemas de recomendação visa incorporar as informações de uso mais recentes, como o histórico do usuário atual e os itens mais recentes. Como manter o modelo atualizado ajuda o modelo a fazer boas recomendações.
Soluções
- Executar o treinamento novamente com a maior frequência possível para aprender sobre os dados mais recentes. Recomendamos fazer a inicialização com estado salvo do treinamento para que o modelo não tenha para reaprender do zero. A inicialização com estado salvo pode reduzir significativamente o treinamento tempo de resposta. Por exemplo, na fatoração de matrizes, inicie com estado salvo os embeddings para itens que estavam presentes na instância anterior do modelo.
- Crie uma "média" para representar novos usuários na fatoração de matrizes de modelos de machine learning. Não é preciso ter a mesma incorporação para cada usuário, pode criar clusters com base nos recursos do usuário.
- Use uma DNN, como um modelo softmax ou de duas torres. Como o modelo leva vetores de atributo como entrada, ele pode ser executado em uma consulta ou item que não foi vistos durante o treinamento.
- Adicionar a idade do documento como um recurso. Por exemplo, o YouTube pode adicionar a idade de um vídeo ou o horário da última visualização como um atributo.
Diversidade
Se o sistema sempre recomendar itens "mais próximos", à consulta na incorporação, os candidatos tendem a ser muito parecidos uns com os outros. Isso a falta de diversidade pode causar uma experiência ruim ou entediante para o usuário. Por exemplo: se o YouTube apenas recomenda vídeos muito semelhantes ao vídeo que o usuário está que está assistindo, como nada além de vídeos de corujas (como mostrado na ilustração), é provável que o usuário perca o interesse rapidamente.
Soluções
- Treine vários geradores de candidatos usando fontes diferentes.
- Treine vários rankings usando diferentes funções de objetivos.
- Reclassifique itens com base no gênero ou em outros metadados para garantir diversidade.
Justiça
Seu modelo deve tratar todos os usuários de maneira justa. Portanto, certifique-se seu modelo não está aprendendo vieses inconscientes com os dados de treinamento.
Soluções
- Incluir perspectivas diversas no design e no desenvolvimento.
- Treine modelos de ML em conjuntos de dados abrangentes. Adicionar dados auxiliares quando seus dados são muito esparsos (por exemplo, quando certas categorias são sub-representados).
- Acompanhar métricas (por exemplo, acurácia e erro absoluto) em cada informações demográficas para observar vieses.
- Criar modelos separados para grupos menos favorecidos.