Uma arquitetura comum para sistemas de recomendações consiste nos seguintes componentes:
- geração de candidatos
- em lote
- nova classificação
Geração de candidatos
Nessa primeira etapa, o sistema começa de um corpus potencialmente grande e gera um subconjunto muito menor de candidatos. Por exemplo, o gerador candidato no YouTube reduz bilhões de vídeos a centenas ou milhares. O modelo precisa avaliar as consultas rapidamente de acordo com o enorme tamanho do corpus. Um determinado modelo pode fornecer vários geradores de candidatos, cada um indicando um subconjunto diferente de candidatos.
Pontuação
Em seguida, outro modelo pontua e classifica os candidatos para selecionar o conjunto de itens (em ordem 10) a serem exibidos ao usuário. Como esse modelo avalia um subconjunto relativamente pequeno de itens, o sistema pode usar um modelo mais preciso que depende de consultas adicionais.
Nova classificação
Por fim, o sistema precisa considerar outras restrições para a classificação final. Por exemplo, o sistema remove itens que o usuário não gostou explicitamente ou aumenta a pontuação do conteúdo mais recente. Isso também ajuda a garantir diversidade, atualidade e justiça.
Cada uma dessas fases será discutida ao longo da aula e dará exemplos de diferentes sistemas de recomendação, como o YouTube.