推荐系统的一种常见架构由以下组件组成:
- 候选人生成
- 评分
- 重新排名
候选生成
在此第一阶段中,系统从潜在的大语料库开始,生成一小部分候选对象。例如,YouTube 中的候选人生成器可将数十亿个视频缩减为数百或数千个。由于语料库规模庞大,模型需要快速评估查询。给定模型可能会提供多个候选生成器,每个候选生成器推荐不同的候选子集。
记分
接下来,另一个模型会对候选数据集进行评分和排名,以便选择要向用户显示的一组项(按 10 的顺序排列)。由于此模型评估的是相对较小的项子集,因此系统可以使用依赖于其他查询的更精确的模型。
重新排名
最后,系统必须考虑最终排名的其他限制条件。例如,系统会移除用户明确不喜欢的内容,或提高新内容的得分。重新排名也有助于确保多样性、新鲜度和公平性。
我们会在本课程中讨论每个阶段,并给出来自不同推荐系统(如 YouTube)的示例。