推荐系统概览

推荐系统的一种常见架构包括 以下组件:

  • 候选集生成
  • 评分
  • 重排序

图示:推荐系统的各个组成部分以及每个阶段的规模。

候选集生成

在第一个阶段,系统从一个潜在的大型语料库开始, 会生成更小的候选字词子集。例如,候选人 YouTube 生成器可将数十亿视频缩减到数百或数千个。 模型需要快速评估查询,因为存在海量数据, 语料库。一个给定的模型可能会提供多个候选生成器,每个生成器都会提名 一组不同的候选字词。

评分

接下来,另一个模型对候选模型进行评分和排名, 要向用户显示的一组项(按 10 的顺序排列)。由于 模型只评估了相对较小的项目子集,系统可以使用 依赖于其他查询的更精确的模型。

重新排名

最后,系统必须将 最终排名。例如,系统会移除用户 明确不喜欢的内容,或提高较新内容的得分。重新排名 还可以有助于确保多样性、新鲜度和公平性。

我们将在本课程中讨论各个阶段 以 YouTube 等不同推荐系统为例。