重新排名

在推荐系统的最后阶段,系统会对推荐系统 并考虑其他条件或限制。一个 使用过滤条件来移除某些候选字词。

另一种重排序方法是手动将返回的得分 排名。

本部分将简要介绍新鲜度、多样性和公平性。 这些因素有很多,这些因素有助于改进向您推荐的内容 系统。其中一些因素通常需要修改不同的阶段 过程的复杂程度。每个部分都提供了您可能适用的解决方案 。

时效性

大多数推荐系统都旨在纳入最新的使用情况信息, 例如当前用户历史记录和最新项。及时更新模型 可帮助模型给出合适的推荐。

解决方案

  • 尽可能频繁地重新运行训练,以便利用最新的训练数据进行学习。 我们建议温启动训练,这样模型便不会 需要从头重新学习温启动可以显著减少训练工作量 。例如,在矩阵分解中, 出现的问题。
  • 创建“平均值”user,用于在矩阵分解中表示新用户 模型。您不需要对每个用户使用相同的嵌入,只需 可以根据用户特征创建用户集群。
  • 使用 DNN,如 softmax 模型或双塔模型。由于模型采用 特征向量作为输入,就可以对 在训练期间看到的。
  • 将文档存在时间添加为特征。例如,YouTube 可以将视频的年龄添加到 或者上次作为地图项查看的时间

一张包含 4 个关于猫头鹰的推荐视频的图片。

多样性

系统是否始终推荐“最近”的项添加到查询中 候选字词往往彼此非常相似。这个 缺乏多样性可能会导致用户体验不佳或单调乏味。例如: 如果 YouTube 仅推荐与用户正在观看的视频非常相似的视频, 当前正在观看的内容,例如只关注猫头鹰病毒的视频 (如图所示),用户可能很快就会失去兴趣。

解决方案

  • 使用不同的来源训练多个候选生成器。
  • 使用不同的目标函数训练多个排序器。
  • 根据类型或其他元数据对作品进行重新排名,以确保多样性。

公平性

您的模型应该公平对待所有用户。因此,请确保 模型不会从训练数据中学习无意识偏见。

解决方案

  • 在设计和开发中加入不同的观点。
  • 基于全面的数据集训练机器学习模型。添加辅助数据的时间 数据过于稀疏(例如,当某些类别 代表性不足)。
  • 跟踪每个 注意观察是否存在偏见。
  • 为服务不足的群组制作单独的模型。