生成候选集之后,另一个模型会对生成的模型进行评分和排名, 选择要显示的一组项目。推荐系统 可能有多个使用不同来源的候选生成器, 如下所示:
示例
- 矩阵分解模型中的相关项。
- 负责进行个性化设置的用户功能。
- “本地”与“远程”相比items;即获取地理信息, 。
- 热门或热门商品。
- 社交图;也就是 朋友。
系统会将这些不同的来源合并到一个通用池中, 然后由单个模型打分并根据评估结果 得分。例如,系统可以训练模型来预测 用户在 YouTube 上观看视频的概率:
- 查询功能(例如,用户观看记录、语言、国家/地区、时间)
- 视频功能(例如标题、标签、视频嵌入)
然后,系统可根据 用于对模型的预测。
为什么不让候选集生成器打分呢?
由于候选网络生成器会计算一个得分(例如相似度度量 )中,您可能想要使用它们进行排名, 。但是,您应该避免这种做法,原因如下:
- 有些系统依赖于多个候选生成器。这些实验的得分 不同的生成器可能没有可比性。
- 由于候选定位设置较少,系统可负担使用 更多的特征和更复杂的模型,可以更好地捕获上下文。
选择用于评分的目标函数
您可能还记得《机器学习问题简介》(Introduction to ML Problem) 取景、 机器学习可能会像个调皮的精灵一样:非常高兴地了解目标 但你必须小心自己的所想。此恶作剧 质量也会影响推荐系统。评分方式的选择 函数会极大地影响项的排名,而最终 推荐质量。
示例:
点击加号图标可了解使用每种方法分别会有什么影响 目标。
评分中的位置偏差
与屏幕较低的内容相比, 位置在屏幕较靠前的内容。不过,在对视频评分时, 系统通常不知道指向该视频的链接将出现在屏幕上的什么位置 最终将出现。查询包含所有可能位置的模型也 价格高昂。即使查询多个排名是可行的, 但仍然无法在多个排名得分之间找到一致的排名。
解决方案
- 创建与位置无关的排名。
- 对所有候选字词进行排名,就像它们位于屏幕的顶部位置一样。