机器学习术语表:推荐系统

本页面包含推荐系统术语表。对于所有术语库术语 点击此处

C

候选集生成

#recsystems

由 AI 生成的一组初始推荐 推荐系统。例如,假设 销售 10 万册图书的书店。候选集生成阶段 列出很小的适合特定用户的图书,比如 500 本。但 推荐给用户的 500 本图书实在太多了。随后价格更高 推荐系统的各个阶段(例如评分重新排名)将这 500 名减少到更小, 更实用的建议。

协同过滤

#recsystems

根据某位用户的兴趣进行预测 而根据许多其他用户的兴趣来展示广告协同过滤 通常用在推荐系统中。

I

项矩阵

#recsystems

推荐系统中, 由嵌入向量矩阵分解 包含有关每个推荐项的潜在信号。 项矩阵的每一行存储单个潜在值 功能。 以电影推荐系统为例。每列 都表示一部电影。潜在信号 可能代表不同的流派,或者可能难以解读 涉及类型、明星和角色之间复杂互动的信号, 电影上映时间或其他因素

项矩阵与目标矩阵具有相同的列数 要分解的矩阵。例如,假设某部电影 该推荐系统可评估 10,000 部电影、 项矩阵将有 10000 列。

items

#recsystems

推荐系统中, 是系统推荐的例如,视频是指视频商店 而书籍是书店推荐的商品。

M

矩阵分解

#recsystems

在数学中,一种机制用于寻找其点积近似于 目标矩阵。

推荐系统中,目标矩阵 通常包含items上的评分。例如,目标 电影推荐系统的输入矩阵可能类似于 其中正整数代表用户评分,0 表示用户未给电影评分:

  卡萨布兰卡 《费城故事》 Black Panther 神奇女侠 《低俗小说》
用户 1 5.0 3.0 0.0 2.0 0.0
用户 2 4.0 0.0 0.0 1.0 5.0
用户 3 3.0 1.0 4.0 5.0 0.0

影片推荐系统旨在预测出 未分级电影。例如,用户 1 会喜欢《黑豹》吗?

推荐系统的一种方法是使用矩阵 因式分解生成以下两个矩阵:

  • 用户矩阵,形状为用户数量 X 嵌入维度的数量。
  • 项矩阵,形状为嵌入数量 维度 X 以及项目数量。

例如,对我们的三个用户和五个推荐项使用矩阵因式分解 可以生成以下用户矩阵和项矩阵:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

通过用户矩阵和项矩阵的点积得出推荐值 该矩阵不仅包含原始用户评分,还包含预测 为每个用户未看过的电影 例如,假设用户 1 对“卡萨布兰卡”的评分为 5.0,圆点 与推荐矩阵中该单元对应的产品应该 最好在 5.0 左右,并且:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

更重要的是,用户 1 会喜欢《黑豹》吗?计算点积 与第三行和第三列相对应, 将得到一个预测值, 4.3 分:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

矩阵分解通常会生成用户矩阵和项矩阵, 它们的集合明显比目标矩阵更为紧凑。

R

推荐系统

#recsystems

一种系统,为每个用户选择相对较小的所需集合 items。 例如,视频推荐系统可能会向你推荐 从包含 10 万个视频的语料库中选择“Casablanca”,然后 第一位用户是《费城故事》《神奇女侠》《黑豹》。视频推荐系统可能会 的推荐基于以下因素:

  • 同类用户已评分或观看过的电影。
  • 类型、导演、演员、目标人群...

重排序

#recsystems

推荐系统的最后阶段, 在此期间,系统可能会根据其他一些信息, (通常是非机器学习)算法。重新排名会评估项列表 在打分阶段生成的内容,例如:

  • 删除用户已购买的商品。
  • 提高较新项的得分。

S

评分

#recsystems

推荐系统的一部分, 提供由 候选集生成阶段。

U

用户矩阵

#recsystems

推荐系统中, 嵌入矢量,由 矩阵分解 存储着关于用户偏好的潜在信号。 用户矩阵的每一行都包含有关 不同潜在信号的强度。 以电影推荐系统为例。在此系统中, 用户矩阵中的潜在信号可能代表每个用户的兴趣, 或者是难以解读的信号, 涉及多个因素的复杂相互作用。

用户矩阵有一列对应每个潜在特征,一行对应每个用户。 也就是说,用户矩阵与目标矩阵具有相同的行数 要分解的矩阵。例如,假设某部电影 推荐系统, 将有 1,000,000 行。

W

加权交替最小二乘 (WALS)

#recsystems

优化目标函数的 矩阵分解 推荐系统: 减少样本的权重。WALS 将加权 原始矩阵与重构后的模型之间的平方误差, 在修复行分解和列分解之间交替进行。 所有这些优化都可以通过最小二乘 凸优化。有关详情,请参阅 推荐系统课程