检索

假设您有一个嵌入模型。对于一位用户,您 来决定要推荐哪些商品?

在服务时,给定一个查询,首先执行以下某项操作:

  • 对于矩阵分解模型,查询(或用户)嵌入是已知的 而系统只需从命令行查询 用户嵌入矩阵。
  • 对于 DNN 模型,系统会计算查询嵌入 \(\psi(x)\) 方法是使用特征向量 \(x\)运行网络。

有了查询嵌入后 \(q\),搜索项嵌入 \(V_j\) 与嵌入空间中的 \(q\) 相似。 这是最近邻问题。例如,您可以 根据相似度分数 \(s(q, V_j)\)计算推荐项。

二维频谱图片,上面排着几部电影和用户
从儿童电影到,从艺术片到卖座大片,应有尽有。一位用户
以及附近的两部电影。

您可以在相关内容推荐中使用类似的方法。例如: 当用户观看 YouTube 视频时,系统会首先查找 然后查找其他项的嵌入, \(V_j\) 。

大规模检索

为了计算嵌入空间中的最近邻, 能够对每个潜在候选对象进行详尽评分。详尽评分 对于非常大的语料库来说,成本可能相当高,但您可以使用 以下策略,以提高其效率:

  • 如果查询嵌入是静态已知的,则系统可以执行 计算详尽的离线评分、预计算并存储 针对每项查询的首选候选字词。 相关推荐。
  • 使用近似最近邻。