嵌入：协同过滤的动机

协同过滤是基于许多其他用户的兴趣来预测用户兴趣的任务。举个例子，我们来看电影推荐任务。假设我们有 50 万用户，以及每个用户观看过的电影的列表（从包含 100 万部电影的目录中）。我们的目标是向用户推荐电影。

要解决此问题，需要一些方法来确定哪些电影彼此相似。为了实现这一目标，我们可以将电影嵌入一个低维度空间，从而将附近的电影放在一起。

在介绍我们如何学习嵌入之前，我们先来探索我们希望嵌入具有的画质类型，以及我们如何表示用于学习嵌入的训练数据。

在一维数轴上排列影片

为帮助建立对嵌入的直观理解，在一张纸上，尝试将以下电影排列在一维编号线上，使距离最近的电影彼此密切相关：

电影	评分	说明
蓝绿	（右）	一位法国妇女在丈夫和女儿在车祸中丧生后悲痛丧失。
黑暗骑士 Rises	PG-13	这部影片以《黑暗骑士》为背景，这部影片以 DC 漫画的背景为背景，讲述了哥特曼为拯救哥特曼而拯救世界的故事。
《哈利·波特与魔法石》	PG	一个孤儿发现自己是一个巫师，报名参加霍格沃茨魔法与魔法学院，他的第一个人与邪恶的伏地魔展开了斗争。
不可思议的内容	PG	被迫在郊区的平民生活的超级英雄家族退出了退休团队，拯救超级英雄从种族综合征及其杀手机器人中拯救出来。
《怪物史莱克》	PG	可爱的食人魔和他那只小伙伴在原来任务中拯救菲奥娜公主，她被恶龙监禁在她的城堡中。
星球大战	PG	Luke Skywalker 和 Han Solo 与两款 Android 团队合作，拯救莱娅公主和拯救银河系。
贝尔维尔三元组	PG-13	在职业自行车骑手冠军在环法自行车赛中被绑架后，他的祖母和一名超重的狗狗在海外获救，并在三位年长的爵士歌手的帮助下解救。
纪念品	（右）	一位短期记忆症患者将线索纹在身上，竭尽全力寻找杀害妻子的谋杀罪。

图 1. 可能的一维排列

虽然此嵌入确实有助于捕获电影的适合儿童和成人的情况，但用户在推荐影片时，希望从影片的许多方面进行拍摄。我们再进一步探索此示例，添加第二个嵌入维度。

请尝试使用与之前相同的练习，但这次是在二维空间中排列相同的电影。

图 2. 可能的二维排列

通过这种二维嵌入，我们可以定义电影之间的距离，这样一来，如果电影的目标受众群体是儿童，那么电影在很大程度上比较相似（因此也会推断为相似的电影），以及大片和艺术电影的程度。当然，这只是电影的众多重要特征中的两个。

更笼统地讲，我们将这些影片映射到了一个嵌入空间，其中每个字词都由一组二维坐标来描述。例如，在此空间中，《怪物史莱克》会映射到 (-1.0, 0.95)，而《蓝》则映射到 (0.65, -0.2)。通常，学习 d 维嵌入时，每部影片都由 d 个实值数字表示，每一维数字都是以一个维度表示坐标。

在此示例中，我们为每个维度指定了名称。在学习嵌入时，各个维度不会根据名称进行学习。有时我们可以查看嵌入，并为这些维度赋予语义含义，但有时也无法做到这一点。通常，每个此类维度都称为“潜在维度”，因为它代表的特征不是数据中明确包含的特征，而是从数据中推断出来的特征。

最终，它是指嵌入空间中影片之间的距离，而不是沿任意指定维度看一部电影中的值。