嵌入:协同过滤的动机

协同过滤是基于许多其他用户的兴趣来预测用户兴趣的任务。举个例子,我们来看电影推荐任务。假设我们有 50 万用户,以及每个用户观看过的电影的列表(从包含 100 万部电影的目录中)。我们的目标是向用户推荐电影。

要解决此问题,需要一些方法来确定哪些电影彼此相似。为了实现这一目标,我们可以 将电影嵌入一个低维度空间, 从而将附近的电影放在一起。

在介绍我们如何学习嵌入之前,我们先来探索我们希望嵌入具有的画质类型,以及我们如何表示用于学习嵌入的训练数据。

在一维数轴上排列影片

为帮助建立对嵌入的直观理解,在一张纸上,尝试将以下电影排列在一维编号线上,使距离最近的电影彼此密切相关:

电影 评分 说明
蓝绿 (右) 一位法国妇女在丈夫和女儿在车祸中丧生后悲痛丧失。
黑暗骑士 Rises PG-13 这部影片以《黑暗骑士》为背景,这部影片以 DC 漫画的背景为背景,讲述了哥特曼为拯救哥特曼而拯救世界的故事。
《哈利·波特与魔法石》 PG 一个孤儿发现自己是一个巫师,报名参加霍格沃茨魔法与魔法学院, 他的第一个人与邪恶的伏地魔展开了斗争。
不可思议的内容 PG 被迫在郊区的平民生活的超级英雄家族退出了退休团队,拯救超级英雄从种族综合征及其杀手机器人中拯救出来。
《怪物史莱克》 PG 可爱的食人魔和他那只小伙伴在原来任务中拯救菲奥娜公主,她被恶龙监禁在她的城堡中。
星球大战 PG Luke Skywalker 和 Han Solo 与两款 Android 团队合作,拯救莱娅公主和拯救银河系。
贝尔维尔三元组 PG-13 在职业自行车骑手冠军在环法自行车赛中被绑架后,他的祖母和一名超重的狗狗在海外获救,并在三位年长的爵士歌手的帮助下解救。
纪念品 (右) 一位短期记忆症患者将线索纹在身上,竭尽全力寻找杀害妻子的谋杀罪。

在二维空间中排列影片

请尝试使用与之前相同的练习,但这次是在二维空间中排列相同的电影。