协同过滤是基于许多其他用户的兴趣来预测用户兴趣的任务。举个例子,我们来看电影推荐任务。假设我们有 50 万用户,以及每个用户观看过的电影的列表(从包含 100 万部电影的目录中)。我们的目标是向用户推荐电影。
要解决此问题,需要一些方法来确定哪些电影彼此相似。为了实现这一目标,我们可以 将电影嵌入一个低维度空间, 从而将附近的电影放在一起。
在介绍我们如何学习嵌入之前,我们先来探索我们希望嵌入具有的画质类型,以及我们如何表示用于学习嵌入的训练数据。
在一维数轴上排列影片
为帮助建立对嵌入的直观理解,在一张纸上,尝试将以下电影排列在一维编号线上,使距离最近的电影彼此密切相关:
电影 | 评分 | 说明 |
---|---|---|
蓝绿 | (右) | 一位法国妇女在丈夫和女儿在车祸中丧生后悲痛丧失。 |
黑暗骑士 Rises | PG-13 | 这部影片以《黑暗骑士》为背景,这部影片以 DC 漫画的背景为背景,讲述了哥特曼为拯救哥特曼而拯救世界的故事。 |
《哈利·波特与魔法石》 | PG | 一个孤儿发现自己是一个巫师,报名参加霍格沃茨魔法与魔法学院, 他的第一个人与邪恶的伏地魔展开了斗争。 |
不可思议的内容 | PG | 被迫在郊区的平民生活的超级英雄家族退出了退休团队,拯救超级英雄从种族综合征及其杀手机器人中拯救出来。 |
《怪物史莱克》 | PG | 可爱的食人魔和他那只小伙伴在原来任务中拯救菲奥娜公主,她被恶龙监禁在她的城堡中。 |
星球大战 | PG | Luke Skywalker 和 Han Solo 与两款 Android 团队合作,拯救莱娅公主和拯救银河系。 |
贝尔维尔三元组 | PG-13 | 在职业自行车骑手冠军在环法自行车赛中被绑架后,他的祖母和一名超重的狗狗在海外获救,并在三位年长的爵士歌手的帮助下解救。 |
纪念品 | (右) | 一位短期记忆症患者将线索纹在身上,竭尽全力寻找杀害妻子的谋杀罪。 |
在二维空间中排列影片
请尝试使用与之前相同的练习,但这次是在二维空间中排列相同的电影。