機器學習詞彙表:推薦系統

本頁包含推薦系統詞彙表。如要查看所有詞彙字詞 請按這裡

C

生成候選字

#recsystems

最初所選建議的一組建議 推薦系統:舉例來說,假設 販售 10 萬本書籍的書店。產生候選字詞的階段 是提供給特定使用者的精簡書籍清單,例如 500但即使 有 500 本書是大量推薦給使用者的方法,之後也更昂貴 各階段 (例如評分重新排名) 會將 500 數量縮減至較小 並提供更實用的最佳化建議

協同過濾

#recsystems

針對單一使用者的興趣進行預測 依其他許多使用者的興趣來提供資訊。協同過濾 通常用於推薦系統

I

項目矩陣

#recsystems

推薦系統中, 嵌入向量矩陣, 矩陣分解 保存每個項目的潛在信號。 項目矩陣的每一列都具有單一潛在值 這項功能 以電影推薦系統為例,每一欄 項目矩陣則代表單一電影。潛在信號 代表內容類型,或可能難以解讀 信號,其中包含在類型、星星、 或其他因素

項目矩陣與目標的欄數相同 。例如,針對某部電影 我們推薦系統評估 1 萬部電影作品, 項目矩陣有 10,000 欄。

items

#recsystems

推薦系統中, 按照系統建議的方式操作以影片來說,影片就是商店中的商品 書籍則是書店的推薦商品

M

矩陣分解

#recsystems

在數學中,一種用來找出內心積相近 目標矩陣

建議系統中,目標矩陣 經常擁有使用者對商品的評分。例如 電影推薦系統的矩陣會類似於 然後,其中正整數為使用者評分,0 則是 0 表示使用者未對電影評分:

  卡薩布蘭加 費城的故事 黑豹 神力女超人 啦啦隊
使用者 1 5.0 3.0 0.0 2.0 0.0
使用者 2 4.0 0.0 0.0 1.0 5.0
使用者 3 3.0 1.0 4.0 5.0 0.0

電影推薦系統的用意是預測使用者評分 未分級的電影。舉例來說,使用者 1 喜歡「黑豹」嗎?

推薦系統的一種方法是使用矩陣 分解來產生下列兩個矩陣:

例如,對三名使用者和五個項目使用矩陣分解 就能產生下列使用者矩陣和項目矩陣:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

使用者矩陣的內積和項目矩陣的內積會產生建議 不僅包含原始使用者評分,還包含預測 顯示使用者不曾看過的電影 舉例來說,假設使用者 1 的「Casablanca」評分為 5.0。圓點 與建議矩陣中該儲存格相對應的產品 大約是 5.0,計算方式為:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

更重要的是,使用者 1 是否喜歡「黑豹」?購買內積 而第三列則會產生預測值 4.3 顆星:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

矩陣分解通常會產生使用者矩陣和項目矩陣 比起目標矩陣,

R

推薦系統

#recsystems

替每位使用者選擇數量相對較少的系統 從大型語料庫擷取的 items。 舉例來說,影片推薦系統可能會推薦兩部影片 從 10 萬部影片的語料庫中挑選出「Casablanca」, 《The Philadelphia Story》單人、Wonder Woman黑色 Panther。影片推薦系統 並根據以下因素推薦內容:

  • 同類使用者評分或觀看過的電影。
  • 類型、導演、演員、目標客層...

重新排名

#recsystems

推薦系統的最後階段 在此期間,評分項目可能會根據其他部分需要重新評分 (通常是非機器學習) 演算法重新排名時,系統會評估 產生的分數,並採取以下動作:

  • 排除使用者已購買的商品。
  • 提高新物品的分數。

S

計分

#recsystems

推薦系統的一部分, 提供的每個項目 生成候選內容階段。

U

使用者矩陣

#recsystems

推薦系統中, 由 產生嵌入向量矩陣分解 保存有關使用者偏好的潛在信號 使用者矩陣的每一列都會保留相對資訊 為單一使用者選擇各種潛在信號的強度 以電影推薦系統為例,在這個系統中 使用者矩陣中的潛在信號可能代表每位使用者的興趣 或可能難以理解的信號 以取得不同因素的複雜互動

使用者矩陣會有每個潛在特徵的欄,以及每位使用者的一列。 也就是說,使用者矩陣與目標的列數相同 。例如,針對某部電影 1,000,000 位使用者的推薦系統 使用者矩陣會有 1,000,000 列

最小交替的最小平方 (WALS)

#recsystems

在這段時期內 將目標函式最小化的演算法 矩陣分解 一方面是推薦系統 降低遺漏樣本的權重WALS 將加權計算在內 原始矩陣與重新建構之間的平方誤差 用於修正列分解和資料欄分解作業。 每項最佳化方法都可用最小的平方來解決 對話最佳化。詳情請參閱 推薦系統課程