機器學習詞彙表:推薦系統

這個頁麵包含推薦系統的詞彙。如需所有詞彙詞彙,請按這裡

C

候選產生

#recsystems

推薦系統挑選的初始建議組合。舉例來說,假設有一本書店提供 100,000 本書。候選產生階段會針對特定使用者建立較小的適當書籍清單,例如 500。但即使是 500 本書,系統推薦給使用者閱讀的書籍也太多。推薦系統的後續結果 (例如評分重新排名) 是 500 級以下的更小且更實用的建議。

協作篩選

#recsystems

根據使用者對其他使用者的興趣進行預測。協作篩選功能通常用於推薦系統

I

項目矩陣

#recsystems

推薦系統中,由矩陣係數產生的嵌入向量矩陣,其中含有每個 item 的延遲信號。項目矩陣的每一列都保留所有項目的單一潛在特徵值。以電影推薦系統為例。項目矩陣中的每個資料欄都代表一部電影。延遲信號可能代表類型,或難以理解與類型、星號、電影年齡或其他因素相關的複雜互動信號。

項目矩陣的資料欄與目標矩陣的欄數相同。舉例來說,假設某個電影推薦系統評估了 10,000 部電影,則項目矩陣會有 10,000 個欄。

items

#recsystems

推薦系統中,系統建議的實體。舉例來說,影片是應用程式商店推薦的商品,而書籍則是書店所推薦的商品。

M

矩陣分解

#recsystems

在數學中,找出矩陣,其中點子產品概略的目標矩陣。

在「推薦系統中,目標矩陣經常將使用者的項目上的評分列入計算。例如,電影推薦系統的目標矩陣可能會如下所示,其中正整數是使用者評分,0 則代表使用者未對電影評分:

  卡薩布蘭加 費城費城 黑豹 神力女超人 黑色小說
使用者 1 5.0 3.0 0.0 2.0 0.0
使用者 2 4.0 0.0 0.0 1.0 5.0
使用者 3 3.0 1.0 4.0 5.0 0.0

電影推薦系統旨在預測未分級電影的使用者評分。舉例來說,使用者 1 和 Black Panther 一樣嗎?

推薦系統的其中一個做法是使用矩陣因式產生下列兩個矩陣:

  • 「使用者矩陣」,代表使用者人數 X 的嵌入尺寸數量。
  • 項目矩陣,以嵌入維度數量 X 做為項目數量。

例如,對三名使用者及 5 個項目使用矩陣分解可能會產生下列使用者矩陣和項目矩陣:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

使用者矩陣和項目矩陣的點子產品產生的建議矩陣不僅包含原始的使用者評分,也預測了每位使用者未看過的電影。例如,假設使用者 1 的 Casablanca 評等為 5.0。建議矩陣中的該儲存格對應的點產品應該要位於 5.0 左右,如下所示:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

更重要的是,使用者 1 是否為黑豹?將第一點產品對應至第一列,第三欄則產生 4.3 的預測評分:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

矩陣分解通常會導致使用者矩陣和項目矩陣,相較於目標矩陣,這來說會更密集。

(右)

推薦系統

#recsystems

為大量使用者選取相對較少的項目的系統。舉例來說,影片推薦系統可能會從 10 萬部影片庫中,推薦兩部影片,分別為一位使用者選取「Casablanca」和「Philadelphia Stories」,為另一個使用者選取「Wonder Woman」和「Black Panther」。影片推薦系統可能會根據多項因素推薦影片,例如:

  • 同類使用者曾經評分或觀看過的電影。
  • 類型、導演、演員、目標客層...

重新排名

#recsystems

推薦系統的最終階段,在評估某些分數項目時,可能會根據其他 (非機器學習) 演算法重新評分。重新排名會評估評分階段產生的項目清單,並執行以下動作:

  • 移除使用者購買的商品。
  • 提高新鮮商品的分數。

計分

#recsystems

建議系統的一部分,提供候選階段產生的每個項目的值或排名。

U

使用者矩陣

#recsystems

推薦系統中,由矩陣分解功能產生的嵌入向量,可存放使用者偏好設定的潛在信號。使用者矩陣的每一列都會保留單一使用者各種延遲信號的相對強度資訊。以電影推薦系統為例。在這個系統中,使用者矩陣中的延遲信號可能代表每位使用者對特定類型的興趣,或者可能較難解讀到涉及多種因素的複雜互動信號。

使用者矩陣中的每個資料欄分別存放各項隱形功能,並為每位使用者提供一列。 也就是說,使用者矩陣的資料列數與目標矩陣要相同。例如,假設某電影建議系統為 1,000,000 位使用者,則使用者矩陣會有 1,000,000 列。

加權最小最小平方 (WALS)

#recsystems

矩陣分解推薦系統的例子,WALS 會修正資料列係數和資料欄因數化,以減少原始矩陣和重新建構之間的加權加權錯誤。每項最佳化作業都能藉由多重對話最佳化來解決。詳情請參閱推薦系統課程