優點
無需具備網域知識
我們不需要網域知識,因為系統會自動學習嵌入。機緣
此模型可協助使用者發掘新的興趣。同理,機器學習系統可能會 不知道使用者對指定商品感興趣,但模型可能還是 推薦原因:類似使用者都對該項目感興趣。踏出第一步
某種程度上,系統只需要回饋矩陣來訓練矩陣 分解模式尤其是,系統不需要內容相關功能。 實際上,這可做為多個候選產生器的其中一個。
缺點
無法處理新項目
針對特定使用者、物品組合的模型預測結果,是使用點 對應嵌入的乘積如果廣告客戶 系統無法為訓練作業建立嵌入 使用這個項目查詢模型這個問題通常稱為 冷啟動問題。不過,以下技巧可以解決 冷啟動問題可能性在某種程度上
WALS 的投影。假設訓練中未顯示 \(i_0\) 新項目, 如果系統與使用者進行過幾次互動 就能輕鬆計算這個項目的嵌入 \(v_{i_0}\) 項目 重新訓練整個模型系統只需解決以下問題 方程式或加權版本:
\[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]
上述方程式會對應至 WALS 中的一項疊代: 會保持固定的使用者嵌入,且系統會解決 (項目 \(i_0\))。新使用者也適用相同做法。
產生新項目嵌入的經驗法則如果系統 沒有交互作用,系統可能會預估嵌入 方法是將來自相同類別項目的嵌入加以平均, 相同上傳者 (在 YouTube 中) 等
難以在查詢/項目中加入側邊功能
側邊功能是指查詢或項目 ID 以外的任何功能。電影適用 側邊功能可能包含國家/地區或年齡包含 可用的側面特徵可提升模型品質雖然 可能不容易在 WALS 中加入側邊功能 WALS 的一般化過程
如要一般化 WALS,請定義 區塊矩陣 \(\bar A\),其中:
- 區塊 (0, 0) 是原始回饋矩陣 \(A\)。
- 區塊 (0、1) 是使用者功能的多鏡頭編碼。
- 區塊 (1, 0) 是項目功能的多鏡頭編碼。