協同過濾的優點 &缺點

優點

無需具備網域知識

我們不需要網域知識,因為系統會自動學習嵌入。

機緣

此模型可協助使用者發掘新的興趣。同理,機器學習系統可能會 不知道使用者對指定商品感興趣,但模型可能還是 推薦原因:類似使用者都對該項目感興趣。

踏出第一步

某種程度上,系統只需要回饋矩陣來訓練矩陣 分解模式尤其是,系統不需要內容相關功能。 實際上,這可做為多個候選產生器的其中一個。

缺點

無法處理新項目

針對特定使用者、物品組合的模型預測結果,是使用點 對應嵌入的乘積如果廣告客戶 系統無法為訓練作業建立嵌入 使用這個項目查詢模型這個問題通常稱為 冷啟動問題。不過,以下技巧可以解決 冷啟動問題可能性在某種程度上

  • WALS 的投影。假設訓練中未顯示 \(i_0\) 新項目, 如果系統與使用者進行過幾次互動 就能輕鬆計算這個項目的嵌入 \(v_{i_0}\) 項目 重新訓練整個模型系統只需解決以下問題 方程式或加權版本:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    上述方程式會對應至 WALS 中的一項疊代: 會保持固定的使用者嵌入,且系統會解決 (項目 \(i_0\))。新使用者也適用相同做法。

  • 產生新項目嵌入的經驗法則如果系統 沒有交互作用,系統可能會預估嵌入 方法是將來自相同類別項目的嵌入加以平均, 相同上傳者 (在 YouTube 中) 等

難以在查詢/項目中加入側邊功能

側邊功能是指查詢或項目 ID 以外的任何功能。電影適用 側邊功能可能包含國家/地區或年齡包含 可用的側面特徵可提升模型品質雖然 可能不容易在 WALS 中加入側邊功能 WALS 的一般化過程

如要一般化 WALS,請定義 區塊矩陣 \(\bar A\),其中:

  • 區塊 (0, 0) 是原始回饋矩陣 \(A\)。
  • 區塊 (0、1) 是使用者功能的多鏡頭編碼。
  • 區塊 (1, 0) 是項目功能的多鏡頭編碼。