協作篩選優勢 &缺點

優點

不需要網域知識

因為系統會自動學習嵌入,因此不需要網域知識。

可行性

此模式可協助使用者探索新的興趣。單獨來說,機器學習系統可能不知道使用者對特定項目感興趣的程度,但模型仍可能推薦,因為相似的使用者對該項項目感興趣。

好的起點

在某種程度上,系統只需要意見回饋矩陣,即可訓練矩陣分解模型。請特別注意,系統並不需要內容比對功能。在實務上,它可以用來當做多個候選產生器。

缺點

無法處理最新項目

指定 (使用者、項目) 配對的模型預測是對應嵌入的圓點產品。因此,如果在訓練期間看不到項目,系統就無法為其建立嵌入,也無法使用此項目查詢模型。這個問題通常稱為冷啟動問題。不過,下列技術在一定程度上可以解決冷啟動問題:

  • WALS 預測。假設新項目並未在訓練中 \(i_0\) 顯示,如果系統有幾項使用者互動,系統就會輕鬆為這個項目計算嵌入 \(v_{i_0}\) ,而無需重新訓練整個模型。系統只需解決下列方程式或加權版本:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    上述方程式對應 WALS 中的一項疊代作業:使用者嵌入項目會保持固定,而系統則解決了商品嵌入的 \(i_0\)。您也可以對新使用者。

  • 可產生新項目的嵌入經驗法則。如果系統沒有互動,系統會對同一類別的項目、從同一位上傳者 (在 YouTube 中) 的嵌入進行平均排序,以概略嵌入。

很難在查詢/項目中加入側邊功能

側邊功能是指查詢或項目 ID 以外的任何功能。電影推薦功能可能包括國家/地區或年齡包含可用的側邊功能可提升模型的品質。雖然要在 WALS 中加入側邊功能可能並不容易,但 WALS 一般化可實現這一點。

如要概括 WALS,請定義區塊矩陣 \(\bar A\),利用特徵來增強輸入矩陣,其中:

  • 區塊 (0, 0) 是原始意見回饋矩陣 \(A\)。
  • 區塊 (0, 1) 是多重功能的編碼。
  • 區塊 (1, 0) 是項目功能的多指令編碼。