擷取

假設您有一個嵌入模型,針對一個使用者,你會如何 決定要建議的項目嗎?

在放送時,針對某項查詢,請執行下列其中一項操作:

  • 對於矩陣分解模型,查詢 (或使用者) 嵌入是已知的 而且系統只需從 使用者嵌入矩陣
  • 如果是 DNN 模型,系統會計算查詢嵌入 \(\psi(x)\) 方法是在特徵向量上執行該網路 \(x\)。

取得查詢嵌入 \(q\)後,請搜尋項目嵌入 \(V_j\) 靠近嵌入空間 \(q\) 。 這是最鄰近的問題。舉例來說,您可以將「前 K 個」傳回 相似程度分數為 \(s(q, V_j)\)的項目。

圖片:由多部電影和使用者排列的 2D 頻譜
從兒童電影、成人電影、藝術浩室到賣座鉅片一位使用者是
上方標示了兩部附近的電影

您也可以在相關商品建議中採用類似的做法。例如: 當使用者觀看 YouTube 影片時,系統可以先查詢 也可以尋找其他項目的嵌入 \(V_j\) 。

大規模擷取

為了計算嵌入空間中最鄰近的項目,系統會 並詳盡地為每位候選人評分完整評分 對大型語料庫來說 成本相當高昂 下列策略以提升效率:

  • 如果已知以靜態方式查詢嵌入,系統就能執行 離線評分、預先計算並儲存 各查詢最可能出現的候選項目。一般來說 相關商品建議。
  • 使用近似最鄰近鄰點。