依據內容篩選

依據內容篩選功能會使用項目功能推薦其他項目 根據使用者先前的操作或 提供意見回饋。

為了示範依內容篩選的功能,我們 。下圖顯示特徵矩陣 每一列都代表一個應用程式,每欄代表一個特徵。功能與特色 可能包含類別 (例如教育、休閒、健康)、 等等為了簡單說明,假設這個特徵矩陣是二進位: 非零的值表示應用程式有該功能。

也可以在同一個功能空間代表使用者。一些使用者相關 功能可以明確提供舉例來說,使用者選取 「娛樂應用程式」。其他功能並不簡單 根據使用者先前安裝的應用程式 進行追蹤舉例來說,使用者 安裝了另一個由 Science R Us 發布的應用程式。

模型應推薦與這位使用者相關的商品。如要這麼做,您必須 首先選擇相似度指標 (例如內點產品)接著,您必須 也就是讓系統根據此相似度為每個候選項目評分 指標。請注意,這些建議僅適用於這位使用者,因為 不使用任何有關其他使用者的資訊。

圖片:顯示系統推薦的使用者和應用程式

使用內積計算相似度量

請考慮使用者嵌入 \(x\) 和應用程式 嵌入 \(y\) 都是二進位向量開始時間 \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)、 同時出現在兩者中, \(x\) 而且 \(y\) 貢獻 1 到 1 總和也就是說, \(\langle x, y \rangle\) 是數字 兩個向量內作用的特徵資訊高 藉此得出更共同的特徵,因此相似度也較高。

你自己試試看!

針對上述應用程式問題中的每個應用程式計算內積。 然後使用該資訊回答以下問題:

請問該推薦哪個應用程式?
Science R Us 打造的教育應用程式
答對了!這個商品的中點產品最高 2。我們的使用者很喜歡科學和教育類應用程式,
由 Healthcare 建立的健康應用程式。
這個應用程式的分數為 1。因為這不是我們推薦的 但絕對不是最好的證明
由 TimeWastr 開發的休閒應用程式。
這個應用程式實際上的點積是最低的 0。我們的 使用者對遊戲等休閒應用程式不感興趣。