在推薦系統的最後階段,系統可能會重新 可能會考慮其他條件或限制。一 因此,重新排名是使用篩選器來移除部分候選項目。
另一種重新排名的方法是手動轉換傳回的分數 就可以直接提出變更
本節將簡要說明即時性、多元性和公平性。 這些因素有助於改善您的建議 有些人會將 Cloud Storage 視為檔案系統 但實際上不是有些因素通常需要修改不同階段 程序。各節都會提供適用的解決方案 個別或集體處理
即時性
大多數推薦系統的目標是整合最新的使用資訊, 例如目前的使用者記錄和最新項目。讓模型保持新鮮感 協助模型提出良好建議
解決方案
- 請盡可能多重新執行訓練,以便掌握最新的訓練資料。 建議您暖機訓練,讓模型沒有 從頭開始重新學習暖啟動可大幅減少訓練 讓應用程式從可以最快做出回應的位置 回應使用者要求例如在矩陣分解中,暖啟動 先前出現的項目
- 建立「平均值」使用者:在矩陣分解中代表新使用者 我們來看評估分類模型成效時 的喚回度和精確度指標您不必為每位使用者使用相同的嵌入 可根據使用者功能建立使用者叢集
- 使用 DNN,例如 softmax 模型或雙塔模型。由於模型需要 特徵向量做為輸入內容 都會出現在訓練過程中
- 新增文件存在時間做為地圖項目。舉例來說,YouTube 可以新增影片的年齡限制 或上次以地圖項目形式查看該功能的時間
多元化
如果系統始終推薦「最接近」的項目相關字詞 通常彼此非常相似這個 缺乏多樣性可能會導致使用者體驗不佳或無聊。例如: 如果 YouTube 推薦的影片與使用者的影片非常相似 就像沒有人在看貓頭鷹影片 (如上圖所示),使用者可能會快速失去興趣。
解決方案
- 運用不同來源訓練多個候選發電機。
- 使用不同目標函式訓練多個排名人員。
- 請根據類型或其他中繼資料為項目重新排名,確保內容多樣性。
公平性
您的模型應公平地對待所有使用者。因此,請務必確保 模型未從訓練資料中學習無意識偏誤。
解決方案
- 在設計和開發時納入多元觀點。
- 使用全方位的資料集訓練機器學習模型。新增輔助資料的時機 資料過於稀疏 ( 弱勢族群)。
- 追蹤每個指標的指標 (例如準確性和絕對誤差) 目標客層。
- 為不足的群組建立個別模型。