レコメンデーション システムの最終段階では、特定のレコメンデーションを 追加の基準や制約を検討します。1 本 再ランキングのアプローチは、一部の候補を削除するフィルタを使用することです。
もう 1 つの再ランキング アプローチは、返されたスコアを手動で変換することです。 決定します。
このセクションでは、鮮度、多様性、公平性について簡単に説明します。 これらは、おすすめの精度を高めるのに役立つ要因の一つです ありませんいくつかの要因の中には、異なるステージの変更が必要になることもある 説明します。各セクションで、適用可能なソリューションを紹介します。 個別に、または一括で管理できます。
鮮度
ほとんどのレコメンデーション システムは、最新の使用状況情報を取り入れ、 最新のユーザー履歴や最新のアイテムなどを 確認できますモデルを最新の状態に保つ モデルが適切なレコメンデーションを行ううえで役立ちます。
ソリューション
- 最新のトレーニング データで学習するために、トレーニングをできるだけ頻繁に再実行します。 トレーニングのウォーム スタートは、モデルにトレーニングの負荷が ゼロから再学習することですウォーム スタートを使用すると、トレーニングの あります。たとえば、行列分解では、1 つの行列のエンべディングを 以前のモデルに含まれていたアイテムだけを抽出できます。
- 「平均的」を作成する行列分解で新規ユーザーを表す 構築できますユーザーごとに同じエンベディングを使用する必要はありません。 ユーザーの特徴に基づいてユーザーのクラスタを作成できます。
- ソフトマックス モデルや Two-Tower モデルなどの DNN を使用します。モデルは 特徴ベクトルを入力として使用すると、特徴ベクトルが未定義のクエリや 表示されます。
- ドキュメントの古さを特徴として追加します。たとえば、YouTube は動画の年齢や または特徴として最後に表示した時刻などです
多様性
システムが常に「最も近い」商品アイテムを推奨する場合追加できます 候補が互いによく似ている傾向があります。この 多様性の欠如は ユーザーエクスペリエンスに悪影響を及ぼしたとえば ユーザーが視聴した動画によく似た動画が YouTube によっておすすめされた場合 たとえば、フクロウの動画だけを (図に示すように)すぐにユーザーの興味を失うことになりかねません。
ソリューション
- さまざまなソースを使用して複数の候補生成ツールをトレーニングします。
- さまざまな目的関数を使用して複数のランカーをトレーニングします。
- 多様性を確保するため、ジャンルやその他のメタデータに基づいてアイテムのランクを変更してください。
公平さ
モデルはすべてのユーザーを公平に扱う必要があります。そのため モデルがトレーニング データから無意識のバイアスを学習していないこと。
ソリューション
- 設計と開発に多様な視点を取り入れます。
- 包括的なデータセットで ML モデルをトレーニングする。次の場合に補助データを追加する データがスパースすぎる場合(たとえば、特定のカテゴリが です。
- 各指標(精度や絶対誤差など)を追跡する 偏見がないかを確認します
- 十分なサービスを受けていないグループに対しては、個別のモデルを作成する。