再ランキング

レコメンデーション システムの最終段階では、特定のレコメンデーションを 追加の基準や制約を検討します。1 本 再ランキングのアプローチは、一部の候補を削除するフィルタを使用することです。

もう 1 つの再ランキング アプローチは、返されたスコアを手動で変換することです。 決定します。

このセクションでは、鮮度、多様性、公平性について簡単に説明します。 これらは、おすすめの精度を高めるのに役立つ要因の一つです ありませんいくつかの要因の中には、異なるステージの変更が必要になることもある 説明します。各セクションで、適用可能なソリューションを紹介します。 個別に、または一括で管理できます。

鮮度

ほとんどのレコメンデーション システムは、最新の使用状況情報を取り入れ、 最新のユーザー履歴や最新のアイテムなどを 確認できますモデルを最新の状態に保つ モデルが適切なレコメンデーションを行ううえで役立ちます。

ソリューション

  • 最新のトレーニング データで学習するために、トレーニングをできるだけ頻繁に再実行します。 トレーニングのウォーム スタートは、モデルにトレーニングの負荷が ゼロから再学習することですウォーム スタートを使用すると、トレーニングの あります。たとえば、行列分解では、1 つの行列のエンべディングを 以前のモデルに含まれていたアイテムだけを抽出できます。
  • 「平均的」を作成する行列分解で新規ユーザーを表す 構築できますユーザーごとに同じエンベディングを使用する必要はありません。 ユーザーの特徴に基づいてユーザーのクラスタを作成できます。
  • ソフトマックス モデルや Two-Tower モデルなどの DNN を使用します。モデルは 特徴ベクトルを入力として使用すると、特徴ベクトルが未定義のクエリや 表示されます。
  • ドキュメントの古さを特徴として追加します。たとえば、YouTube は動画の年齢や または特徴として最後に表示した時刻などです

フクロウに関するおすすめ動画 4 本の画像。

多様性

システムが常に「最も近い」商品アイテムを推奨する場合追加できます 候補が互いによく似ている傾向があります。この 多様性の欠如は ユーザーエクスペリエンスに悪影響を及ぼしたとえば ユーザーが視聴した動画によく似た動画が YouTube によっておすすめされた場合 たとえば、フクロウの動画だけを (図に示すように)すぐにユーザーの興味を失うことになりかねません。

ソリューション

  • さまざまなソースを使用して複数の候補生成ツールをトレーニングします。
  • さまざまな目的関数を使用して複数のランカーをトレーニングします。
  • 多様性を確保するため、ジャンルやその他のメタデータに基づいてアイテムのランクを変更してください。

公平さ

モデルはすべてのユーザーを公平に扱う必要があります。そのため モデルがトレーニング データから無意識のバイアスを学習していないこと。

ソリューション

  • 設計と開発に多様な視点を取り入れます。
  • 包括的なデータセットで ML モデルをトレーニングする。次の場合に補助データを追加する データがスパースすぎる場合(たとえば、特定のカテゴリが です。
  • 各指標(精度や絶対誤差など)を追跡する 偏見がないかを確認します
  • 十分なサービスを受けていないグループに対しては、個別のモデルを作成する。