このページには、レコメンデーション システムの用語集が含まれています。すべての用語集で こちらをクリックしてください。
C
候補生成
最初に選択された推奨事項は、 レコメンデーション システム。たとえば、 10 万冊の書籍を販売する書店です。候補生成フェーズでは、 特定のユーザーに適した書籍のリスト(500 冊など)に絞ることもできます。しかし、 500 冊は多すぎてユーザーにおすすめできません。その後はより高価ですが レコメンデーション システムの各フェーズ(スコアリング、 再ランキングなど)です。 より有用な推奨事項が表示されます。
協調フィルタリング
1 人のユーザーの興味 / 関心に関する予測を行う 自動的に最適化されます。コラボレーション フィルタリング レコメンデーション システムでよく使用されます。
I
アイテム マトリックス
レコメンデーション システムでは、 次によって生成されるエンベディング ベクトルの行列 行列分解 各アイテムに関する潜在シグナルを保持する。 アイテム マトリックスの各行は 1 つの潜在値の値を保持する すべてのアイテムに適用されます。 たとえば、映画のレコメンデーション システムについて考えてみましょう。各列 アイテム マトリックスで 1 つの映画を表しています。潜在シグナル ジャンルを表している、または解釈しにくいものが使われている可能性がある 複雑な相互作用を含むシグナル おすすめします
アイテム マトリックスの列数がターゲットと同じ数である 行列を返します。たとえば、ある映画が 10,000 本の映画タイトルを評価するレコメンデーション システム、 アイテム マトリックスは 10,000 列になります。
アイテム
レコメンデーション システムでは、 表示されます。たとえば動画は 動画を保存するアイテムで 一方、本は書店が推奨するアイテムです。
M
行列分解
数学において、ドット積が近似値を持つ行列を求める ターゲット マトリックス
レコメンデーション システムにおけるターゲット マトリックス しばしばユーザーのitems に対する評価。たとえば、ターゲット 映画のレコメンデーション システムのマトリックスは、 正の整数はユーザーの評価で、0 は 0 です。 ユーザーが映画を評価していないことを意味します。
カサブランカ | フィラデルフィアの事例 | Black Panther(「ブラック パンサー」) | ワンダーウーマン | パルプ・フィクション | |
---|---|---|---|---|---|
ユーザー 1 | 5.0 | 3.0 | 0.0 | 2.0 | 0.0 |
ユーザー 2 | 4.0 | 0.0 | 0.0 | 1.0 | 5.0 |
ユーザー 3 | 3.0 | 1.0 | 4.0 | 5.0 | 0.0 |
映画のレコメンデーション システムは、 未評価の映画があります。たとえば、ユーザー 1 は Black Panther を好むか?
レコメンデーション システムの手法の一つとして、マトリックスを 次の 2 つの行列を生成します。
- ユーザー マトリックスは、ユーザー数 X、 エンベディング次元の数。
- アイテム マトリックス。エンベディングの数として形成されます。 寸法 × 項目数です。
たとえば、3 人のユーザーと 5 つのアイテムに対して行列分解を使用すると、 この場合、次のようなユーザー マトリックスとアイテム マトリックスが生成されます。
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
ユーザー マトリックスとアイテム マトリックスのドット積からレコメンデーションを生成 元のユーザー評価だけでなく予測も含んだ行列です。 各ユーザーがまだ見たことのない映画の タイムスタンプを取得できます。 たとえば、ユーザー 1 のカサブランカの評価は 5.0 でした。点 おすすめ商品マトリックスのそのセルに対応する うまくいけば 5.0 前後になります。
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
さらに重要なことは、ユーザー 1 はブラック パンサーが好きかということです。ドット積を取る 対応する文字が 1 行目の 3 列目に 評価: 4.3:
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
行列分解で生成されるユーザー マトリックスとアイテム マトリックスは通常、 ターゲット マトリックスよりも大幅にコンパクトになります。
R
レコメンデーション システム
比較的少ない数の望ましい会話セットを各ユーザーについて選択し、 大規模なコーパスからのアイテム。 たとえば、動画のおすすめシステムで 2 本の動画がおすすめとして 10 万本の動画コーパスから [Casablanca] を選択し、 The Philadelphia Story(1 人のユーザー)、Wonder Woman と ブラックパンサー。動画のおすすめシステムは 次のような要素に基づいて推奨事項が表示されます。
- 類似のユーザーが評価または視聴した映画。
- ジャンル、ディレクター、俳優、ターゲット層...
再ランキング
レコメンデーション システムの最終段階である スコア付きの項目が、他のステータスに基づいて再採点される場合があります。 (通常は ML 以外の)アルゴリズムを使用します。再ランキングで項目のリストが評価される スコアリング フェーズで生成されたものであり、次のアクションを実行します。
- ユーザーがすでに購入した商品を削除する。
- 新しいアイテムのスコアを上げる。
S
得点
レコメンデーション システムの一部は、 によって生成される各アイテムの値またはランキングが 候補生成フェーズでは、
U
ユーザー マトリックス
レコメンデーション システムでは、 エンべディング ベクトル 行列分解 保持します。 ユーザー マトリックスの各行には、関連する属性に関する情報が 1 人のユーザーのさまざまな潜在シグナルの強さ たとえば、映画のレコメンデーション システムについて考えてみましょう。このシステムでは ユーザー マトリックスの潜在シグナルが各ユーザーの興味 / 関心を表している 特定のジャンルの特定のオーディエンスにリーチしたり、 複数の要素にまたがる複雑なやり取りを 効率的に行えます
ユーザー マトリックスには、潜在する特徴の列とユーザーごとの行があります。 ユーザー マトリックスの行数がターゲットと同じである 行列を返します。たとえば、ある映画が 1,000,000 ユーザーを対象とするレコメンデーション システム、 行列は 1,000,000 行になります
W
重み付き交互最小二乗(WALS)
トレーニング中に目的関数を最小化するアルゴリズムは、 行列分解 レコメンデーション システムが導入され、 欠損サンプルの重みが軽減されますWALS は、重みベクトルを 元の行列と 行分解と列分解を交互に分解します。 これらの最適化はそれぞれ最小二乗法によって解くことができる 凸最適化。詳しくは、 レコメンデーション システム コース。