このページは Cloud Translation API によって翻訳されました。

コンテンツベースのフィルタリング

コンテンツベースフィルタリングでは、アイテムの機能を使用して他のアイテムをおすすめしています過去のアクションや明示的なリクエストに基づいてユーザーが好むものと類似していますできます。

コンテンツベースのフィルタリングのデモを行うために、いくつかの機能をハンドエンジニアリングしてみましょう。ダウンロードしてください次の図は、特徴量行列を示しています。各行はアプリを表し、各列は機能を表します。機能カテゴリ（教育、カジュアル、健康など）や多岐にわたります。簡単に説明すると、この特徴マトリックスはバイナリであるとします。ゼロ以外の値は、アプリにこの機能があることを意味します。

また、同じ特徴空間でユーザーを表します。ユーザー関連イベントには、ユーザーが明示的に提供することもできます。たとえばユーザーが "エンタメアプリ"選択します。暗黙的に指定することも、アプリを自動インストールできますたとえば、ユーザーが Science R Us が公開している別のアプリをインストールしました。

モデルは、このユーザーに関連するアイテムをおすすめします。そのためには、まず類似性指標（ドット積など）を選択します。次に、システムをセットアップし、この類似性に従って各候補アイテムをスコア付けします。表示されます。レコメンデーションは、このユーザーに特有のものであり、他のユーザーに関する情報は使用していませんでした。

ユーザーとおすすめのアプリを示したマトリックスの画像

類似度尺度としてドット積を使用する

ユーザーのエンベディングと \(x\) アプリが Embeddings \(y\) はどちらもバイナリベクトルです。以降 \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)、両方に表示される特徴が \(x\) \(y\) 求められます。つまり、 \(\langle x, y \rangle\) は両方のベクトルで同時にアクティブになる特徴のペア数です高ドット積は、より一般的な特徴を示すため、類似性が高くなります。

実際に試してみましょう。

前述のアプリの問題で、各アプリのドット積を計算します。その情報を元に、以下の質問に答えてください。

おすすめするアプリ

Science R Us が開発した教育アプリ。

正解です。このアイテムはドット積が最も高くなります 2 でユーザーは科学アプリや教育アプリをとても気に入っています。

Healthcare が作成した健康アプリ。

このアプリのスコアは 1 です。Google が推奨する最悪の推奨事項ではありません最善とはいえません

TimeWastr が作成したカジュアルアプリ。

このアプリのドット積が最も小さいのは 0 です。Google ユーザーはゲームなどのカジュアルアプリに興味がない。

候補生成の概要

メリットとデメリット

コンテンツ ベースのフィルタリング コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

類似度尺度としてドット積を使用する

実際に試してみましょう。

コンテンツベースのフィルタリング