Filtrado basado en el contenido

El filtrado basado en el contenido usa las funciones de los elementos para recomendar otros similares a lo que le gusta al usuario, según sus acciones anteriores o comentarios.

Para demostrar el filtrado basado en el contenido, hagamos ingeniería manual de algunas funciones. para Google Play Store. En la siguiente figura, se muestra una matriz de atributos, cada fila representa una app, y cada columna representa una función. Funciones puede incluir categorías (como Educación, Informal, Salud), el editor de la app y muchas más. Para simplificar, supongamos que esta matriz de atributos es binaria: un valor distinto de cero significa que la app tiene esa función.

También representas al usuario en el mismo espacio de atributos. Algunas de las funciones las funciones podrían ser proporcionadas explícitamente por el usuario. Por ejemplo, un usuario selecciona "Apps de entretenimiento" en su perfil. Otros atributos pueden ser implícitos, según las apps que hayan instalado previamente. Por ejemplo, el usuario instaló otra app publicada por Science R Us.

El modelo debe recomendar artículos relevantes para este usuario. Para ello, debes En primer lugar, elige una métrica de similitud (por ejemplo, producto punto). Luego, debes configura el sistema para calificar cada elemento candidato según esta similitud métrica Ten en cuenta que las recomendaciones son específicas para este usuario, ya que el modelo no usó ninguna información sobre otros usuarios.

Imagen de una matriz en la que se muestra un usuario y apps que podrían recomendarse

Usa el producto escalar como medida de similitud

Considera el caso en el que el usuario incorpora \(x\) y la app Embedding \(y\) son ambos vectores binarios. Desde \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), un aparece en ambos \(x\) y \(y\) contribuye un 1 a la suma. En otras palabras, \(\langle x, y \rangle\) es el número de atributos que están activos en ambos vectores al mismo tiempo. Alto punto product indica más características comunes y, por lo tanto, una mayor similitud.

¡Pruébalo!

Calcula el producto escalar de cada app del problema anterior de la app. Luego, utiliza esa información para responder la siguiente pregunta:

¿Qué app deberíamos recomendar?
La app educativa creada por Science R Us.
Estás en lo cierto. Este elemento tiene el producto con la puntuación más alta en 2. A nuestros usuarios realmente les gustan las apps educativas y de ciencia.
La app de salud creada por Healthcare.
Esta app obtiene un 1. No es la peor recomendación que podría hacer el sistema, pero no es el mejor.
La app informal creada por TimeWastr.
En realidad, esta app tiene el producto escalar más bajo con un valor de 0. Nuestro usuario no está interesado en aplicaciones casuales, como los juegos.