Glosario de aprendizaje automático: Sistemas de recomendación

En esta página, se incluyen los términos del glosario de los sistemas de recomendación. Para todos los términos del glosario, haz clic aquí.

C

generación de candidatos

#recsystems

Es el conjunto inicial de recomendaciones elegidas por una sistema de recomendación. Por ejemplo, considera un librería que ofrece 100,000 títulos. La fase de generación de candidatos crea una lista mucho más pequeña de libros adecuados para un usuario en particular, digamos 500. Pero incluso 500 libros son demasiados para recomendar a un usuario. Las entradas posteriores, son más costosas fases de un sistema de recomendación (como la puntuación y reclasificación) reducen los 500 a un valor conjunto de recomendaciones más útil.

filtrado colaborativo

#recsystems

Hacer predicciones sobre los intereses de un usuario en función de los intereses de muchos otros usuarios. Filtrado colaborativo se usa con frecuencia en los sistemas de recomendación.

I

matriz de elementos

#recsystems

En los sistemas de recomendación, se incluye una matriz de vectores de incorporación generados por factorización de matrices que contenga indicadores latentes sobre cada elemento. Cada fila de la matriz del elemento contiene el valor de un único elemento latente para todos los elementos. Por ejemplo, piensa en un sistema de recomendación de películas. Cada columna en la matriz de elementos representa una sola película. Los indicadores latentes pueden representar géneros o podrían ser más difíciles de interpretar. señales que implican interacciones complejas entre géneros, estrellas, la antigüedad de la película y otros factores.

La matriz de elementos tiene la misma cantidad de columnas que el objetivo. matriz que se factoriza. Por ejemplo, en el caso de una película de recomendación que evalúa 10,000 títulos de películas, el de elementos tendrán 10,000 columnas.

elementos

#recsystems

En un sistema de recomendaciones, las entidades que que recomienda un sistema. Por ejemplo, los videos son los elementos que una tienda de videos recomienda, mientras que los libros son los artículos que recomienda una librería.

M

factorización de matrices

#recsystems

En matemática, un mecanismo para encontrar las matrices cuyo producto escalar se aproxima a un matriz objetivo.

En los sistemas de recomendaciones, la matriz objetivo suele retener los datos de los usuarios calificaciones de los elementos. Por ejemplo, el objetivo para un sistema de recomendación de películas podría verse así después, donde los números enteros positivos son calificaciones de los usuarios y 0 significa que el usuario no calificó la película:

  Casablanca La historia de Filadelfia Pantera Negra Mujer Maravilla Tiempos violentos
Usuario 1 5.0 3.0 0.0 2.0 0.0
Usuario 2 4.0 0.0 0.0 1.0 5.0
Usuario 3 3.0 1.0 4.0 5.0 0.0

El sistema de recomendación de películas busca predecir las calificaciones de los usuarios películas sin clasificar. Por ejemplo, ¿le gustará al Usuario 1 Pantera Negra?

Un enfoque para los sistemas de recomendación es usar modelos la factorización para generar las dos matrices siguientes:

  • Una matriz de usuarios, formada por la cantidad de usuarios X la cantidad de dimensiones de incorporación.
  • Una matriz de elementos, formada por la cantidad de incorporaciones dimensiones X la cantidad de artículos.

Por ejemplo, el uso de la factorización de matrices en nuestros tres usuarios y cinco elementos podría generar la siguiente matriz de usuarios y matriz de elementos:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

El producto escalar de la matriz de usuarios y la matriz de elementos genera una recomendación que contiene no solo las calificaciones originales de los usuarios, sino también predicciones para las películas que ningún usuario ha visto. Por ejemplo, considera la calificación del Usuario 1 de Casablanca que fue de 5.0. El punto producto correspondiente a esa celda en la matriz de recomendaciones debe con suerte, será de alrededor de 5.0, y es:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Más importante aún, ¿al Usuario 1 le gustará Pantera Negra? Toma el producto escalar correspondiente a la primera fila y a la tercera columna produce un calificación de 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La factorización de matrices suele producir una matriz de usuarios y una matriz de elementos que, son mucho más compactos que la matriz objetivo.

R

sistema de recomendación

#recsystems

Es un sistema que selecciona para cada usuario un conjunto relativamente pequeño de items de un gran corpus. Por ejemplo, un sistema de recomendación de videos podría recomendar dos videos de un corpus de 100,000 videos, seleccionando Casablanca y La historia de Filadelfia para un usuario, y la Mujer Maravilla y Pantera Negra para otra. Un sistema de recomendación de videos puede basar sus recomendaciones en factores como los siguientes:

  • Películas que usuarios similares han calificado o visto
  • Género, directores, actores, segmento demográfico...

reclasificación

#recsystems

La última etapa de un sistema de recomendaciones: durante el cual los elementos calificados se pueden volver a calificar de acuerdo con alguna (por lo general, no de AA). La reclasificación evalúa la lista de elementos generados por la fase de puntuación, realizando acciones tales como:

  • Eliminar los elementos que el usuario ya compró
  • Aumentar la puntuación de elementos más recientes

S

puntuación

#recsystems

La parte de un sistema de recomendaciones que proporciona un valor o clasificación para cada elemento producido por el de generación de candidatos.

U

matriz de usuarios

#recsystems

En los sistemas de recomendación, se incluye un vector de incorporación generado por factorización de matrices que contiene indicadores latentes sobre las preferencias del usuario. Cada fila de la matriz de usuario contiene información sobre los la intensidad de varias señales latentes para un solo usuario. Por ejemplo, piensa en un sistema de recomendación de películas. En este sistema, las señales latentes de la matriz de usuarios podrían representar el interés de cada usuario géneros específicos, o podrían ser señales más difíciles de interpretar que impliquen interacciones complejas entre múltiples factores.

La matriz de usuarios tiene una columna para cada atributo latente y una fila para cada usuario. Es decir, la matriz de usuarios tiene la misma cantidad de filas que el objetivo. matriz que se factoriza. Por ejemplo, en el caso de una película de recomendación para 1,000,000 de usuarios, tendrá 1,000,000 de filas.

W

mínimos cuadrados ponderados alternos (WALS, Weighted Alternating Least Squares)

#recsystems

Un algoritmo para minimizar la función objetiva durante factorización de matrices en sistemas de recomendación, que permiten la reducción de la ponderación de los ejemplos faltantes. WALS minimiza la cantidad de error cuadrático entre la matriz original y la reconstrucción alternando entre corregir la factorización de filas y la factorización de columnas. Cada una de estas optimizaciones puede resolverse con mínimos cuadrados optimización convexa. Para obtener más información, consulta la Recommendation Systems.