En la etapa final de un sistema de recomendación, el sistema puede volver a clasificar que consideren criterios o limitaciones adicionales. Uno el enfoque de la reclasificación es usar filtros que quiten algunos candidatos.
Otro enfoque de reclasificación es transformar manualmente la puntuación que se devuelve por el clasificador.
En esta sección, se analiza brevemente la actualidad, la diversidad y la equidad. Estos son algunos de los diversos factores que pueden ayudarte a mejorar la recomendación en un sistema de archivos. Algunos de estos factores a menudo requieren la modificación de diferentes etapas del proceso. En cada sección, se ofrecen soluciones que podrías aplicar individual o colectivamente.
Actualidad
La mayoría de los sistemas de recomendación buscan incorporar la información de uso como el historial del usuario actual y los elementos más recientes. Mantener el modelo actualizado ayuda al modelo a hacer buenas recomendaciones.
Soluciones
- Vuelve a ejecutar el entrenamiento con la mayor frecuencia posible para aprender con los datos de entrenamiento más recientes. Recomendamos iniciar el entrenamiento en tibio para que el modelo no tenga volver a aprender desde cero. El inicio semicaliente puede reducir significativamente el entrenamiento tiempo. Por ejemplo, en la factorización de matrices, inicia en caliente las incorporaciones para que estaban presentes en la instancia anterior del modelo.
- Cómo crear un "promedio" usuario para representar a usuarios nuevos en la factorización de matrices e implementar modelos automáticamente. No necesitas la misma incorporación para cada usuario, ya que puede crear clústeres de usuarios en función de sus características.
- Usa una DNN, como un modelo de softmax o un modelo de dos torres. Dado que el modelo toma vectores de atributos como entrada, se puede ejecutar en una consulta o un elemento que no observadas durante el entrenamiento.
- Agregar la antigüedad del documento como atributo Por ejemplo, YouTube puede agregar la edad de un video o la hora de su última visualización como un atributo.
Diversidad
Si el sistema siempre recomienda los elementos que están "más cercanos" a la consulta los candidatos tienden a ser muy similares entre sí. Esta la falta de diversidad puede causar una experiencia del usuario mala o aburrida. Por ejemplo: Si YouTube solo recomienda videos muy similares al video que el usuario mirando, como los videos de búhos (como se muestra en la ilustración), es probable que el usuario pierda el interés rápidamente.
Soluciones
- Capacita a varios generadores de candidatos con diferentes fuentes.
- Entrenar a varios clasificadores con diferentes funciones objetivas
- Vuelve a clasificar los elementos según el género y otros metadatos para garantizar la diversidad.
Equidad
Tu modelo debe tratar a todos los usuarios de manera justa. Por lo tanto, asegúrate que tu modelo no aprenda sesgos inconscientes a partir de los datos de entrenamiento.
Soluciones
- Incluir diversas perspectivas en el diseño y el desarrollo.
- Entrenar modelos de AA con conjuntos de datos integrales Agrega datos auxiliares cuando tus datos están demasiado dispersos (por ejemplo, cuando ciertas categorías subrepresentadas).
- Hacer un seguimiento de las métricas (por ejemplo, exactitud y error absoluto) en cada para detectar sesgos.
- Crea modelos independientes para los grupos desfavorecidos.