Lors de la dernière étape d'un système de recommandation, le système peut reclasser d'envisager des critères ou des contraintes supplémentaires. Un L'approche de reclassement consiste à utiliser des filtres qui suppriment certains candidats.
Une autre approche de reclassement consiste à transformer manuellement le score renvoyé par l'outil de classement.
Cette section traite brièvement de l'actualisation, de la diversité et de l'impartialité. Ces facteurs, parmi d'autres, peuvent vous aider à améliorer votre recommandation du système d'exploitation. Certains de ces facteurs nécessitent souvent de modifier différentes étapes du processus. Chaque section propose des solutions que vous pouvez appliquer individuellement ou collectivement.
Actualisation
La plupart des systèmes de recommandation visent à intégrer les dernières informations d'utilisation, telles que l'historique de l'utilisateur actuel et les éléments les plus récents. Maintenir le modèle à jour permet au modèle d'émettre de bonnes recommandations.
Solutions
- Réexécutez l'entraînement aussi souvent que possible pour tirer parti des données d'entraînement les plus récentes. Nous vous recommandons de démarrer l'entraînement à chaud pour éviter que le modèle pour réapprendre à partir de zéro. Un démarrage tiède peut réduire considérablement l'entraînement en temps réel. Par exemple, dans la factorisation matricielle, vous pouvez démarrer à chaud les représentations vectorielles continues qui étaient présents dans l'instance précédente du modèle.
- Créer une "moyenne" utilisateur pour représenter les nouveaux utilisateurs dans la factorisation matricielle des modèles de ML. Vous n'avez pas besoin de la même représentation vectorielle continue pour chaque utilisateur, peuvent créer des clusters d'utilisateurs en fonction des caractéristiques des utilisateurs.
- Utilisez un DNN tel qu'un modèle softmax ou un modèle à deux tours. Puisque le modèle prend vecteurs de caractéristiques en entrée, il peut être exécuté sur une requête ou un élément lors de l'entraînement.
- Ajoutez l'âge du document en tant que fonctionnalité. Par exemple, YouTube peut ajouter l'âge ou l'heure de sa dernière consultation en tant qu'élément géographique.
Diversité
Si le système recommande systématiquement les éléments les plus proches à la requête des représentations vectorielles continues, les candidats ont tendance à être très similaires les uns aux autres. Ce le manque de diversité peut nuire à l'expérience utilisateur ou ennuyeuse. Par exemple, si YouTube recommande simplement des vidéos très semblables à celle de l'utilisateur en train de regarder, comme des vidéos de hiboux (comme le montre l'illustration), il est probable que l'utilisateur perdra rapidement son intérêt.
Solutions
- Entraînez plusieurs générateurs de candidats à l'aide de différentes sources.
- Entraînez plusieurs classeurs à l'aide de différentes fonctions d'objectif.
- Reclassez les éléments en fonction du genre ou d'autres métadonnées pour garantir la diversité.
Équité
Votre modèle doit traiter tous les utilisateurs de manière équitable. Par conséquent, assurez-vous votre modèle n'apprend pas de biais inconscients à partir des données d'entraînement.
Solutions
- Inclure des perspectives différentes dans la conception et le développement.
- Entraînez des modèles de ML sur des ensembles de données complets. Ajoutez des données auxiliaires lorsque vos données sont trop creuses (par exemple, lorsque certaines catégories sont sous-représentées).
- Effectuez le suivi des métriques (par exemple, la justesse et l'erreur absolue) pour chaque démographiques pour surveiller les biais.
- Créez des modèles distincts pour les groupes sous-desservis.