Implémenter un modèle

Lorsque vous implémentez un modèle, commencez simple. La majeure partie du travail en ML concerne les données. Par conséquent, exécuter un pipeline complet pour un modèle complexe est plus difficile que d'itérer le modèle lui-même. Après avoir configuré votre pipeline de données et mis en œuvre un modèle simple utilisant quelques fonctionnalités, vous pouvez itérer pour créer un meilleur modèle.

Les modèles simples constituent une bonne base de référence, même si vous ne les lancez pas par la suite. En fait, un modèle simple est probablement mieux que vous ne le pensez. Commencer le processus simple vous aide à déterminer si un modèle complexe est justifié ou non.

Entraîner votre propre modèle ou utiliser un modèle déjà entraîné

Les modèles entraînés existent pour de nombreux cas d'utilisation et offrent de nombreux avantages. Toutefois, les modèles entraînés ne fonctionnent vraiment que lorsque l'étiquette et les caractéristiques correspondent exactement à votre ensemble de données. Par exemple, si un modèle entraîné utilise 25 caractéristiques et que votre ensemble de données n'en inclut que 24, le modèle entraîné fera très probablement de mauvaises prédictions.

Les professionnels du ML utilisent généralement des sous-sections d'entrées correspondantes d'un modèle entraîné pour le réglage ou l'apprentissage par transfert. Si aucun modèle entraîné n'existe pour votre cas d'utilisation particulier, envisagez d'utiliser les sous-sections d'un modèle entraîné pour entraîner le vôtre.

Pour en savoir plus sur les modèles entraînés, consultez

Surveillance

Lors de la formulation du problème, tenez compte de l'infrastructure de surveillance et d'alerte dont votre solution de ML a besoin.

Déploiement du modèle

Dans certains cas, un modèle nouvellement entraîné peut s'avérer moins performant que le modèle actuellement en production. Si c'est le cas, vous devez empêcher sa publication en production et recevoir une alerte indiquant que votre déploiement automatisé a échoué.

Décalage entraînement/livraison

Si l'une des caractéristiques entrantes utilisées pour l'inférence comporte des valeurs qui se situent en dehors de la plage de distribution des données utilisées pour l'entraînement, vous pouvez être averti, car il est probable que les prédictions du modèle soient médiocres. Par exemple, si votre modèle a été entraîné pour prédire les températures de villes équatoriales au niveau de la mer, votre système d'inférence doit vous alerter des données entrantes avec des latitudes et des longitudes, et/ou des altitudes situées en dehors de la plage sur laquelle le modèle a été entraîné. À l'inverse, le système d'inférence doit vous alerter si les prédictions du modèle se situent en dehors de la plage de distribution observée lors de l'entraînement.

Serveur d'inférence

Si vous fournissez des inférences via un système RPC, vous devez surveiller le serveur RPC lui-même et recevoir une alerte s'il cesse de fournir des inférences.