Implémenter un modèle

Lorsque vous implémentez un modèle, commencez simple. La majeure partie du travail en ML concerne les données. Par conséquent, il est plus difficile d'exécuter un pipeline complet pour un modèle complexe que d'itérer sur le modèle lui-même. Après avoir configuré votre pipeline de données et mis en œuvre un modèle simple utilisant quelques caractéristiques, vous pouvez itérer pour créer un meilleur modèle.

Les modèles simples constituent une bonne base de référence, même si vous ne les lancez pas. En fait, utiliser un modèle simple est probablement mieux que vous ne le pensez. Commencer par les choses simples vous aide à déterminer si un modèle complexe est même justifié ou non.

Entraîner votre propre modèle ou utiliser un modèle pré-entraîné

De nombreux modèles pré-entraînés existent pour divers cas d'utilisation et offrent de nombreux avantages. Toutefois, les modèles pré-entraînés ne fonctionnent réellement que lorsque l'étiquette et les caractéristiques correspondent exactement à votre ensemble de données. Par exemple, si un modèle pré-entraîné utilise 25 caractéristiques et que votre ensemble de données n'en comprend que 24, le modèle pré-entraîné fera très probablement de mauvaises prédictions.

En règle générale, les professionnels du ML utilisent des sous-sections correspondantes d'entrées d'un modèle pré-entraîné pour affiner l'apprentissage par transfert. Si aucun modèle pré-entraîné n'existe pour votre cas d'utilisation particulier, envisagez d'utiliser les sous-sections d'un modèle pré-entraîné lorsque vous entraînez le vôtre.

Pour en savoir plus sur les modèles pré-entraînés, consultez

Monitoring

Lors de l'analyse des problèmes, tenez compte de l'infrastructure de surveillance et d'alerte dont votre solution de ML a besoin.

Déployer le modèle

Dans certains cas, un modèle nouvellement entraîné peut être moins performant que le modèle actuellement en production. Si c'est le cas, empêchez sa mise en production et recevez une alerte indiquant que votre déploiement automatisé a échoué.

Décalage entraînement/diffusion

Si l'une des caractéristiques entrantes utilisées pour l'inférence présente des valeurs qui se situent en dehors de la plage de distribution des données utilisées pour l'entraînement, vous devez en être averti, car les prédictions sont probablement de mauvaise qualité. Par exemple, si votre modèle a été entraîné pour prédire les températures des villes équatoriales au niveau de la mer, votre système de diffusion doit vous alerter des données entrantes avec des latitudes et des longitudes, et/ou des altitudes situées en dehors de la plage sur laquelle le modèle a été entraîné. À l'inverse, le système de diffusion doit vous avertir si le modèle effectue des prédictions qui se situent en dehors de la plage de distribution observée pendant l'entraînement.

Serveur d'inférence

Si vous fournissez des inférences via un système RPC, vous devez surveiller le serveur RPC lui-même et recevoir une alerte s'il cesse de fournir des inférences.