Systèmes de production de ML

Le machine learning ne se limite pas à l'implémentation d'un algorithme de ML. Un système de ML en production comporte un grand nombre de composants.

Systèmes de production de ML

Schéma d'un système de ML montrant uniquement
Schéma d'un système de ML contenant les composants suivants: collecte des données, extraction de caractéristiques, outils de gestion des processus, vérification des données, configuration, gestion des ressources machine, surveillance et infrastructure de diffusion, et code de ML. La partie du code de ML du diagramme est recouverte par les neuf autres composants.
  • Non, vous n'avez pas besoin de tout construire vous-même.
    • Dans la mesure du possible, réutilisez des composants génériques du système de ML.
    • Les solutions Google Cloud ML incluent Dataflow et TF Serving
    • Les composants sont également disponibles sur d'autres plates-formes comme Spark, Hadoop, etc.
    • Comment savoir de quoi vous avez besoin ?
      • Comprendre quelques paradigmes du système de ML et leurs exigences

Résumé du cours vidéo

Jusqu'ici, le cours d'initiation au Machine Learning s'est concentré sur la création de modèles de ML. Toutefois, comme l'illustre la figure suivante, les systèmes de ML de production réels sont de grands écosystèmes dont le modèle n'est qu'une partie.

Schéma d'un système de ML contenant les composants suivants: collecte des données, extraction de caractéristiques, outils de gestion des processus, vérification des données, configuration, gestion des ressources machine, surveillance et infrastructure de diffusion, et code de ML. La partie du code de ML du diagramme est recouverte par les neuf autres composants.

Figure 1. Un système de ML de production réel.

Le code de ML est au cœur d'un système de production de ML réel, mais cette case représente souvent seulement 5% ou moins du code global de ce système de production de ML. (Il ne s'agit pas d'une erreur de saisie.) Notez qu'un système de production de ML consacre des ressources considérables à la saisie des données (collecte, vérification et extraction de caractéristiques). Notez également qu'une infrastructure de diffusion doit être en place pour que les prédictions du modèle de ML soient concrètement appliquées.

Heureusement, de nombreux composants de la figure précédente sont réutilisables. De plus, vous n'avez pas besoin de créer tous les composants de la figure 1 vous-même.

TensorFlow Extended (TFX) est une plate-forme de bout en bout permettant de déployer des pipelines de ML de production.

Les prochains modules vous aideront à prendre des décisions concernant la conception d'un système de ML en production.