Machine learning automatisé (AutoML)

Si vous démarrez un nouveau projet de machine learning (ML), vous vous demandez peut-être si l'entraînement manuel est la seule option pour créer un modèle de ML. Avec l'entraînement manuel, vous écrivez du code à l'aide d'un framework de ML pour créer un modèle. Pendant vous choisissez les algorithmes à explorer et vous les ajustez de manière itérative pour trouver le bon modèle.

Bien entendu, l'entraînement de modèle n'est pas la seule chose à laquelle vous devez penser. Dans pratique, en créant un modèle de machine learning, du prototype à la mise en production implique des tâches répétitives et des compétences spécialisées. Un modèle de ML simple d'exploration le workflow initial se présente comme suit:

Figure 1. Un workflow de machine learning simple
Image 1. Workflow d'exploration simple basé sur le machine learning

Tâches répétitives : le workflow de ML peut impliquer des tâches répétitives et et l'expérimentation. Par exemple, pendant le développement d'un modèle, explorer différentes combinaisons d'algorithmes et d'hyperparamètres pour identifier le modèle le plus approprié. Avec l'entraînement manuel, vous écrivez du code spécialisé entraîner le modèle, puis ajuster le code pour effectuer des tests avec différents modèles de ML et les hyperparamètres pour trouver le meilleur modèle. Pour les petites entreprises ce processus manuel n'est peut-être pas un problème, mais pour les grands projets, les tâches répétitives peuvent prendre du temps.

Compétences spécialisées : le développement manuel d'un modèle de ML implique compétences. En pratique, les équipes qui prévoient de développer un modèle de machine learning peuvent avoir ces compétences. Si l'équipe n'a pas de data scientist dédié, ce travail manuel pourrait même ne pas être réalisable.

Heureusement, certaines étapes du développement du modèle peuvent être automatisées la charge du travail répétitif et le besoin de compétences spécialisées. Automatiser ces et les tâches font l'objet de ce module sur le machine learning automatisé (AutoML).

Qu'est-ce qu'AutoML ?

AutoML est un processus qui automatise à certaines tâches d'un workflow de ML. AutoML est un ensemble d'outils et de technologies qui facilitent des modèles de machine learning plus rapides et plus accessibles à un groupe d'utilisateurs plus large. Bien que l'automatisation puisse être utile tout au long du workflow de ML, les tâches qui sont souvent associées à AutoML sont incluses dans le cycle de développement du modèle comme illustré dans la figure 1. Ces tâches répétitives incluent:

  • Ingénierie des données
    • Ingénierie des caractéristiques
    • Sélection des caractéristiques.
  • Formation
    • Identifier un algorithme de ML approprié
    • Sélectionner les meilleurs hyperparamètres
  • Analyse
    • Évaluer les métriques générées pendant l'entraînement sur la base des tests et des ensembles de données de validation.

Avec AutoML, vous pouvez vous concentrer sur vos données et votre problème de ML plutôt que sur les caractéristiques la sélection, le réglage des hyperparamètres et le choix du bon algorithme.