Si estás comenzando un nuevo proyecto de aprendizaje automático (AA), es posible que te preguntes si el entrenamiento manual es tu única opción para crear un modelo de AA. Con el entrenamiento manual, escribes código con un framework de AA para crear un modelo. Durante este proceso, eliges qué algoritmos explorar y ajustas iterativamente los hiperparámetros para encontrar el modelo correcto.
Por supuesto, el entrenamiento del modelo no es lo único en lo que debes pensar. En la práctica, crear un modelo de aprendizaje automático desde el prototipo hasta la producción implica tareas repetitivas y habilidades especializadas. Un flujo de trabajo de aprendizaje automático exploratorio simple se ve de la siguiente manera:

Tareas repetitivas: El flujo de trabajo de AA puede implicar trabajo repetitivo y experimentación. Por ejemplo, durante el desarrollo del modelo, por lo general, debes explorar diferentes combinaciones de algoritmos y hiperparámetros para identificar el modelo más adecuado. Con el entrenamiento manual, escribes código especializado para entrenar el modelo y, luego, lo ajustas para ejecutar experimentos con diferentes algoritmos y hiperparámetros de AA para encontrar el mejor modelo. Para proyectos pequeños o exploratorios, este proceso manual puede no ser un problema, pero para proyectos más grandes, estas tareas repetitivas pueden llevar mucho tiempo.
Habilidades especializadas: El desarrollo manual de un modelo de AA requiere habilidades especializadas. En la práctica, es posible que no todos los equipos que planean desarrollar un modelo de aprendizaje automático tenga estas habilidades. Si un equipo no tiene un científico de datos dedicado, es posible que ni siquiera sea factible realizar este trabajo de forma manual.
Por suerte, ciertos pasos en el desarrollo de modelos se pueden automatizar para reducir la carga de trabajo repetitivo y la necesidad de habilidades especializadas. La automatización de estas tareas es el tema de este módulo sobre el aprendizaje automático automatizado (AutoML).
¿Qué es AutoML?
AutoML es un proceso de automatización de ciertas tareas en un flujo de trabajo de aprendizaje automático. Puedes considerar AutoML como un conjunto de herramientas y tecnologías que hacen que la compilación de modelos de aprendizaje automático sea más rápida y accesible para un grupo más amplio de usuarios. Si bien la automatización puede ayudar en todo el flujo de trabajo de AA, las tareas que a menudo se asocian con AutoML son las que se incluyen en el ciclo de desarrollo del modelo que se muestra en la Figura 1. Entre estas tareas repetitivas, se incluyen las siguientes:
- Ingeniería de datos
- Ingeniería de atributos.
- Selección de los atributos.
- Capacitación
- Identificar un algoritmo de AA adecuado
- Selecciona los mejores hiperparámetros.
- Análisis
- Evaluar las métricas generadas durante el entrenamiento en función de los conjuntos de datos de prueba y validación
Con AutoML, puedes enfocarte en tu problema y tus datos de AA en lugar de la selección de atributos, el ajuste de hiperparámetros y la elección del algoritmo correcto.