Aprendizaje automático automatizado (AutoML)

Si estás comenzando un nuevo proyecto de aprendizaje automático (AA), es posible que te preguntes si el entrenamiento manual es tu única opción para crear un modelo de aprendizaje automático. Con manual, escribes código usando un framework de AA para crear un modelo. Durante en este proceso, debes elegir qué algoritmos explorar y ajustar de manera iterativa hiperparámetros para encontrar el modelo correcto.

Por supuesto, el entrenamiento del modelo no es lo único en lo que debes pensar. En práctica, crear un modelo de aprendizaje automático desde el prototipo hasta la producción implica tareas repetitivas y habilidades especializadas. Un AA exploratorio simple El flujo de trabajo se ve más o menos así:

Figura 1: Un flujo de trabajo sencillo de aprendizaje automático.
Figura 1: Flujo de trabajo sencillo de exploración de aprendizaje automático.

Tareas repetitivas: El flujo de trabajo del AA puede implicar trabajo repetitivo. para realizar experimentos. Por ejemplo, durante el desarrollo del modelo, generalmente necesitas hacer lo siguiente: explorar diferentes combinaciones de algoritmos e hiperparámetros para identificar el modelo más adecuado. Con el entrenamiento manual, escribes código especializado para entrenar el modelo y ajustar el código para ejecutar experimentos con diferentes hiperparámetros y algoritmos para encontrar el mejor modelo. Para actividades pequeñas o de exploración para proyectos, este proceso manual puede no ser un problema, pero para proyectos más grandes, tareas repetitivas puede llevar mucho tiempo.

Habilidades especializadas: El desarrollo manual de un modelo de AA requiere y habilidades de comunicación. En la práctica, no todos los equipos planean desarrollar un modelo de aprendizaje automático podrían tener estas habilidades. Si un equipo no tiene un científico de datos dedicado, hacer este trabajo manualmente podría incluso no ser factible.

Por suerte, se pueden automatizar ciertos pasos en el desarrollo del modelo trabajo repetitivo y la necesidad de contar con habilidades especializadas. Automatizar estas tareas es el tema de este módulo sobre aprendizaje automático automatizado (AutoML).

¿Qué es AutoML?

AutoML es un proceso de automatización ciertas tareas en un flujo de trabajo de aprendizaje automático. Piensa en AutoML como un conjunto de herramientas y tecnologías que facilitan modelos de aprendizaje automático más rápidos y accesibles para un grupo más amplio de usuarios. Aunque la automatización puede ayudar en todo el flujo de trabajo del AA, las tareas que suelen asociados con AutoML son las que se incluyen en el ciclo de desarrollo del modelo como se muestra en la Figura 1. Estas tareas repetitivas incluyen lo siguiente:

  • Ingeniería de datos
    • Ingeniería de atributos
    • Selección de los atributos.
  • Capacitación
    • La identificación de un algoritmo de AA adecuado
    • Seleccionar los mejores hiperparámetros
  • Análisis
    • La evaluación de las métricas generadas durante el entrenamiento según las pruebas y conjuntos de datos de validación.

Con AutoML, puedes enfocarte en tu problema y tus datos de AA en lugar de en los atributos el ajuste de hiperparámetros y la elección del algoritmo correcto.