Práctica de AA: Clasificación de imágenes

Evita el sobreajuste

Al igual que con cualquier modelo de aprendizaje automático, un problema clave a la hora de entrenar una red neuronal convolucional es el sobreajuste: un modelo tan alineado a las características específicas de los datos de entrenamiento que es incapaz de hacer generalizaciones ante ejemplos nuevos. A continuación, se describen dos técnicas para prevenir el sobreajuste al momento de crear una CNN:

  • Aumento de datos: Se incrementa de forma artificial la diversidad y cantidad de ejemplos de entrenamiento a través de transformaciones aleatorias sobre las imágenes existentes para crear un conjunto de variantes nuevas (consulta la Figura 7). El aumento de datos es especialmente útil cuando el conjunto original de datos de entrenamiento es relativamente pequeño.
  • Regularización de retirados: Se quitan de forma aleatoria unidades de la red neuronal durante un paso de gradiente de entrenamiento.

Diagrama del aumento de datos en una sola imagen de un perro, lo que produce 9 imágenes nuevas a través de transformaciones aleatorias Figura 7. Se muestra el aumento de datos en una sola imagen de un perro (extracto del conjunto de datos"Dogs vs. Cats" disponible en Kaggle). Izquierda: Imagen original de un perro extraída del conjunto de entrenamiento. Derecha: Nueve imágenes nuevas generadas a partir de la imagen original con transformaciones aleatorias.