Aprovecha modelos preentrenados
Entrenar una red neuronal convolucional para realizar tareas de clasificación de imágenes suele requerir una gran cantidad de datos de entrenamiento y puede llevar mucho tiempo, días o incluso semanas en completarse. Pero ¿qué pasaría si pudieras utilizar modelos de imágenes existentes entrenados con enormes conjuntos de datos, como a través de TensorFlow-Slim, y adaptarlos para usarlos en tus propias tareas de clasificación?
Una técnica común para aprovechar los modelos previamente entrenados es la extracción de atributos: recuperar las representaciones intermedias producidas por el modelo previamente entrenado y, luego, ingresarlas en un modelo nuevo como entrada. Por ejemplo, si entrenas un modelo de clasificación de imágenes para distinguir diferentes tipos de vegetales, puedes incorporar imágenes de entrenamiento de zanahorias, apio, etc., en un modelo previamente entrenado y, luego, extraer los atributos de su capa de convolución final, que capturan toda la información que el modelo aprendió sobre las imágenes, la estructura, la estructura, la forma de los datos, la estructura, los atributos y la estructura inicial. Para aumentar el rendimiento cuando se usa la extracción de atributos con un modelo previamente entrenado, los ingenieros suelen ajustar los parámetros de ponderación que se aplican a los atributos extraídos.
Para obtener una exploración más detallada de la extracción de atributos y el ajuste cuando se usan modelos previamente entrenados, consulta el siguiente ejercicio.