Práctica de AA: Clasificación de imágenes

Comprueba tu comprensión: Convolución

Se aplica un filtro convolucional de 3×3 de dos dimensiones a un mapa de atributos de entrada de 4×4 de dos dimensiones (sin padding agregado):

¿Cuál es la forma del mapa de atributos de salida?
2x2
Cuando el filtro de 3×3 se desliza sobre el mapa de atributos de 4×4, se descubren 4 ubicaciones únicas en las que se puede ubicar, lo que resulta en un mapa de atributos de salida de 2×2: Animación que muestra un filtro convolucional de 3×3 sobre un mapa de atributos de 4×4.
           Hay 4 posiciones únicas en las que se puede colocar el filtro de 3×3, cada una corresponde a uno de los 4 elementos en el mapa de atributos de salida de 2×2.
3x3
Si bien el filtro en sí es de 3×3, el mapa de atributos de salida es más pequeño porque hay menos de 9 (3 veces 3) ubicaciones posibles en las que se puede colocar el filtro en el mapa de atributos de entrada de 4×4.
Todoterreno
Para generar un mapa de atributos de salida con las mismas dimensiones que el mapa de atributos de entrada sin relleno, el filtro convolucional debe tener una forma de 1 x 1. Un filtro mayor que 1 × 1 producirá un mapa de atributos de salida que sea más pequeño que el mapa de atributos de entrada. Debido a que nuestro filtro es 3×3, el mapa de atributos de salida debe ser menor que 4×4.