ML Practicum: classificazione delle immagini

Verifica le tue conoscenze: la convoluzione

Un filtro convoluzionale 3x3 bidimensionale viene applicato a una mappa delle funzionalità di input 4x4 bidimensionale (senza spaziatura interna aggiunta):

Qual è la forma della mappa delle funzionalità di output?
2x2
Poiché il filtro 3 x 3 scorre sulla mappa delle caratteristiche 4 x 4, esistono quattro posizioni uniche in cui può essere posizionata, il che si traduce in una mappa delle caratteristiche di output 2 x 2: Animazione che mostra un filtro convoluzionale 3x3 che scorre su una mappa di funzionalità 4x4.
           In 4 posizioni uniche è possibile posizionare il filtro 3 x 3, ognuno corrispondente a uno dei 4 elementi nella mappa delle funzionalità di output 2 x 2.
3x3
Sebbene il filtro stesso sia 3x3, la mappa delle funzionalità di output è più piccola perché ci sono meno di 9 (3 volte 3) possibili posizioni in cui il filtro può essere posizionato sulla mappa delle funzionalità di input 4x4.
4x4
Per generare una mappa delle caratteristiche di output con le stesse dimensioni della mappa delle caratteristiche di input senza spaziatura interna, il filtro convoluzionale deve avere una forma di 1x1. Un filtro più grande di 1 x 1 produrrà una mappa delle caratteristiche di output inferiore alla mappa delle caratteristiche di input. Poiché il nostro filtro è 3x3, la mappa delle caratteristiche di output deve essere più piccola di 4 x 4.