ML-Praktikum: Bildklassifizierung

Wissenstest: Faltung

Ein zweidimensionaler 3×3-Faltungsfilter wird auf eine zweidimensionale 4×4-Eingabe-Feature-Map angewendet (kein Padding):

Welche Form hat die Ausgabefeature-Map?
2x2
Wenn der 3×3-Filter über die 4×4-Feature-Map gleitet, gibt es vier eindeutige Positionen, an denen er platziert werden kann. Das Ergebnis ist eine 2×2-Ausgabe-Feature-Map: Animation eines 3×3-Faltungsfilters, der über eine 4×4-Feature-Map gleitet.
           Es gibt vier eindeutige Positionen, an denen der 3×3-Filter platziert werden kann. Jede Position entspricht einem der vier Elemente in der 2×2-Ausgabe-Feature-Map.
3x3
Der Filter selbst ist zwar 3 × 3, die Ausgabemerkmal-Karte ist jedoch kleiner, da es weniger als 9 (3 × 3) mögliche Positionen gibt, an denen der Filter auf der 4 × 4-Eingabemerkmal-Karte platziert werden kann.
4x4
Wenn Sie eine Ausgabefeature-Map mit denselben Dimensionen wie die Eingabefeature-Map ohne Padding generieren möchten, muss der Faltungsfilter die Form 1 × 1 haben. Ein Filter, der größer als 1 × 1 ist, erzeugt eine Ausgabefeature-Map, die kleiner als die Eingabefeature-Map ist. Da unser Filter 3 × 3 ist, muss die Ausgabefeature-Map kleiner als 4 × 4 sein.