ML プラクティス: 画像分類

理解度チェック: 畳み込み

2 次元の 3x3 畳み込みフィルタが、2 次元の 4 × 4 入力特徴マップに適用されます(パディングは追加されません)。

出力特徴マップの形状は?
2×2
3x3 フィルタは 4x4 フィーチャー マップ上をスライドするため、配置できる場所は 4 つあり、2x2 の出力フィーチャー マップになります。 4x4 フィーチャー マップ上をスライドする 3x3 の畳み込みフィルタを示すアニメーション。
           3x3 フィルタを配置できる一意の位置は 4 つあります。それぞれ、2x2 出力フィーチャー マップの 4 つの要素のいずれかに対応します。
3×3
フィルタ自体は 3x3 ですが、4x4 入力特徴マップに指定できるフィルタ位置は 9 個(3 倍 3 個)未満であるため、出力特徴マップは小さくなります。
4×4
パディングなしの入力特徴マップと同じ寸法の出力特徴マップを生成するには、畳み込みフィルタの形状が 1x1 である必要があります。1x1 より大きいフィルタは、入力特徴マップよりも小さい出力特徴マップを生成します。フィルタは 3x3 であるため、出力特徴マップは 4x4 より小さくする必要があります。