定义: 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

设网络共有 N 层卷积层, 卷积核采用正方形, 记第 i 层卷积核大小为 (size_i), 步长为 (stride_i), 当我们计算 (feature space map) 经过第 N 层卷积(或者池化), 输出的一个 "像素"对应的感受野时, 计算过程如下(从上到下计算, 计算最后所得值就是对应的感受野), (field_{N}) 表示经过第 N 层卷积之后的 feature map 上一个像素点对应的感受野(只看宽度).
[egin {align*}
&field_{N} = size_N \
&quad quad vdots \
&field_{i} = (field_{i+1} - 1) imes stride_{i} + size_i \
&quad quad vdots \
&field_{1} = (field_{2} - 1) imes stride_{1} + size_1\
end {align*}
]
(field_{1}) 即为所求感受野.
(color{red}{举例如下(f ZFNet)}):

第 8 层为最后一个 feature map 大小为 13x13 这一层, 171 为该层 3 个像素在图片的感受野大小
layer | size | stride | 计算 |
---|---|---|---|
8th | 3 | 1 | 3 |
7th | 3 | 1 | (3-1)×1 + 3 = 5 |
6th | 3 | 1 | (5-1)×1 + 3 = 7 |
5th | 3 | 1 | (7-1)×1 + 3 = 9 |
4th | 3 | 2 | (9-1)×2 + 3 = 19 |
3rd | 5 | 2 | (19-1)×2 + 5 = 41 |
2nd | 3 | 2 | (41-1)×2 + 3 = 83 |
1st | 7 | 2 | (83-1)×2 + 2 = 171 |