引言
对于小目标通常需要用到多尺度检测,作者提出的FPN是一种快速且效果好的多尺度检测方法。
方法
a,b,c是之前的方法,其中a,c用到了多尺度检测的思想,但他们都存在明显的缺点。
a方法:把每图片都进行缩放,在进行检测,这种做法最大的问题是太慢,因为要多花好几倍的时间;
c方法:其实就是SSD论文中用到的方法,feature map一层层下采样,然后对不同scale的feature map之间进行预测,这种做法最大的缺点就是底层feature map分辨率高但是语义信息弱,分类不准;
而作者在论文中提出的新方法——FPN(特征金字塔网络),速度跟c一样快同时比c更准。
其实原理非常简单:
我们知道,底层的feature map分辨率高但是语义信息弱,顶层的feature map分辨率低但是语义信息强,因此只用将顶层的语义信息传给底层,就能让其分类更精准。
作者采用的方法,就是将上层的feature map上采样到2倍,然后跟经过1*1 conv的相邻下层feature map直接相加。
总结
FPN论文的贡献非常大,提出让不同层的feature map信息融合的思想,广为后人借鉴。比如SSD的升级版DSSD,用到的反卷积层就是同样的原理,效果也非常好。