版权声明:本文为博主原创文章,未经博主允许不得转载。
1、动机
anchor free 和 proposal free
anchor-based的弊病在于:
①模型计算量上,一个特征图像素点取很多个不同尺寸的候选框,正负样本失调、训练时计算所有候选框的IOU耗费计算力
②有很多需要优化的超参数
anchor-based被提出时的考虑:
①避免候选框上的所有目标可能存在区域的重复提取特征,可通过特征对应出原图上某块的特征
②不同尺度的候选框是为了解决不同大小目标的问题,高召回率需要更高密度的候选框(eg:180K候选框输入FPN网络
解决的思路是:训练期间对每一个前景像素为中心,预测4D向量(l,t,r,b),
2、方法
网络结构:
backbone+FPN+分类/回归/中心(center-ness分支)
具体细节:
①ground truth(x0,y0,x1,y1,c)表示候选目标的左上和右下角的坐标,c表示类别
②对第i层的特征和相对于原图的步长s,在第i层上的每个坐标映射到原图为中心,取xs+s/2为宽等确定位置,如果中心在真实目标框内,就会被赋值为其类别,否则为负样本(0)
③对(l,t,r,b)进行损失函数计算,
④通过一层的center-ness,减少定位离目标中心远,定义了计算公式并使用BCE损失函数计算,使远离目标中心的得分,从而被NMS筛选掉
3、总结:
该算法精度较高,速度较慢,实验结果没有贴,可以看论文,我自己看来,利用每一层步长,计算了目标的定位,采用center-ness对远离中心的样本进行了抑制,比较有用。
以上为个人理解,如有不当之处,欢迎指正交流~
每天进步一点点