fast rcnn 与rcnn的进步之处在于,
1、还是滑窗移动,但是已经不会将每个RGB图都塞进去,逐个图片提取特征,而是将原图输入网络,然后将特征图上与各个候选框对应,得到响应候选框的特征图。
2、不再利用SVM分类器进行分类,而是直接合并到CNN网络中去了。
如何利用CNN网络进行检测定位与分类的?
因为是利用候选框,这里就不考虑定位了,只需要将判断是目标的候选框利用感受野对应到原图就可以知道定位了(仍然考虑位置精修)。这里考虑分类。如rcnn算法,在pool5时会得到4096维特征,通过训练,会训练从4096维到N维的权重,使得对应的类输出为1,其余为0。