目标检测之RCNN，fast RCNN，faster RCNN

目标检测之RCNN，fast RCNN，faster RCNN
RCNN:
1. 候选区生成(Selective Search)。
  1. 分割成2000左右的候选小区域
  2. 合并规则：颜色、纹理相近，尺度均匀，合并后形状规则
2. 特征提取。
  1. 归一候选区尺寸为227×227，归一方法。
  2. 使用在imageNet上的分类网络作为预训练网络，预训练网络输出4096维特征
  3. 预训练网络加上全连接层在分类数据集上预训练
3. 每一类使用SVM分类器
  1. 对预训练网络输出的4096维特征，使用多个SVM分类器进行判断
  2. 对于负样本过多的问题，使用hard negative mining，将重叠框小于阈值的作为负类。
4. 位置回归
  1. 训练回归器输出x,y,d,h偏移量
fast RCNN
1. 使用整张图片传入网络提取特征
2. 使用Selective search等方法得到候选区域，复用前面阶段的网络特征
3. 对候选区使用Roi Pooling层规定尺寸图像（全连接层需要相同大小的输入）
4. 输入到两个并行的全连接层中，分别计算损失
例如：
对于输入图像：

候选区域：

最后一个卷积层：

放大

归一尺寸的候选区域的特征：

和

faster RCNN

主要思想是使用最后一个卷积层来得到候选区域，faster RCNN相当于：候选区域生成网络+fast RCNN。
1. 特征提取网络，VGG-16等。网络输出5139256维特征
2. 使用3种面积，3种长宽总共9种候选窗口，称为：anchor，如图：
3. 训练过程中有四种损失：
  1. 区域生成网络的前后景分类损失（Object or not object）
  2. 区域生成网络的区域位置损失（Bounding box proposal）
  3. Fast RCNN物体分类损失（Normal object classification）
  4. Fast RCNN区域位置损失（Improve previous Bounding box proposal）
4. 训练方式：
  1. 轮流训练
  2. 近似联合训练
  3. 联合训练
整个结构：
相关阅读:
php7.4 降级 php7.1 的坑
 python 记录网页生成pdf
Mac 安装常用软件环境
 python 2.7 操作 excel
007整数反转
 006Z字形变换
 005最长回文子串
 004寻找两个正序数组的中位数
 003无重复字符的最长子串
 002两数相加
原文地址：https://www.cnblogs.com/sandy-t/p/7208568.html

目标检测之RCNN，fast RCNN，faster RCNN

RCNN:

fast RCNN

faster RCNN

整个结构：