深度学习（七）object detection

深度学习（七）object detection
目标检测（object detection）的基本思路：检测（detection）+ 定位（localization）

目标检测在很多场景有用，如无人驾驶和安防系统。
- 传统方法
　　特征提取算法（如：haar特征，HOG特征）+分类器（如：svm）
- 深度学习方法
  - R-CNN (Regions with CNN features) 基于卷积神经网络特征的区域方法
Selective Search to Extract Regions + CNN提取特征 + SVM分类

主要步骤：

(1) 输入测试图像

(2) 利用selective search算法在图像中提取2000个左右的region proposal。

(3) 将每个region proposal缩放（warp）成227x227的大小并输入到CNN，将CNN的fc7层的输出作为特征。

(4) 将每个region proposal提取到的CNN特征输入到SVM进行分类。
- - Fast-RCNN
去掉了单独SVM分类的部分，直接用CNN的网络实现分类

Fast R-CNN在整个图片上使用CNN，然后对特征映射使用“兴趣区域” (Region of Interest, RoI) 池化，最后使用前馈网络进行分类和回归。

主要步骤：

（1）在图像中确定约1000-2000个候选框 (使用选择性搜索)

（2）对整张图片输进CNN，得到feature map

（3）找到每个候选框在feature map上的映射patch，将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层

（4）对候选框中提取出的特征，使用分类器判别是否属于一个特定类

（5）对于属于某一特征的候选框，用回归器进一步调整其位置
- - Faster-RCNN
Faster-RCNN添加了区域提案网络 (Region Proposal Network, RPN)，摆脱了选择性搜索算法，并可以做到端到端的训练。

RPNs的任务是基于objectness分数输出对象，然后用RoI池化 (RoI Pooling) 和完全连接层分类。

主要步骤：

（1）对整张图片输进CNN，得到feature map

（2）卷积特征输入到RPN，得到候选框的特征信息

（3）对候选框中提取出的特征，使用分类器判别是否属于一个特定类

（4）对于属于某一特征的候选框，用回归器进一步调整其位置
- - SSD
SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。与faster rcnn相比，该算法没有生成 proposal 的过程，这就极大提高了检测速度。
- 代码实践
Reference：https://blog.csdn.net/f290131665/article/details/81012556
相关阅读:
SqlServer卸载实例
 java写的各种钟(收集)
Codeforces 1003D Coins and Queries 【性质】
Codeforces 997B Roman Digits【暴力】【枚举】
洛谷 P2679 子串【dp神题】【滚动数组】【2015 noip d2t2】
复习图论
 Codeforces 1000D Yet Another Problem On a Subsequence 【dp】【组合数学】
Codeforces 1000C Covered Points Count 【前缀和优化】
Codeforces 999F Cards and Joy 【dp】【性质】
Codeforces 999D Equalize the Remainders 【模拟】
原文地址：https://www.cnblogs.com/lightsun/p/9489426.html