经典目标检测框架的要点总结

经典目标检测框架的要点总结
本篇写于18年暑假，后来转战跟踪就没怎么更新过，梳理了几个经典目标检测的点，以及他们的性能分数，本打算做毕设的时候梳理借鉴，没想到只能到这里了。

一.RCNN
1. 选择性搜索
2. Crop后分类（两种传入网络的方法，那种长宽都缩放到网络大小的比较好）
3. 用SVM分类（FC的没有SVM的好，可能毕竟是没有训练吧）
4. 速度：50s/img（慢）
5. Bounding Box 回归
二.Fast-RCNN
1. ROI（可BP）
2. 建议区还是选择性搜索
3. 速度：0.32
三.Faster-RCNN
1. RPN 位置建议网络，输出那一层，每个卷积核对应一种anchor（不同大小长宽比）的一种属性（置信分、x,y,h,w）
2. ROI这里补充说明，RPN回归的x,y是浮点数，需要取整数、再打格子
3. 速度:0.2
四.RFCN
1. 是双阶段的（还是有rpn）
2. 没有后面的FC，而是改用卷积的形式
3. 还是打格子了，只是每个格子用一个卷积核来算，卷积核跑过一遍后，每个点就对应每个这个位置作为格子一角的分数
4. 取值的时候，PR对应的区域在map上打格子，属于同一个格子的点求平均（比如深蓝色属于左下角，但是PR只要ROI上的一小块，而不是整个ROI，最后这样组合起来投票）
五.YOLO (you only look once)
1. 最后又经历过FC
2. 既然是7*7，应该是对大目标比较好
六.Yolo2
1. 主要是trick（以前的问题现在看来是trick）
2. Anchor居然没有
3. DarkNet（速快，可用在移动端或者简化加速）
4. Yolo3的时候对小目标也不错了
七.PVANet

　　1.速度快性能好

　　2.crelu（减半的卷积数，差不多的性能），可以借鉴

八.SSD
1. 虽然是单阶段，但是输出层是有根据anchor来的
2. 没有特征融合？
3. 数据增强
4. 输入越大越好
九.RetinaNet
1. focal loss （单阶段不一定不好，只是训练样本的不均衡导致）
2. 单阶段+fpn
十.Mask-RCNN
1. Mask多任务
2. ROI Align （直接在回归的pr上打格子做插值）
十一.DSSD
1. 特征融合
2. 1*1的卷积（c）最好
3. 长宽比聚类
4. 测试的时候删除bn层，速度1:2× - 1:5×
十二.RefineDet
1. 单阶段的，快，好用，对小目标好
2. 有类似双阶段的anchor精炼过程
3. 带+号的是多尺度
十三.Deformable Convolutional Networks (DCN)
1. 卷积变形（偏移）
2. ROI偏移
3. 慢，但想法好
十四.CornerNet

论文地址：https://arxiv.org/abs/1808.01244

https://github.com/umich-vl/CornerNet
1. 角点检测（左上、右下）
2. 通过embeddings确认同目标的两点
3. 提出Corner pool，有效平滑特征图，凸显角点
4. 最后的角点还加了offset微调，就有点像双阶段
5. 基础网络用沙漏网络
6. 单阶段最佳
相关阅读:
可配置智联爬虫
 python 交错列表合并
 猫途鹰简单爬虫正则巩固
 urllib.error.URLError: urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:777) 解决办法
 与MongoDB有关的面试题
 go tcp socket
postgresql摘要
 go+postgresql服务器
 go map slice array channel 传参
 postgresql 数据库学习
原文地址：https://www.cnblogs.com/zhengyuqian/p/10494144.html