• R-FCN:Object Detection via Region-based Fully Convolutional Networks


    fast、faster这些网络都可以被roi-pooling层分成两个子网络:1.a shared,'fully convolutional' subnetwork

                               2.an roi-wise subnetwork(就是does not share computation的子网络)

    其实这样分是因为vgg、resnet是由全连接子网络和卷积子网络组成的,而fast、faster实际上就是在这两个子网络之间添加了roi-pooling和在最后修改了相应loss。

    图像级别的分类任务侧重于平移不变性(在一幅图片中平移一个物体而不改变它的判别结果),物体检测任务需要定义物体的具体位置,因此需要平移变换特性。

    ROI pooling前都是卷积,是具备平移不变性的,但一旦插入ROI pooling之后,后面的网络结构就不再具备平移不变性了,就解决了分类和定位的矛盾,但因为引入roi-wise layer,会牺牲训练和测试的效率。因此,本文想提出来的position sensitive score map这个概念是能把目标的位置信息融合进ROI pooling。

    R-FCN(基于区域的检测器)的方法是:在整个图像上共享计算,通过移除最后的fc层实现(即删除了所有的子网络)。使用“位置敏感的得分图”来解决了图像分类平移不变性与对象检测平移变化之间的矛盾。

          此矛盾为:物体分类要求平移不变性越大越好 (图像中物体的移动不用区分),而物体检测要求有平移变化。所以,ImageNet 分类领先的结果证明尽可能有平移不变性的全卷积结构更受亲睐。另一方面,物体检测任务需要一些平移变化的定位表示。比如,物体的平移应该使网络产生响应,这些响应对描述候选框覆盖真实物体的好坏是有意义的。我们假设图像分类网络的卷积层越深,则该网络对平移越不敏感。

          CNN随着网络深度的增加,网络对于位置(Position)的敏感度越来越低,也就是所谓的translation-invariance,但是在Detection的时候,需要对位置信息有很强的的敏感度。

  • 相关阅读:
    codeforce 272B Dima and Sequence
    Codeforce 270D Greenhouse Effect
    codeforce 270C Magical Boxes
    codeforce 270B Multithreading
    图论--Dijkstra算法总结
    图论--(技巧)超级源点与超级汇点
    图论--Floyd总结
    ZOJ 3932 Handshakes
    ZOJ 3932 Deque and Balls
    ZOJ 3927 Programming Ability Test
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/7640208.html
Copyright © 2020-2023  润新知