• mask rcnn和roi-align


    faster-rcnn的github源码中是round四舍五入

    但kaiming he的ppt是直接取整

    1.讲roi-align和roi-pooling区别并且详细阐述roi-align过程的博客:http://blog.leanote.com/post/afanti/b5f4f526490b,此博主还有另外一篇在rfcn中

    使用roi-align的博客:http://blog.leanote.com/post/afanti/Position-Sensitive

    2.具体讲解roi-align的计算方式,并且有整个网络的结构图,几个链接也有一些slide,这个博主的文章值得关注:http://blog.csdn.net/u013010889/article/details/78588227

    3.Mask RCNN中的RoiAlign源码(caffe2)解读: http://blog.csdn.net/yiyouxian/article/details/79221830

    roi-align总结:对于每个roi,映射之后坐标保持浮点数,在此基础上再平均切分成k*k个bin,这个时候也保持浮点数。再把每个bin平均分成4个小的空间,然后计算每个小空间的中心点的像素点对应的概率值。这个像素点大概率是一个浮点数,实际上图像的浮点是没有像素值的,但这里假设这个浮点数的位置存储一个概率值,这个值由相邻最近的整数像素点存储的概率值经过双线性插值得到,其实也就是根据这个中心点所在的像素值找到所在的小空间对应的4个整数像素存储的值,然后乘以多个参数进行插值。这些参数其实就是那4个整数像素点和中心点的位置距离关系构成参数。最后再在每个bin中对4个中心点进行max或者mean的pooling。

  • 相关阅读:
    排序算法整理
    V-REP Plugin 开发
    YAML-CPP
    YAML
    V-REP Remote API
    V-REP Plugin
    结构化方法与面向对象方法的比较
    敏捷软件开发vs传统软件工程
    个人项目-地铁出行路线规划程序
    Week1个人作业
  • 原文地址:https://www.cnblogs.com/ymjyqsx/p/8522818.html
Copyright © 2020-2023  润新知