• 目标检测框架py-faster-rcnn修改anchor_box


    众所周知,anchor_box控制了回归框的大小,我们有时候检测的是大物体或小物体时,需要调整回归框的大小的时候,得改一下anchor_box。
    基于rgb公开的py-faster-rcnn修改anchor_box的步骤有一下几步:
    1、修改py-faster-rcnn-my/lib/rpn下的三个文件:
    1)generate_anchors.py。将以下两行修改成你想要的模样,然后执行这个文件,记下
    执行后得到的结果的len。记anchor_box的个数。默认设置得到的是9个。因为是3个scale,3个ratios,从而得到的anchor_box的尺寸一共9种。
    #def generate_anchors(base_size=6, ratios=[0.5, 1, 2],
    #                     scales=2**np.arange(3, 6)):

    2)修改anchor_target_layer.py中的这一行:
    anchor_scales = layer_params.get('scales', (8, 16, 32))
    这个(8,16,32)是根据1)中scales生成的,2**np.arange(3, 6)即2的3 4 5次方,
    3)修改proposal_layer.py中的这一行:
    anchor_scales = layer_params.get('scales', (8, 16, 32))
    这个与2)类似。

    2、修改train.prototxt和test.prototxt。这两个文件的修改方法类似,我们就写其中一个:

    layer {
      name: "rpn_cls_score"
      type: "Convolution"
      bottom: "rpn/output"
      top: "rpn_cls_score"
      param { lr_mult: 1.0 }
      param { lr_mult: 2.0 }
      convolution_param {
        #num_output: 18   # 2(bg/fg) * 9(anchors)
    #根据你的anchor_box的个数修改。如果你第一步得到的尺寸是8个,那么这里就是16
        kernel_size: 1 pad: 0 stride: 1
        weight_filler { type: "gaussian" std: 0.01 }
        bias_filler { type: "constant" value: 0 }
      }
    }

    layer {
      name: "rpn_bbox_pred"
      type: "Convolution"
      bottom: "rpn/output"
      top: "rpn_bbox_pred"
      param { lr_mult: 1.0 }
      param { lr_mult: 2.0 }
      convolution_param {
        #num_output: 36   # 4 * 9(anchors)
    #同上,修改为anchors的尺寸个数的4倍。
        kernel_size: 1 pad: 0 stride: 1
        weight_filler { type: "gaussian" std: 0.01 }
        bias_filler { type: "constant" value: 0 }
      }
    }
    layer {
      name: 'rpn_cls_prob_reshape'
      type: 'Reshape'
      bottom: 'rpn_cls_prob'
      top: 'rpn_cls_prob_reshape'
      #reshape_param { shape { dim: 0 dim: 18 dim: -1 dim: 0 } }
    #修改dim的第二个为 2×anchor_box的个数
     
    }

    修改好后,开训,应该不会报错。记得要清楚上次训练是保存的一些cache。
    如果报错了,请留言与我联系。

    这个只是一些比较机械化的总结,希望大家通过这个为切入点,不断捋熟源码。才能随心所欲的实现自己的算法。

  • 相关阅读:
    在桌面创建robotframework Ride的快捷方式启动RIDE
    RIDE 接口自动化请求体参数中文时报错:“UnicodeDecodeError: 'ascii' codec can't decode byte 0xd7 in position 9......”
    下拉框选择
    Python下安装MySQLdb模块
    出现 Request Entity Too Large问题的解决方法
    Centos配置nginx反向代理8090端口到80端口
    超简单Centos+Docker+Halo搭建java向博客
    JAVA使用POI如何导出百万级别数据
    Mybatis的MapperRegistry错误
    Navicat连接mysql8出现1251错误
  • 原文地址:https://www.cnblogs.com/whu-zeng/p/7517480.html
Copyright © 2020-2023  润新知