• 记录SSD中的一些东西


    AnnotatedDatum是存放图片和BBox的类

    // 估计是一张图片就对应于一个AnnotatedDatum
    message AnnotatedDatum { enum AnnotationType { BBOX = 0; }
    // 存储图片的数据,需要imdecode optional Datum datum = 1; // If there are "rich" annotations, specify the type of annotation. // Currently it only supports bounding box. // If there are no "rich" annotations, use label in datum instead. optional AnnotationType type = 2; // Each group contains annotation for a particular class.
    // 每一类都会有一个annotation_group保存属于改类的bbox repeated AnnotationGroup annotation_group = 3; }

    数据增强效果图

    假设原图输入是一张640*480的图片,这里由于版面问题我放缩了图片尺寸并且没做mean subtract,由于最后会有resize参数导致输出的图片都会resize到300x300,但是主要看的是增强的效果,SSD中的数据增强的顺序是:

    DistortImage: 这个主要是修改图片的brightness,contrast,saturation,hue,reordering channels,并没改变标签bbox

    ExpandImage: 这个主要是将DistortImage的图片用像素0进行扩展,标签bbox此时肯定会改变,就重新以黑边的左上角为原点计算[0,1]的bbox的左上角和右下角两个点坐标。

    BatchSampler: 由于这里选错图了,BatchSampler必须要有GT的存在才会生效,由于我做的是人的检测所以图中没人就不会生成sampled_bboxes,后面修改例子。sampled_bboxes的值是随机在[0, 1]上生成的bbox,并且和某个gt_bboxes的IOU在[min, max]之间。由于proto中配的max_sample都是为1,所以每个batch_sampler可能会有1个sampled_bbox,随机取一个sampled bbox并且裁剪图片和标签。标签裁剪也很好理解首先要通过ProjectBBox将原坐标系标签投影到裁剪后图片的新坐标系的坐标,然后再ClipBBox到[0,1]之间。

    Resize:放缩到300x300,最后将图片放缩到300x300,标签框也是线性放缩坐标而已。

    Crop:原本data_transformer还会crop的,这个参数是配在prototxt中,默认是原图 所以就和没crop一样。如果要crop的话标签也是会和之前BatchSampler那样处理。

      

  • 相关阅读:
    java栈的实现
    浅谈JSON
    Java反射机制及IoC原理
    ApplicationContext之getBean方法详解
    web.xml中的contextConfigLocation的作用
    ApplicationContext的名称解释
    spring boot如何处理异步请求异常
    screen工具实现简单分析
    SO_LINGER选项的作用和意义
    gcc的异常处理机制
  • 原文地址:https://www.cnblogs.com/Key-Ky/p/6866743.html
Copyright © 2020-2023  润新知