• 软件杯_视频全量目标分析和建模_初步分析


    //需求分析:
    视频图像语义分割;
    对街景或高楼的高清视频进行目标检测和语义分割;对每帧的每个点的类别预测;
    相比于基于现有的方案进行简单的调参,更鼓励参赛者提出创新的深度学习算法模型解决方案;


    //知识储备--目标检测:
    目标检测主要有两个不同的思路。一种思路是借鉴语义分割的做法,这方面的工作主要有YOLO和SSD。另一种思路是把目标检测看作分类任务(bounding box里的对象的类别)和回归任务(bounding box的坐标)的组合,主要工作由R-CNN, SPP-Net, Fast R-CNN, Faster R-CNN。总的来说,思路一速度更高,精度稍差,主要用在实时性要求高的场合;思路二速度稍慢,精度更高,是主流方法。(https://www.pianshen.com/article/521528377/)

    //Faster R-CNN:
    该算法用一个快速神经网络代替了运算速度很慢的选择性搜索算法 :通过插入区域提议网络( RPN ),来预测来自特征的建议。 RPN 决定查 看“哪里”,这样可以减少整个推理过程的计算量。 
    RPN 快速且高效地扫描每一个位置,来评估在给定的区域内是否需 要作进一步处理,其实现方式如下:通过输出 k 个边界框建议,每个边界框建 议都有 2 个值——代表每个位置包含目标对象和不包含目标对象的概率。


    //语义分割
    从原理上来说,语义分割就是像素级别的分类,传统的方法也是直接按照这个思路来做的,效率比较低,而从FCN开始,语义分割有了相对比较专用的方法。
    0. 重要的数据集:PASCAL VOC和COCO

    全卷积网络( FCN ),它提出了端到端的卷积神经网络体系结构,在没有任何全连接层的情况下进行密集预测。
    这种方法允许针对任何尺寸的图像生成分割映射,并且比块分类算法快得多,几乎后续所有的语义分割算法都采用了这种范式。

    //实例分割
    实例分割将不同类型的实例进行分类,比如用 5 种不同颜色来标记 5 辆汽车。

  • 相关阅读:
    10.19JDBC之DBCP连接池的使用
    计时器Timer介绍
    Silverlight3.0 起步(一)——环境
    javascript 类
    RhinoMock入门(6)——安装结果和约束
    RhinoMock入门(4)——次序和委托
    javascript 表达式、括号、常用函数和jquery库怎么样实现的分析
    CSP加密服务(一)
    RhinoMock入门(5)——属性,方法和方法选项
    RhinoMock入门(7)——Do,With和Recordplayback
  • 原文地址:https://www.cnblogs.com/janeszj/p/12806532.html
Copyright © 2020-2023  润新知