• Video surveillance 视频监控的基本概念


    视频包括::图像(还有文字)和音频

    视频的本质:具有时间顺序的图像序列。特点:价值密度低,体积大,增速快。

    关键帧:视频序列中的代表性帧

    视频的任务包括:(第一,物体的跟踪;第二,目标的分类识别;;第三,行为动作的识别)

    基于视频理解方向的就业职位

    视频推荐:微博,抖音,百度
    视频监控:海康,大华,宇视

    Intelligent Video surveillance 视频监控

    按对视频的理解层次,技术可以分为底层,中层和高层三个等级:

    1. 底层:目标跟踪(找出感兴趣的前景,持续追踪)
    2. 中层:目标分类与识别(前景是什么东西)-------一直在做的在这个位置
    3. 高层:行为动作分类(在做什么)---------视频理解,视频监控及人机交互的基础。

    智能:自动,全天候,实时分析及告警

    		1. 目标跟踪(底层,在哪里)
    		
    				运动目标检测(从背景中分离出运动的前景):
    					1.帧间差分
    					2.背景差分
    					3.光流法
    					
    				运动目标跟踪:(感觉跟踪是一个单独的话题,因此先不分散精力,作为了解就好)
    					1.卡尔曼滤波
    					2.粒子滤波
    					3.均值飘移
    
                    2. 物体分类识别(中层,是什么)
    
    
    			
    		3. 人的行为识别(高层,在干什么)
                            (属于模式识别,有一段典型动作编码,只需与此编码比对,区分行为动作类型。
    						目的:给一段视频序列打动作类型标签
                                                    应用:视频检索,视频推荐)
    						
    						
    			(13年的论文,传统方法)
    			3.1 模板匹配法:鲁棒性差
    			3.2 状态空间法:(概率转移法):通过将系列动作构建状态图,然后通过某种概率将这些状态节点的依存关系联系起来
    						动态贝叶斯网络
    						隐马科夫模型
    

    跟踪问题的解决方案

    1. 上个时代的巅峰--相关滤波(KCF)
    2. 如今是--基于SiamFC系列发展

    视频动作的特点

    1. 动作本身就具有时序动态变化:
    • 短暂的,如挥手
    • 连续一段时间的,如慢跑
    1. 算法时间成本:视频可能很长按天年计,因此时间成本很大。
      因此需要建模动作的动态变化

    根据复杂度和持续时间,行为分析(视频动作的类型)

    1. 静态姿势,如手势
    2. 运动行为 如单体普通动作(难点)
    3. 复杂事件行为(交互,群体行为)(难点)

    视频动作检测的任务

    1. 有没有某个标准动作
    2. 如果有,确定开始时间及结束时间

    动作分析的(瓶颈):

    1. 对于动作的定义不清,开始及结束时间点也不清楚
    2. 同一动作由于目标的尺度,相机的抖动,视角的变化导致同一动作类内方差大
    3. 当动作类型做空间细分时,如慢跑和跑步,不同模型的类间方差小。
    4. 复杂环境的遮挡
    5. 模型泛化能力
    6. 需要大量标注数据

    动作识别中研究哪些类型动作可以基于图像识别,哪些动作基于视频中的时空特征做,很重要。

    多相机目标跟踪:
    一个相机检测到新目标时,须与其他相机发生信息交互:系统内目标还是系统外目标,保证目标编号的唯一性。

    感知在自动驾驶领域只是一个重要的前置步骤,后期需要决策,规划,控制。视频监控则不然,视觉基本是主流,语音都很少。

    跟踪的指标:

    MOTA:1 -(所有帧中错误标记的跟踪目标数/所有帧中出现的跟踪目标之和),范围(-oo,1】

    人体动作识别

    按数据源又可分为:

    1. 基于RGB图像
    							传统的动作识别:
    								模板匹配
    								基于时空兴趣点
    								基于轨迹
    								
    							基于深度学习:
    								基于双流卷积网络(两个流之间没有信息交互)
    								基于三维卷积网络(考虑时间间隔很短,无法捕获长时信息)
    								基于lstm网络
    

    3D深度相机:在2D基础上加一个类似激光的传感器,可以返回深度信息(目标距离相机的距离)

    1. 基于RGB-D图像
    基于骨骼的方法(骨骼信息不受背景及光照影响,鲁棒性强,重点)
    基于深度序列的方法
    基于多特征融合的方法
    

    生物特征在识别领域的应用

    可作为生物特征的特征应具有的性质:

    1. 区别性
    2. 持久性
    3. 普遍性
    4. 易收集

    如人脸,手势,虹膜,眼周 指纹 。
    -------> 适用距离越来越短。

    比较重要的人脸及手势。

    人脸识别方法:

    • 最早:特征脸---对光照和姿态没有鲁棒性
    • PCA
    • LDA
    • LBP
      (特征向量)

    人脸识别的问题:监控场景人脸的图像分辨率太低

    PTZ相机监控系统:15m距离可获得高分人脸

  • 相关阅读:
    居中方法
    12个css实用技巧
    display元素来布局
    伪元素::before与:after
    弹性布局
    输入框下拉菜单
    HTMLinput日期输入类型
    模块XXXX可能与您正在运行的Windows版本不兼容。检查该模块是否与regsvr32.exe的x86(32位)x64(64位)版本兼容。
    Epoll为我们带来了什么
    C内存管理相关内容--取自高质量C++&C编程指南
  • 原文地址:https://www.cnblogs.com/Henry-ZHAO/p/13161602.html
Copyright © 2020-2023  润新知