题目分析:
利用视觉分析技术对视频进行识别,主要是固定物体的识别,如建筑等,通过对不同物体的识别,分类,标注上不同的颜色
目标及应用场景:
我们设想的应用场景为无人驾驶或者盲人助手。我们希望通过的视频图像识别可以识别出画面里的盲道和障碍物或者马路的基本方向,可以向使用者作出一些提示。
需要学习的知识有:
1.基础知识:计算机视觉的基础(包括图像预处理和图像特征及描述),深度学习得基础和神经网络的基础知识。
2.工具库的应用:OpenCV Tensorflow Keras
需求分析
1.项目概述
1.1 系统功能
视频全量目标分析和建模利用人工智能进行视觉分析的技术,对街景或高楼的高清视频进行目标检测和语义分割,对每帧的每个点的类别预测,基于华为AI昇腾平台,通过显示不同的颜色和说明实现建筑物等固定目标以及移动目标的识别和分割,将其应用于人脸识别、车辆测别、车辆智能驾驶等方面,推动各行业视觉应用的发展。
用例描述:
1.2 业务描述
针对10分钟1080P视频,视频内容街景(行车记录仪、电影等拍摄)内容,需要利用视觉分析技术,对视频中的目标进行识别,主要是固定目标的识别,不同的目标通过颜色和说明进行识别和区分,实现每帧的每个点的类别预测。基础实现移动目标5中识别以上,中等要求实现移动目标10种识别,建筑物必须识别。
1.3 用户的特点
一般操作者:需要进行视频的识别
系统管理者:熟悉系统开发的技术,能够及时进行系统维护。
最终用户:面向广大人群,使用频率高
1.4 运行环境要求
苏鲲鹏生态创新中心提供AI开发和训练平台,适用于Windows操作系统 。
2.功能需求的描述
视频全量目标分析和建模描述
参与者:用户
主要事件流:
1、提交1080P视频进行识别;
2、系统对视频中的目标进行识别,实现每帧的每个点的预测;
3、通过不同的颜色和文字说明在界面中向用户展示识别的结果;
备选事件流:
1a.若提交的视频不满足要求,提示重新提交;
3.非功能需求
3.1 系统性能要求
a.时间特性
高效快速,简单快捷
b.精度要求
精确的图像分割
c.系统有效性
系统每天需要连续运行24小时,每周运行七天,包括公共假期和周末
d.容错性
视频目标识别准确无误
3.2 系统安全及保密要求
a用户只能够进行视频的提交和查看识别信息
3.3 系统备份与恢复要求
对于数据管理人员要熟悉录入数据的含义,并定时维护数据库数据,及时备份
学习路线
目前学习进度