短短几年内图像识别这个任务已经做的很不错了。当然还有一些更有挑战性的任务,像语义分割等等。虽然图像上已经有了很大的进步,但视频方面却还是差的很远。视频信号相比于图像信号有更大的挑战,因为它是一个更高维的信号,里面的内容多样性也非常大。所以要去判断它、理解它都很困难,当然数据量很大也是另外一个问题。还有一个问题,在很多情况下,视频是实时的,比如监控,因此在处理速度等各方面都有很大的要求。而且标注视频数据时每一帧都要标注,也很耗费时间、精力和成本。这也是为什么视频发展相比图像来讲还是落后一些。缺少训练数据又是另外一个问题,如监控录像的数据很难获得。要解决这个问题,不能像其他视频一样可以从视频网站上找到很多数据做训练,所以发展也受到了阻碍,会稍微慢一点。
1 入门
1.《入门|一文概览视频目标分割》
- 翻译及推送:https://mp.weixin.qq.com/s/pGrzmq5aGoLb2uiJRYAXVw
- 原文链接:https://medium.com/@eddiesmo/video-object-segmentation-the-basics-758e77321914
2.理解
1. 知乎:关于机器学习的应用一般都用什么语言和平台?具体到视频分析用什么软件来分析?
- 张运明:“关于视频分析,我从我从事的智能监控方面来讲一下,其实就是图像的处理,首先要提取视频中的运动物体,常用算法有:帧差法,GMM,vibe等;提取前景(运动物体)后对其进行跟踪,跟踪的主要算法有:camshift,粒子滤波,TLD,压缩感知等;以及之后对监控视频的去模糊,去雾,夜视增强,行人检测,车牌检测,上下身颜色识别,人车分类、视频浓缩,不过这些,都可基于opencv来实现。”
3.应用
1.《从网络嘈杂的视频中进行学习》
2.《识别视视频中的人类活动》
- 2017年ActivityNet大数据活动识别挑战赛官网:http://activity-net.org/challenges/2017/
- 《Recognizing human actions in videos》by Twenty Billion Neurons 文章网盘链接:https://pan.baidu.com/s/1eSvQA6Q