转眼间已经研二了。突然想把曾经看过的文献总结总结与大家分享,留作纪念,方便以后參考。
1、深度追踪:通过卷积网络进行差异特征学习的视觉追踪(DeepTrack:Learning Discriminative Feature Representations by Convolutional Neural Networks for visual Tracking)(英文,会议论文,2014年。EI检索)
将卷积神经网络用于目标跟踪的一篇文章,可将CNN不只能够用做模式识别。做目标跟踪也是能够。毕竟本质上是一种特征提取的手段。
2、基于深度学习的车标识别方法研究(中文。期刊,2015年。知网)
将传统CNN用于车标识别,先进行车标定位提取。在送入CNN中进行训练,最后採用支持向量机进行分类,属于老方法新问题。实验硬件配置:主频2.80GHZCPU,2G内存,未用到GPU加速。
3、基于深度学习网络的射线图像缺陷识别方法(中文,期刊,2014年,知网)
将CNN直接用于射线图像缺陷检測,老方法新问题。对CNN结构描写叙述得非常清楚,适合CNN入门。
4、深度学习及其在目标和行为识别中的新进展(中文,期刊,2014年,知网)
主要综述了深度学习中自编码器和限制玻尔兹曼机的结构以及应用进展。综述比較全面,也够权威。对两者的原理和改进进展都描写叙述得非常清楚,指出“深度学习得到的是一个多层深度结构,信号在这个多层结构中进行传播,最后得到信号的表达。学习到多层的非线性的函数关系,更好的对视觉信息进行建模”,值得參考。
5、基于超像素卷积神经网络的显著性目标检測(Super CNN:A Superpixel wise Convolutional Neural Network for salient object detection)(英文,期刊,2015年,IEEE检索)
CNN在目标检測领域的应用,先对图像进行超像素切割,得到三个序列(超像素序列,一个空间核矩阵。一个范围核矩阵)。然后将三个序列送入三个卷积网络中进行训练,实现CNN的多通道输入。显著性主要通过超像素来体现。
只是文章实验的训练速度超级慢。须要4天到6天。
6、级联特征学习人脸识别(Joint Feature Learning for face Recognition)(英文,期刊,2015年,IEEE检索)
基本思想是“图像分块+深度学习”,而且实现训练的无监督化。类似于sparsity算法。是对深度学习的抽象借鉴。即仅仅借鉴了“深度”的概念。文章传递出一个重要信息:所谓的深度网络,就是在一层层的寻找映射矩阵。矩阵中的每一个系数都是待学习的參数。
7、使用稀疏表示和随机映射的鲁棒行人计数(Robust people counting using sparse representation and random projection)(英文。期刊。2015年,IEEE检索)
将CNN用于行人检測,实现了训练的半监督化。事实上就是sparsity算法,没有分块思想。没有超像素思想。
8、联合深度学习的行人检測(Joint Deep Learning for Pedestrain Detection)(英文。会议论文,2013年,IEEE检索)
将CNN用于行人检測。事实上CNN在行人检測方面的应用相对较多,改进方式也多种多样。
本文结合行人检測中的形变模型,对人体各个部分进行部件检測并打分。在形变层借鉴深度学习模型原理。属于对CNN的抽象改进。
9、基于多类别预測的深度学习人脸表示(Deep Learning Face Representation from Predicting 10000 classes)(英文。会议。2014年,IEEE检索)
香港中文大学DeepID一代算法文章,将CNN用于人脸认证,先对图像进行人脸关键点检測,并进行分块。CNN结构中採用Relu激活函数。并採样后两层映射结果进行特征融合,与联合贝叶斯分类器相结合,在CelebFace和LFW数据库上进行实验,达到97%正确率。
10、基于联合人脸认证确认的深度学习人脸表示(Deep Learning Face Representation by Joint Identification Verification)(英文,会议,2014年,NIPS)
香港中文大学DeepID二代算法文章,在一代算法基础上加入验证信号进行改进,并通过确认信号和验证信号的结合使用,提高类间离散度。减少类内离散度。并对多种确认信号进行了对照。在实验数据库上做了扩充,正确率达到99.15%
11、深度学习人脸表示的稀疏性、选择性和鲁棒性(Deep Learning face representation are sparse,selective and robust)(英文,会议,2014年。CVPR)
香港中文大学DeepID三代算法文章,输出层由160维提高到512维。扩充实验数据库(29万张训练样本),对每层神经网络都加入验证信号(二代算法仅仅验证后两层),同一时候对前两代算法进行总结,用实验论证CNN输出的稀疏性、选择性和鲁棒性,对CNN数据含义做了一定解释。