人脸识别与人体动作识别技术及应用
曹林 2015/8/1 电子工业出版社
一、绪论
1、国内外人脸库介绍:
1)、FERET人脸数据库:美军建立,在不同姿态、表情、光照条件下采集,西方人构成,人种单一
2)、CMU-PIE人脸数据库:美卡梅隆大学建立,对姿态光照进行了严格控制
3)、YALE人脸数据库:耶鲁大学建立,15名志愿者
4)、OLR人脸数据库:剑桥大学AT&T实验室建立,常用研究数据库之一
5)、MIt人脸数据库:麻省理工大学建立,16名志愿者
6)、CAS-PEAL人脸数据库:中科院建立,对应不同表情、光照、年龄、饰物等条件下
7)、BJUT—3D 3D人脸数据库:北京工业大学建立
8)、CHUK素描人脸数据库:香港大学建立
2、对人脸识别技术的影响的因素:
光照:
解决办法:a、通过算法进行光照补偿处理,成本低但效果不好
b 、通过外部条件补光,效果好,成本大
姿态:
解决办法:a、加入其他类型姿态的人脸,比较麻烦
b 采用3D人脸,可旋转改变姿态
目标图像的分辨率:(分辨率高保留图像的信息高)
解决办法: a、增强监控设备
b利用图像超分辨率算法重建
3、图像超分辨率的介绍:
利用软件的方法将一幅或多幅低分辨率的图像重建成一幅高分辨率的图像
应用前景:
公共安全领域、医疗图像领域、卫星遥感图像领域、军事应用领域、数字电视领域、历史以及人文照片的复原
发展前景:
证件识别(护照等。。。)、刑侦破案、重要地方的监控系统、高清视频会议、人脸表情分析
4、低分辨率图像退化模型
退化模型:L(k)=DB(k)M(k)*H+n(k) (k是下标)
组成:运动形变、模糊、下采样、噪声
运动形变:实景与设备之间的相对运动
模糊:主要影响伊因素是光照
下采样:下采样会丢失图像部分信息
噪声:噪声对人的影响噪声可以理解为“ 妨碍人们感觉器官对所接收的信源信息理解的因素”。而图像中各种妨碍人们对其信息接受的因素即可称为图像噪声 。
5、计算机视觉技术
目的:让计算机能对外界获取的信息进行智能化的分析与处理,模拟人脑功能
用途:提高视频监控、安防系统等智能化程度,以便充分发挥视频监控系统的主动监督作用、及时报警预防安全事故发生
6、人体行为视频数据库
Weizmann人体行为数据库:以色列科学院采集,在背景、拍摄角度不变情况下,采集10种不同动作
KThan人体行为数据库:瑞典皇家理工学院采集,背景相对静止,镜头有拉近、远的操作,采集6种不同动作
中科院人体行为数据库:中科院建立,拍摄角度为斜视、俯视、平视,包含单人以及多人交互行为,8中单人行为,多人交互行为有劫持、打架等
二、人脸图像配准和人脸检测跟踪
1、人脸配准
定义:将人脸图像分辨率变为一致,各个关键特征部位的坐标尽量接近
2D人脸配准:(信息量少,特征点不多,配准比较容易,算法也比较成熟)
手动标定:直接手动操作得到各个特征点坐标再使用线性变换得到配准
利用人眼检测手段:寻找图像特征点再进行配准 (人眼滤波器)
两者之间:少量人眼检测需要进行手动校正:
3D人脸配准:
除了颜色信息、位置信息,3D人脸配准还多了深度
将3D转化为2D图像处理:
步骤:
1、获取纹理图像:将3D图像投射到XOY平面
2、检测特征点:利用人眼滤波器找到人眼位置,使用边缘检测找到人脸的大概位置
3、细化特征点位置:算法:ASM算法、VOSM算法(ASM算法的改进)
ASM算法原理:先建立形状模型、在局部灰度模型、后获得局部灰度特征模板
2、人脸检测
指对输入的视频或图片中,确认是否有人脸的存在,若有则将人脸位置框出的过程,各个类型的人脸种类越多,人脸检测算法的鲁棒性越好
人脸检测的两大类:非学习检测方法与学习检测方法
非学习检测方法:针对人脸的形状、肤色已经运动轨迹等进行检测(算法:Gobor图形检测,肤色检测),检测率不理想
学习检测方法:即机器学习的方法,
又可分为2类:非监督学习(错误与正确分类样本不予区分)
监督学习(在下一轮学习中会更多注意上一轮错分的样本)
** 机器学习的方法过程:**
1、将样本分类(正负样本)
2、以某个样本的特征进行分类,得到分类器
3、对各类特征进行循环处理,对特征进行组合,直到得到最好检测率,得到最终分类器
人脸检测的重要算法:
神经网络、支持向量机(SVM)、AdaBoost算法
神经网络:
支持向量机(SVM):
AdaBoost算法: