• 基于KL变换的特征人脸识别方法基本原理


      KL变换是图象压缩中的一种最优正交变换。人们将它用于统计特征提取,从而形成了子空间法模式识别的基础。若将KL变换用于人脸识别,则需假设人脸处于低维线性空间,且不同人脸具有可分性。由于高维图象空间KL变换后可得到一组新的正交基,因此可通过保留部分正交基,以生成低维人脸空间。而低维空间的基则是通过分析人脸训练样本集的统计特性来获得。KL变换的生成矩阵可以是训练样本集的总体散布矩阵,也可以是训练样本集的类间散布矩阵,即可采用同一人的数张图象的平均来进行训练,这样可在一定程度上消除光线等的干扰,且计算量也得到减少,而识别率不会下降。也就是说,根据总体散布矩阵或类间散布矩阵可求出一组正交的特征向量u1,u2,...,un ,其对应的全部特征值分别为λ1,λ2...λn,这样,在新的正交空间中,人脸样本就可以表示为

       若通过选用m (m < n) 个特征向量作为正交基,则在该正交空间的子空间中,就可得到以下近似表达式

      如将子空间的正交基按照图象阵列排列,则可以看出这些正交基呈现人脸的形状,因此这些正交基也被称作特征脸,这种人脸识别方法也叫特征脸方法。关于正交基的选择有不同的考虑,即与较大特征值对应的正交基(也称主分量)可用来表达人脸的大体形状,而具体细节还需要用与小特征值对应的特征向量(也称次分量)来加以描述,因此也可理解为低频成分用主分量表示,而高频成分用次分量表示。其中,采用主分量作正交基的方法称为主分量方法(PCA)。同时,也有人采用m个次分量作为正交基,原因是所有人脸的大体形状和结构相似,真正用来区别不同人脸的信息是那些用次分量表达的高频成分。由训练得到特征脸后,将待识别人脸投影到新的维人脸空间,即用一系列特征脸的线性加权和来表示它,这样即得到一投影系数向量来代表待识别人脸,这时候,人脸识别问题已转化为m低维空间的坐标系数矢量分类问题,而分类最简单的做法是最小距离分类。

      KL变换在90 年代初受到了很大的重视,实际用于人脸识别也取得了很好的效果,其识别率从70100%不等,这取决于人脸库图象的质量。从压缩能量的角度来看,KL变换是最优的,它不仅使得从n维空间降到维空间前后的均方误差最小,而且变换后的低维空间有很好的人脸表达能力,然而这不是说已经具有很好的人脸辨别能力。选择训练样本的散布矩阵作为KL 变换的生成矩阵,是由于其最大特征向量抓住了该样本集合的主要分布,但这是图象统计,而不是人脸统计方法。它虽然考虑了图象之间所有的差异,但由于它不管这样的差异是由照明、发型变更或背景导致,还是属于人脸的内在差异,因此特征脸识别的方法用于人脸识别存在理论的缺陷。研究表明,特征脸的方法随着光线、角度及人脸的尺寸等因素的引入,识别率急剧下降。虽然可通过采用同一人的训练样本的平均来计算类间散布矩阵,但也只能在一定程度上纠正这个缺点。研究结果表明,主分量的方法使得变换后表达能力最佳,次分量的方法则考虑了高频的人脸区分能力。由于对KL变换而言,外在因素带来的图象差异和人脸本身带来的差异是不加任何区分的,因此,不管如何选择正交基,也不能根本解决问题。其改善的一个思路是针对干扰所在,对输入图象作规范化处理,其中包括将输入图的均值方差归一化、人脸尺寸归一化等;另一种改进是考虑到局部人脸图象受外在干扰相对较小,在进行人脸识别时,除计算特征脸之外,还可利用KL变换计算出特征眼睛、特征嘴巴等。然后将局部特征向量加权进行匹配,就能够得到一些好的效果。

  • 相关阅读:
    第10组Beta冲刺(4/4)
    第10组Alpha冲刺(4/4)
    第08组 Beta版本演示
    第08组 Beta冲刺(3/4)
    第08组 Beta冲刺(4/4)
    第08组 Beta冲刺(1/4)
    第08组 Beta冲刺(2/4)
    第08组 Alpha事后诸葛亮
    第08组 Alpha冲刺(4/4)
    第08组 Alpha冲刺(3/4)
  • 原文地址:https://www.cnblogs.com/ybqjymy/p/14989919.html
Copyright © 2020-2023  润新知