1. 引言
人脸识别是一门既有理论价值又有应用价值的研究领域,已经成为当前模式识别和计算机视觉领域的一个热门话题[1] ,愈加受到研究人员的重视。在过去的一段时间里,人们陆续给出了很多实用的方法,主成分分析[2] (PCA)方法是人脸识别中最基本也是最长见得方法,目前很多的人脸识别算法都是对这种方法的改进或与其他方法的综合,由于其降维和特征提取方面的有效性,已在该领域获得普遍推广。但是因为成像的系统、记录的设备、传输的介质以及处理的方法等并不完善,致使图像在后续形成、记录、处理和传输过程中,会导致图像质量严重下降,其中噪声是造成图像质量下降的重要元素之一。人脸图像中夹杂了噪声不仅使得图像质量下降,还影响了图像的视觉效果,而且研究发现还大大降低了传统PCA人脸识别的效果。
小波变换是1980年代发展的一种时频分析工具,Mallat提出了快速分解算法后,已成功地应用于图像处理域。小波变换是窗口大小固定,其形状、时间窗口、频率窗口都能改变的时频局部化分析方法。其中,低频处,拥有较高的频率和较低的时间分辨率,高频处,与低频处完全相反,因此被科学家誉为数学显微镜。针对上述现象本文在传统PCA方法的基础上用小波变换 + PCA方法进行了研究。通过在ORL人脸数据库中做了相应实验,结果表明了这种分析方法的有很好的提升效果。
在不同的应用中,都期望找到具有对称(或反对称)性质的紧支撑的小波,因为这样的小波具有线性相位的性质,使得在处理不同的信号时能够避免信号的失真。但Daubechies等已经证明,除了一阶基数B样条函数和Haar小波,其它任何紧支撑正交的实尺度函数和相应的小波不可能具有对称性或反对称性,而Haar小波的正则性很差,就制约了它的实际应用。事实上,使小波具有对称性的方法有很多,比如,放弃小波的对称性,或者考虑多小波。幸运的是,小波框架也很好的解决了这个问题,小波框架和正交小波是离散小波变换的两个主要内容,它们是同时发展的.在图像处理领域,小波框架与正交小波的计算复杂度是一致的,但是小波框架不但能够弥补正交小波的缺点,而且增加了一定的冗余性,既保留了除正交之外的所有小波的特点,像较好的时频局部化特性、平移不变形等,在临床应用中它能够把光滑性、紧支撑、对称性(或反对称性)等众多特点恰当的组合在一起,与正交小波相比,对信号的重构有更好的稳定性,而且比正交小波更易于构造。所以本文重点就是小波框架和PCA方法的人脸识别的研究。
2. 框架
2.1. 框架的相关概念
框架的概念是1952年R. I. Duffina和G. Schaeffer在研究非调和Fourier级数中提出来的,它是对规范正交基概念的推广。框架和基底相同,都能表示可分Hilbert空间元素的工具,区别是框架中并不要求其元素是线性无关的。
定义1 [3] :在Hilbert空间
中一个函数族
,如果
,对于所有的
,有
(1)
称集合
是
中的一个框架,常数
称为框架界。
若
,则称
为紧框架。特别的若
,称
为帕塞瓦尔框架。
当
时,考虑集合
,
,其中:
,
。
定义2 [4] :设
,当集合
是
空间的框架,即对于所有的
满足
(2)
时,就称
是
空间的小波框架,集合
中的每个元素为这个框架的一个生成元。类似地,当
,则称
为紧小波框架。当
,称
为紧帕塞瓦尔框架。
定义3 [5] :在
的空间中,如果存在一个MRA (多分辨分析),使得
,则帕塞瓦尔框架
称为是MRA-帕塞瓦尔框架,简称MRA-框架。
设MRA
是有紧支撑的尺度函数
生成的,且满足两尺度方程
(3)
则有限序列
是尺度函数
的滤波器,称为低通滤波器。
MRA-框架
,构成
的一个帕塞瓦尔框架,相应的每个每个框架生成元满足两尺度方程
(4)
则有限序列
是框架生成元
的滤波器,称为高通滤波器。
公式(3)和(4)在频域中的等价形式分别为:
(5)
(6)
MRA-框架的分解与重构算法为:对于任意的
设
;
分解算法为:
(7)
(8)
重构算法为:
(9)
2.2. 本文所选用的框架
近阶段,很多研究者重点关注了小波框架的分析。2000年,C. K. Chui研究了对应于紧支撑加细函数的紧支撑的紧框架
,给出了
存在的一个充分必要条件:只要加细函数的洛朗多项式符
满足一个不等式
,还讨论了小波框架的分解和重构算法[6] 。后来I. Daubechies,C. K. Chui,Bin Han等人又相继研究出了一些新的构造紧小波框架的方法及很好的性质[7] -[11] 。2013年Bin Han又使用斜扩展原则(OEP)来构造对称紧小波框架,分别得到了一个更简单的算法[5] ,即构造具有两个高通滤波器的对称紧框架滤波器组和具有三个高通滤波器的对称紧框架滤波器组。这种算法比之前方法[4] [7] -[9] [12] [13] 更简单。
本文引用文献[8] 中例三构造的具有两个高通滤波器的紧框架滤波器组。
通过尺度函数
,相应的两尺度符号可表示为:
(10)
由其构造的MRA-框架生
的两尺度符号分别表示为:
(11)
(12)
则
,其中
,是具有两个高通滤波器的对称紧框架滤波器组。
滤波器
和加细函数(尺度函数)
、MRA-框架
的生成元的图像框架函数
的图像分别图1所示。
3. PCA分析
3.1. PCA识别算法的理论基础
本文中所使用的PCA分析(也称为主成分分析)是侧重于人脸图像的重构。Pearson在1901年的时候第一次提出了主成分分析的方法,直到1963年Karhunan Loeve对该问题的归纳进行了多次的修改。PCA识别算法方法在数据表示、模式识别、图像信息压缩、人工智能等领域一直是一个热点的研究话题。
“特征脸”在PCA人脸识别算法 [10] 中指的是过程重构而获得的用于识别的样本,原理是降低人脸图像的维数来得出人脸特征的统计性模板比配方法,然后对人脸进行识别。PCA算法第一步提取人脸的主要成分组成特征脸库,接下来在识别过程中,将测试样本投影到第一步的特征脸库中得到一组投影系数,然后与特征脸在距离上作比较,与距离最小的特征脸相对应的就是其识别结果。
3.2. 快速PCA识别算法的设计
对于一张
的人脸图像,将其每列组合构成一个大小为
维的列向量。对于
维空间中的
个样本
,能够看作为一个
维随机变量,将其表述为矩阵的形式
,PCA的识别算法中,最主要的步骤即为得出样本协方差矩阵(散布矩阵)
的特征值和特征向量。设样本矩阵
大小为
(
个
维样本向量),在本文的人脸识别中
,
。那么方差矩阵
就是一个大小为
的方阵,因此,当维数d比较大时,直接计算就非常困难,要想得出样本协方差矩阵的全部特征值可能需要很长的时间来计算。因此可采取快速PCA算法。
令
矩阵为样本矩阵
中的每个样本与样本平均值
之差的矩阵,那么散布矩阵
为
,
现在考虑矩阵
,在本文的人脸识别中
。而
则远远大于
,所以
的尺寸远远小于
,但它们有相同的非零特征值,因此
所对应的特征值可通过计算
的特征值来得出。
设
的特征值
对应的特征向量为
维列向量
,可以得到:
(13)
将式(13)两边同时左乘
,再利用矩阵乘法结合律,则:
(14)
公式(14)说明
为散布矩阵
的特征值
对应的特征向量。因此我们可以通过计算小矩阵
的特征向量
,之后左乘
间接得出散布矩阵
的特征向量
。总之,这种做法可以很大程度上降低传统PCA算法中的计算量,以此来提高运算效率。
4. 仿真及算法过程
4.1. 仿真环境
仿真利用Matlab的编程来实现,实验中学,利用ORL人脸库作为数据集,该人脸库来自英国剑桥Olivetti实验室,其中总共包括40个人,每一个人都有10幅图像,总共400幅图像,并且每幅图像有256个灰度级,其大小都为11 × 292,将该数据库中每一个人的的图像分成两组,前5幅组成训练集,另外5幅组成测试集。训练集与测试集将分别有200个人脸图像样本。部分人脸图像如图2所示。


Figure 2. Legend of ORL face database of people face
图2. ORL人脸数据库中部分人脸图例
4.2. 算法过程
方案一:传统的PCA方法
1) 读取图像
将ORL人脸库中的400幅人脸图像平均分成训练集与测试集,然后把训练集包含的200幅人脸图像读取进来。
2) 快速PCA算法提取人脸特征
利用快速PCA算法,对图像进行降维处理,去除像素之间的相关性。从训练样本中提取主成分,然后通过投影完成基的转换。在后面的实验中,用降维后的特征向量来代表此人脸样本。类似地,利用快速PCA算法还可以得到训练集的主成分脸。
3) 分类器
在识别过程中,分类器的设计是一个很重要部分,把待识别的图像投影到特征空间之后,接下来就是判别这些图像的相似度的主要依据。实验中选取三阶近邻作为分类器。三阶近邻分类优于欧几里地距离(欧氏距离)分类。且对投影后的距离进行不同的加权处理会提高识别效果,这也是本文的另一改进之处。
方案二:小波+PCA方法
1) 图像加噪
将方案一1)中读取的图像进行加噪处理,在本文中分别加入不同大小的高斯噪声进行了比较,具体见实验结果。
2) 图像预处理
对加噪后的人脸图像分别利用正交小波(Haar小波) [11] 进行两层分解,分别得到四个子图。
3) 快速PCA算法提取人脸特征
对(2)中分解后得到的子图分别利用快速PCA算法来降维,从而去除像素之间的相关性。从训练样本中提取主成分,然后经过投影实现基的转换。在接下来的实验中就以降维后的九个子图的特征向量来代表该人脸样本。类似地,利用快速PCA算法还可以得出训练集的主成分脸。
4) 分类器
同方案一中(3)。
方案三:加权值的小波 + PCA方法
在方案二的基础上对投影后的距离给予一定的权重系数。其余同方案二。
方案四:MRA-框架 + PCA方法
将方案二中进行两层小波分解改为进行两层小波框架分解,得到九个子图,其余同方案二。
4.3. 实验结果与分析
在实验中,对测试集中40个人的后5张人脸图像,总共200个样本进行了分类,加噪前和加噪(分
表1. 实验结果
别加入了0.01,0.02,…,0.1等不同大小的高斯噪声)后进行了比较。
加噪前方案一即传统的PCA方法的识别率是80%,方案二的识别率是77%,方案三的识别率是80.5%,方案四的识别率是77%。此时四者之间的差距相对并不大。
但加入高斯噪声后,传统PCA方法的识别率一般会随着噪声的增大逐渐减小,且当噪声达到0.1时识别率已低于50%。而此时另三种方法的识别率却有所提高。且较加噪的PCA方法相比,效果差距更大,有些已高出20多个百分点。且方案三的识别率一般情况下要高于方案二的识别率。进而方案四的识别率更高一些。由于高斯噪声分布是随机的,所以在噪声下不同次的实验结果会稍有偏差,而本文结论是根据每种方法在不同噪声大小下至少进行10次实验下得出的。选取其中的一组实验结果如表1所示。
5. 结束语
本文对传统PCA方法的人脸识别方法进行了研究。发现图像加噪后传统的PCA方法识别率会显著下降,针对这一情况提出了三种不同的改进算法,并在ORL人脸数据库上进行了实验,实验结果表明该方法能很好地改善加噪的人脸图像的识别效果。在下一步的学习中可以研究改变分类器的方法,如支持向量机(SVM)分类工具,和有效的选择核函数和SVM核函数参数对加噪人脸图像的识别率的影响。