复杂环境下的人脸识别增强算法

doi:10.12677/CSA.2018.811184

期刊菜单

复杂环境下的人脸识别增强算法
Face Recognition Algorithm in Complex Environment of Mobile Platform

DOI: 10.12677/CSA.2018.811184, PDF, HTML, XML,
作者: 何朗, 米勇, 徐文叶, 徐国庆^*：武汉工程大学计算机科学与工程学院，湖北武汉
关键词: 人脸检测；人脸识别；线性判别式分析；复杂环境；Face Detection； Face Recognition； LDA； A Complex Environment

摘要: 本文针对复杂环境下人脸识别速度慢准确性低的问题进行研究，提出了一种人脸识别算法。首先采用Adaboost与肤色分割相结合的方式进行人脸检测。利用肤色分割技术速度快的优点筛选出候选人脸区域，同时采用Haar特征来训练分类器，进一步加强检测性能，提升复杂背景下的准确性。之后采用基于线性判别式分析的人脸识别方法(LDA)，LDA算法是对样本进行分类的监督学习方法，通过对样本的标签信息进行运用，寻找最佳投影方向子空间来完成分类。实验结果表明，本算法在复杂背景下识别速度与准确性上都有很大的提升。

Abstract: This paper studies the problem of slow and low accuracy of face recognition in complex environment and proposes a face recognition algorithm. Firstly, Adaboost combined with skin color segmentation for face detection. The advantages of fast skin color segmentation technique are used to screen out candidate face areas. Meanwhile, Haar features are used to train classifiers to further enhance detection performance and improve accuracy in complex background. Then, the face recognition method (LDA) based on linear discriminant analysis is adopted. LDA algorithm is a supervised learning method to classify samples. By applying the label information of samples, the optimal projection subspace is found to complete the classification. Experimental results show that the algorithm improves the recognition speed and accuracy greatly.

文章引用：何朗, 米勇, 徐文叶, 徐国庆. 复杂环境下的人脸识别增强算法[J]. 计算机科学与应用, 2018, 8(11): 1675-1681. https://doi.org/10.12677/CSA.2018.811184

1. 引言

人脸识别技术是利用计算机分析人脸图像从中获取有效的识别信息用于辨认身份的一门技术。它是利用人类特有的生物特征的识别技术，可以有效避免传统身份认证技术的缺点，且具有大多数其他方法无法媲美的优点。而人脸识别技术由于较高的实用性、易用性等特点，是目前主流的研究方向之一。但从人脸识别的应用方面来说，在面临复杂环境时仍然存在很大的问题。它的难点主要包括：人脸外形变化大，如由年龄或表情导致人脸产生变化；外界环境的干扰，如不同强度下的光照以及脸部的遮挡物；人脸识别算法的速度、准确性的要求也极高。针对以上问题，本文通过采用Adaboost与肤色分割相结合的人脸检测 [1] 算法以及LDA算法 [2] 来提高人脸识别的速度与准确性。

2. 人脸检测

人脸检测部分采用Adaboost算法和肤色模型方法相结合。这两种方法处理图像的速度都非常快。

2.1. Adaboost算法

Adaboost算法是Freund Schapire在1992年提出的，是一种迭代的、非常重要的机器学习方法。在此基础上，Viola和Jones提出了一种改进的机器学习方法 [3] ，该方法可以非常有效地处理图像，实现高的视觉目标检测率。对于分离人脸特征，Adaboost检测器采用Lienhart、Maydt5和Lienhart等人提出的一组扩展的haar样特征，每个特征由2~3个矩形组成，用于检测边缘特征、中心环绕特征和线特征 [4]。图1显示了一组类似haar的特性。

对于24 × 24的人脸图像，在图像上进行各种操作而来的Haar特征总数远远大于该窗口的像素点个数。因此人脸特征总数需要大量的计算。

为了减少计算量，Viola等人引入了积分图的思想 [5]。积分图的原理如下：图像中的像素点的积分图像为：

$p_{i j} = \sum_{i \leq x, j \leq y} I (i, j)$ (1)

其中 $I (i, j)$ 表示图像中 $(i, j)$ 处的像素点的灰度值， $p_{i j}$ 为从原点到 $(i, j)$ 的积分图像。如图2，区域D的像素值，可以利用上述积分图规则计算得到。

利用特征集和正、负图像训练集，采用Adaboost算法对强分类进行训练，建立了分类级联，提高了

Figure 1. haar characteristic diagram

图1. haar特征图

Figure 2. Value diagram of integral graph

图2. 积分图值示意图

检测性能，同时降低了计算时间。主要程序如下所述。

1) 定义初始样本集 $(x_{1}, y_{1}), (x_{2}, y_{2}), \dots, (x_{n}, y_{n})$ ，其中 $y_{i}$ 表示样本集中第i个样本的类别， $y_{i} = 0$ 表示这个样本为非人脸样本， $y_{i} = 1$ 表示这个样本为人脸样本。n为总的样本数量。

2) 初始各样本的权值分布：对于非人脸样本：

(2)

m为非人脸样本个数。

对于人脸样本：

$D_{t} (i) = \frac{1}{2 l}$ (3)

i为人脸样本个数， $D_{t} (i)$ 为第t次循环中第i个样本的误差权值。

3) 对于 $t = 1, \dots, T$ ：

第t轮中，对当前的样本分布进行权值归一化：

$q_{t, i} = \frac{w_{t, i}}{\sum_{j = 1}^{n} w_{t, j}}$ (4)

对于每个特征f，训练学习得到一个基本分类器 $h (x_{i j}, f, p, θ)$ ；计算对应所有特征的基本分类器的加权( $q_{t}$ )错误率 $ε_{f}$ ：

$ε_{f} = Σ_{i} y_{i} \cdot | h (x_{i}, f, P, θ) - y_{i} |$ (5)

按照最佳弱分类器，更新样本集的权值分布，增大被错误分类的样本的权值，让这个样本在下一轮中受到更大的关注；减小被正确分类的样本的权值，在下一轮中受到更小的关注。

4) 最后的强分类器为：

$C (x) = {\begin{cases} 1, \sum_{t = 1}^{T} a_{t} h_{t} (x) \geq \frac{1}{2} \sum_{t = 1}^{T} a_{t} \\ 0, 其它 \end{cases}$ (6)

以上过程简单的说就是：对当前轮中被正确分类的一部分样本，削弱它的权值，从而使其在下一轮中的重要性减小；对于分类错误的那一部本，则提高它的权值，增大其在下一轮中的重要性。通过使样本中权值的改变，使得在不同的学习训练中同一样本起不同的作用。这样，后面训练主要就是增强对样本错误的那部分进行训练。

2.2. 肤色模型

人类的肤色已经被使用，并已被证明是一个有效的特征在人脸检测。7、8个颜色空间被用来标记像素为皮肤，其中最快捷、效率最高的是YCrCb模型 [6] ，Cr和Cb值被定义为肤色像素。光照的变化对YCrCb模型影响不大，Cr和Cb测量的皮肤颜色像素分布非常紧凑。对像素进行分类有两种方法。

一种是通过统计数据的方式来建造高斯密度模型，另一种是对像素进行简单的分类，假如某个值落在由实验确定的为皮肤色调的范围之内，就提取出来。

肤色分割是在通过颜色空间转换得到的颜色分量图像上进行的。基于YCrCb颜色空间的Cr、Cb两个分量进行肤色分割 [7]。这样做有许多好处：首先它去除了包含亮度信息的y分量；其次它只包含两个分量，可以提高计算速度；再次，从RGB颜色空间与CbCr颜色空间之间的转换非常的快速，只需线性变换一下。

在建立了CbCr颜色空间，就能够将它运用于肤色检测。检测的首要步骤就是将待检测图片的像素全部计算出来，如果他们的Cb、Cr值满足

$190 < c_{b} + 0.6 c_{r} < 215$ (7)

就认为这个像素为肤色像素，其它的就被当作是非肤色像素。通过分割处理就能把肤色和背景分离开来。这样就能过快速的将背景部分去除掉，从而减少AdaBoost算法的检测范围，极大的减少了AdaBoost算法的错误率。

2.3. 算法效果分析

对于基于肤色分割算法来说，其优点是算法简单、速度快；缺点则是在检测率低。对于基于Adaboost人脸检测算法而言，其优点是对于人脸区域的准确性高；缺点是运算量大。因此，本文采用肤色分割与Adaboost相结合的方式进行人脸检测，来增强检测速度以及检测率。算法流程如下：

1) 利用肤色分割算法确定人脸的大致范围。

2) 基于Adaboost算法对于人脸区域鉴别精度高的优点，在第一步的基础上进行Adaboost人脸检测。结果如表1所示。

Table 1. Compares the three algorithms

表1. 三种算法对比图

由此可见，本文采用的人脸检测联合算法不但能够降低误检率，还能的明显的提升运算速度，是一种高效实用的算法。

3. 人脸识别

3.1. 基于LDA的人脸识别算法

目前，人脸识别的方法很多，并且不断有新的研究成果出现。本文主要使用基于LDA的人脸识别方法，它的核心理念是：将原有数据进行整体降维映射到低维空间的方法 [8]。使用这种方法能够使投影后模式样本的类间散布矩阵最大，并且同时类内散布矩阵最小。由于Fisher判别函数 [9] 只能局限于两种样本的分类问题，而人脸识别技术往往要使用多个对象作为样本，是一个多类的分类问题，所以Fisher判别函数就不再适用了。但是随着经典Fisher线性判别分析法的提出，这个问题就迎刃而解。在Fisher思想的基础上，Wilks和Duda提出了寻找一个投影子空间 [10] ，这个子空间由一组判别矢量构成，得到样本在该子空间内的投影向量，作为最终的特征向量。

Fisher判别准则：

假设样本为d维数据 $x, \dots, x_{n} \in R_{d}$ ，其中前 $n_{1}$ 个样本属于类 $w_{1}$ ，后 $n_{2}$ 个样本属于类 $w_{2}$ 。为了能更好的度量类内距离和类间距离，我们先定义中心点，即均值，设 $m_{i}$ 为类别 $n_{i}$ 的样本数据的集合，则 $m_{i}$ 的中心点为：

$m_{i} = \frac{1}{n_{i}} \sum_{x \in x_{i}} x, i = 1, 2$ (8)

现在，为了使得投影之后相同分类样本之间距离更小，且另外不同样本距离越大。

定义类内散列度矩阵 $S_{i}$ ：

$S_{i} = \sum_{x \in X} (x - m_{i}) {(x - m_{i})}^{T}$ (9)

类间散列度矩阵 $S_{b}$ ：

$S_{b} = (m_{1} - m_{2}) {(m_{1} - m_{2})}^{T}$ (10)

由于特征太多并且复杂，为了寻找到能够将所有样本分类的最佳特征。我们把d维的样本降到一维空间，因此需要找到一个最佳的方向(假设为w)进行投影。

这个投影方向w对两个类的分类越准确，则分类效果最好。为了寻找一个最佳投影方向w，Fisher规定：投影方向w要能使降维后不同类别的类间距离和类内距离比达到最大，即 $J_{F} (w)$ 取最大值：

$J_{F} (w) = \frac{{(\bar{m_{1}} - \bar{m_{2}})}^{2}}{{\bar{s_{1}}}^{2} + {\bar{s_{2}}}^{2}}$ (11)

${(\bar{m_{1}} - \bar{m_{2}})}^{2}$ 代表两个类的类间距离，其中 $\bar{m_{1}}, \bar{m_{2}}$ 分别是两类均值， ${\bar{s_{1}}}^{2} + {\bar{s_{2}}}^{2}$ 代表类内距离。因 $y_{i} = w^{T} x_{i}$ ，则

$\bar{m_{i}} = \frac{1}{n_{i}} \sum_{x \in X_{i}} y = w^{T} x = w^{T} m_{i}$ (12)

所以

${(\bar{m_{1}} - \bar{m_{2}})}^{2} = w^{T} s_{b} w$ (13)

同理

${\bar{s_{1}}}^{2} + {\bar{s_{2}}}^{2} = w^{T} s_{w} w$ (14)

根据Fisher准则函数，要寻投影向量w，使 $J_{F} (w)$ 能取最大值，所以需要对 $J_{F} (w)$ 按变量w求导，并且结果等于零，则需

$s_{b} w (w^{T} s_{w} w) - s_{w} w (w^{T} s_{b} w) = 0$ (15)

$s_{b} w = J_{F} (w) s_{w} w$ (16)

令 $J_{F} (w) = λ$ ，则，

$s_{b} w = λ s_{w} w$ (17)

如果 $s_{w}$ 可逆则可以直接移到等式左边，但是当样本空间的维数较高，而样本数量过少时， $s_{w}$ 可能为不可逆。此时应优先选择使用PCA [11] 对样本进行降维，然后再对降维后的数据使用LDA。

3.2. 人脸识别实验

实验条件如下。

1) 人脸数据库：样本数量为20张人脸，每个人脸2个样本。

2) 单人多次识别：在人脸姿态、表情、光照不同情况下，使被测人脸处在微低头、微抬头、微笑、皱眉、强光、弱光6种情况下下各随机进行5次测试，共30次。

3) 双人(在数据库中)同时多次识别：两人(A和B)随机采取不同站位、脸部姿态、表情时测试30次，统计结果。结果如表2所示。

Table 2. Identification rate test

表2. 识别率测试

4. 结论

本文针对复杂环境下的人脸识别存在的问题，结合Adaboost算法和肤色分割算法的优点提出一种改进的Adaboost算法，再结合LDA算法计算速度快和识别率高等特点，极大的提高了复杂环境下人脸识别的速率和准确率。

NOTES

^*通讯作者。

参考文献

[1]	王盾, 袁杰. 复杂环境下的人脸识别研究[J]. 自动化应用, 2017(11): 75-78. https://doi.org/10.3969/j.issn.1674-778X.2017.11.036
[2]	黄鑫材. 复杂环境下的人脸识别系统研究[D]: [硕士学位论文]. 杭州: 浙江工业大学, 2015.
[3]	何强, 文凯. 一种复杂背景下的人脸识别算法研究[J]. 电视技术, 2017(11): 207-213. https://doi.org/10.16280/j.videoe.2017.h11.040
[4]	沈继锋, 时士伟, 左欣, 等. 基于多通道图判别投影HAAR特征的多视角人脸检测[J]. 数据采集与处理, 2018(2): 270-279. https://doi.org/10.16337/j.1004-9037.2018.02.009
[5]	张薇, 王颖. 基于复杂背景下人脸图像识别相关算法的应用[J]. 电视技术, 2018(7): 20-24. https://doi.org/10.16280/j.videoe.2018.07.005
[6]	王冉. 基于Android平台人脸识别算法的应用[J]. 电子设计工程, 2017(16): 190-193. https://doi.org/10.3969/j.issn.1674-6236.2017.16.046
[7]	唐彪, 金炜, 符冉迪, 等. 多稀疏表示分类器决策融合的人脸识别[J]. 电信科学, 2018(4): 31-40. https://doi.org/10.11959/j.issn.1000-0801.2018010
[8]	白冰峰, 温秀兰, 张中辉. 基于Haar小波和形状模板的图像快速匹配算法[J]. 组合机床与自动化加工技术, 2017(2): 37-40. https://doi.org/10.13462/j.cnki.mmtamt.2017.02.010
[9]	糜元根, 陈丹驰, 季鹏. 基于几何特征与新Haar特征的人脸检测算法[J]. 传感器与微系统, 2017(2): 154-157. https://doi.org/10.13873/J.1000-9787(2017)02-0154-04
[10]	姜莹礁. 基于Gabor的人脸识别技术研究[J]. 海峡科技与产业, 2018(1): 66-67.
[11]	张贵英, 张先杰. 基于图像的人脸识别算法研究综述[J]. 电脑知识与技术, 2017(11): 165-167.

为你推荐

友情链接