1. 引言
2002年汤姆克鲁斯主演的电影《关键报告》中,街头识别系统随时扫描识别过往路人身份的情节,正逐渐在你我的生活中上演。由于人脸识别具备远距离运作非接触式的特性,为人带来的便利更胜于其它生物识别技术,举凡阿汤哥电影《不可能的任务》中的虹膜识别,或是警方办案常使用的指纹识别等,因此,当其技术藩篱被突破时,随之而来的应用不计其数。根据知名市场研究公司MarketsandMarkets推估,人脸识别市场产值在五年内可望以13.9%的年均复合增长率(Compound Average Growth Rate, CAGR)成长,由2017年的40.5亿美元跃升至2022年的77.6亿美元。
近年来人脸识别技术 [1] [2] [3] [4] [5] 的进展有赖于深度学习技术的突破,2014年香港中文大学宣布其人脸验证系统通过深度学习模型强大的计算和学习能力大幅提升脸部识别准确性,在国际知名的人脸数据库LFW逾千组不同光暗、表情及拍摄角度的脸部照片上准确率高达99.15%,首次超越人类肉眼识别的准确度,2015年,百度同样利用深度学习技术 [6],将人脸验证系统准确率推升至99.7%,逼近LFW数据库的极限。为了能够衡量人脸识别模型的能力,2016年华盛顿大学提出了MegaFace公开数据库,提供实验者仿真数据库存有一百万张人脸时的识别效果,大幅提高了识别的难度,此时(2016年末)仅有少数几个如Google等顶尖组织的识别率能够达到70%。时至2018年4月,依据官方记录,已有数十个组织得以跨越70%水平,微软中国必应实验室的数据为83.758%,若进一步将肇因于MegaFace数据库本身错误状况予以剔除,准确率更高达98.998%,显示当今人脸识别技术已可挑战百万等级的用户规模。人脸识别技术的发展并不仅局限于算法等软件层面,2019年9月,苹果召开新品发表大会,新一代旗舰机iPhoneX11问世,人脸识别成功进军到智能型手持装置,成为新时代解锁选项。有别于传统使用的光学摄影机,iPhoneX11使用其顶部一小块约0.5公分区域,由前置镜头、红外线镜头、泛光感应组件及点阵投影仪等零件所组成的深度镜头系统进行人脸识别,藉由非可见光扫描人脸的3D几何结构,将身份破解率从Touch ID指纹的五万分之一降至百万分之一。观察2018年世界行动通讯大会(MWC),3D感测技术已被产业界广泛采用,诸多厂商如三星、Nokia、Sony、华硕等非苹果阵营相继推出3D感测机种。根据科技市场调查机构Counterpoint预测,2020年将有超过10亿支智能手机导入脸部解锁,其60%会采用3D技术 [7]。
人脸识别逐渐移往终端设备恰巧符合当今边缘运算、甚至行动边缘运算的潮流,过去受限于终端设备的运算能力不足,数据必须回传至后端系统才能进行处理,如今,随着AI加速芯片的发展,终端设备就具备复杂运算的能力。在更多终端设备能够支持人脸识别及万物联网的环境下,未来数年势必还会有更多元丰富的人脸识别应用相继推出。
2. 人脸识别系统
人脸识别系统主要目的为辨别人脸图像与数据库中的哪个人脸图像相同,在分类的过程中会因比对特征的大小以及特征比对次数的多寡,造成识别速度缓慢。因此,为了有效提升识别速度的效率并拥有准确的识别效果,本文将以原始的人脸识别系统作为基础,设计一利用脸部五官特征眼睛、鼻子和嘴巴作为识别特征,并依序以五官特征进行分类筛选的筛选技术,以减少分类过程所需的时间。
本文使用Xiaoyang Tan等人 [8] 在2010年所提出的预处理方法,以消除图像受照明的影响,再以局部二值模式(LBP)对五官进行特征提取,并与数据库中的人脸图像特征进行相似度计算,最后使用最近邻分类器与所设计的筛选技术进行分类,以获得识别结果。
研究主要目的为,如何以较为显着的特征进行识别,且有效减少特征比对次数以提升识别系统的效率,研究中使用MATLAB进行模拟。为探讨筛选技术对人脸识别系统的识别时间的状况,在整个实验过程中使用MATLAB软件仿真原始的人脸识别系统的识别情形。为了探讨脸部五官特征眼睛、鼻子和嘴巴对识别率的影响,将使用SPSS进行变异数分析(ANOVA),探讨眼睛、鼻子和嘴巴之间,何者具有较为显着性的影响,并作为筛选技术的设计参考,以设计出最佳的筛选技术。最后一样使用MATALB模拟平台来了解识别率与识别时间的结果。图1显示人脸识别流程。
3. 人脸数据库介绍
3.1. Extended Yale Face Database B
Extended Yale Face Database B是由38个人在64个不同照明条件下拍摄9种姿势而成,并且通过光源方向与中心相机轴之间的角度(12˚,25˚,50˚,77˚,90˚)将数据库分为5个子集,共2414张图像。本文采用数据库中每个人的第一张人脸图像作为等待比对的人脸数据库,共38张图像,并将子集1~3的所有正面图像作为测试图像,共1174张图像。
3.2. 自制人脸数据库
自制人脸数据库是由5位实验室同学,经由每个同学表现出不同的脸部样貌分别拍摄出10张人脸图像,共50张所组合而成,并将此人脸数据库命名为机电整合(Mechatronic Laboratory, MECL)人脸数据库。本文采用每个人的第一张正面图像作为训练图像,共5张,并将所有人脸图像作为测试图像,共50张。
4. MATLAB识别系统建立
4.1. 实验设备
本文所使用的实验设备是Win10操作系统,详细规格如表1所示。然而,人脸识别系统中的预处理、识别率与识别时间都是通过MATLAB R2018b进行实验模拟,识别率与识别时间都分别进行10次的实验模拟,并取其平均值以作为最后实验模拟结果。
4.2. 预处理
本文所使用的预处理是由三个步骤所组成,分别为伽玛校正、高斯差分滤波与对比均衡,经过预处理能有效改善照明所产生的阴影与亮光,并保留人脸图像中的特征。图2为预处理流程。
伽玛校正是一种非线性的亮度反映曲线,而γ是改善图像亮度的主要参数。当γ = 1,图像亮度相同;当γ < 1,图像亮度会偏亮;当γ > 1,图像亮度会偏暗。本文是以γ = 0.2作为默认值。高斯差分滤波是经由两个不同大小高斯核
的高斯滤波器进行相减而得。图像以不同大小的高斯滤波器进行滤波,将产生不同程度的模糊图像,最后以两个不同程度的模糊图像进行相减,即可得到高斯差分滤波图像。本文是以
、
作为默认值,对比均衡是对图像整体强度进行些微的调整,能使图像的特征更加明显,Xiaoyang Tan等人 [4] 提出了两个简单快速的方法,如公式(1)与公式(2)。在此α作为压缩因子,减少图像中受大值所影响,
是消除大值的阀值。
(1)
(2)
图像经由上述的处理已经得到相当显着的特征,但仍然具有极端值。为了避免特征提取中产生不必要的麻烦,最后使用双曲正切函数(hyperbolic tangent)来压缩图像中过大的值,如公式(3)。本实验设定
、
作为默认值。
(3)
经过整个预处理链后,可发现原始图像受阴影所遮蔽的部分得到了大幅度的改善,凸显出图像重要的五官特征。图3为预处理的效果。

Figure 3. The effect of Image preprocessing process (left), the original image after preprocessing the image (right)
图3. 预处理的效果(左)原始图像(右)预处理后图像
4.3. 特征提取
局部二值模式(LBP)是由Ojala等人 [9] 所提出,用来描述图像特征且计算简单复杂度较低。原始的LBP是以3 × 3方形区域中,将中心像素作为阀值并与相邻的八个像素进行比较,当大于阀值则将其设定为1,否则将其设定为0,因此,形成一个二进制数。图4为LBP运算方式。
原始的LBP被局限于3 × 3方形区域中,难以表现出完整的图像特征,为了改善此问题圆形LBP被提出,以圆形区域取代原始的方形区域,使原本3 × 3的区域扩展至任何区域。而圆形LBP可经由不同的圆形半径R与取样点数量P,表现图像不同大小的纹路特征。
经由上述得知圆形LBP是通过不同的圆形半径R与取样点数量P产生2𝑃种LBP模式,经发现若取样点数量增加,LBP模式将伴随大幅度上升。因此,Ojala等人提出了等价模式(Uniform Pattern)对此问题进行改善,而经实验发现LBP二进制数大部分仅包含两次从0至1或1至0的转变,所以定义:当LBP二进制模式从0至1或1至0的转变最多只有两次时,将该LBP二进制模式作为一个等价模式种类。如图5特征提取流程图。
4.4. 变异数分析
实验中通过Extended Yale Face Database B作为分析数据库,探讨人脸五官特征与识别率的影响,并找出具显着性的特征,以运用于所提出的筛选技术。由于五官特征包含着眼睛、鼻子和嘴巴等较为显着的特征,故本文为了探讨以五官特征(眼睛、鼻子、嘴巴)对识别率是否造成影响。根据研究目的,进而提出研究假设(Hypothesis),H1:特征对识别率有显着的影响。
首先,将数据库的子集1至子集3中将36个人的人脸图像作为分析对象,且每人拥有31张图像,并将分析对象分为3个组别分别是以眼睛、鼻子和嘴巴等不同特征作为识别特征以计算识别率,识别率定义如公式(4)所示。
识别率 = (正确识别图像数量/图像总数)∗100% (4)
然而使用单因子变异数来分析特征对识别率是否有着显着差异,分析结果如表1~4所示。由表3,变异数同构型检定发现其显着性为0.000小于所设定的阀值0.05,故三种样本的变异性为不同质且存在着显着性差异。

Table 1. Variance with configuration check (features)
表1. 变异数同构型检定(特征)
经由表2,单因子变异数分析发现其显着性为0.019小于所设定的阀值0.05,因此,判定人脸五官特征的眼睛、鼻子和嘴巴存在着显着性差异。

Table 2. One-way anova (features)
表2. 单因子变异数分析(特征)
经由上述单因子变异数分析结果为具有显着性差异,且变异数同构型检定为不同质,故选用Games-Howell多重比较以判断特征之间何者具有显着性差异。通过表3,Games-Howell多重比较与表4,叙述性统计分析可得知,眼睛的识别率(97.848%)与鼻子的识别率(79.568%)其显着性为0.024小于0.05,故具有显着性差异;眼睛的识别率(97.848%)与嘴巴的识别率(86.747%)其显着性为0.095,故没有显着性差异;鼻子的识别率(79.568%)与嘴巴的识别率(86.747%)其显着性为0.611大于0.05,故没有显着性差异。因此,可以推断脸部特征的显着性顺序为眼睛、嘴巴和鼻子。

Table 3. Games-Howell multiple comparison
表3. Games-Howell多重比较

Table 4. Descriptive statistical analysis (features)
表4. 叙述性统计分析(特征)
4.5. 分类识别
实验中将待识别人脸图像进行预处理并提取五官LBP特征,便将待识别人脸五官特征与数据库中的五官LBP特征进行距离相似度计算,并使用K最近邻(KNN)分类器和所提出的筛选技术进行分类识别,以取得最后的识别结果。KNN是一种无须事先训练且易于理解实现的方法,通过将待分类图像与已知图像逐一进行距离相似度计算,并选取K个与待分类图像最相近的图像进行类别探讨,以获得分类结果。本文是以卡方距离作为距离相似度的计算方式,如公式(5)所示,若两张图像的卡方距离越小,代表两张图像的相似度越高,反之,若两张图像的卡方距离越大,代表两张图像的相似度越低。
(5)
通过变异数分析的结果,得知脸部特征的显著性顺序为眼睛、嘴巴和鼻子。因此,筛选技术会先进行眼睛距离计算,并设定眼睛距离允许误差(𝑆𝑒,𝑡)作为阀值,当数据库中的图像与待识别图像的眼睛距离小于𝑆𝑒,𝑡,则将眼睛距离小于𝑆𝑒,𝑡的图像继续进行嘴巴距离计算,并设定嘴巴距离允许误差(𝑆𝑚,𝑡)作为阀值,若经眼睛筛选后的图像嘴巴距离依然小于𝑆𝑚,𝑡,则进行最后的鼻子距离计算,以找出距离最近的人脸图像,若途中图像眼睛或嘴巴距离大于𝑆𝑒,𝑡或𝑆𝑚,𝑡,则判定为不相似不继续进行计算,详细流程如图八所示。根据图6的筛选技术流程以MATLAB进行人脸识别系统流程仿真,可以得知在Extended Yale Face Database B数据库中,使用筛选技术的识别率为96.85%与识别时间为0.016秒,相较于原始系统的识别率96.85%与识别时间0.035秒,在识别时间上有效的提升105.8%的效率。然而,在MECL人脸数据库中,使用筛选技术的识别率为100%与识别时间为0.027秒,相较于原始系统的识别率100%与识别时间0.018秒,在识别时间上有效的提升50%的效率。

Table 5. Screening technology promote efficiency
表5. 筛选技术的提升效率
5. 结论
本文提出一种筛选技术运用于人脸识别系统,是以变异数分析作为其筛选技术的依据,并通过MATLAB软件作为仿真平台。原始系统在Extended Yale Face Database B和MECL人脸数据库当中,所需的识别时间为0.034秒以及0.026秒,而筛选技术仅需要0.016秒以及0.017秒,如表5所示,故可以证明筛选技术比原始系统更具有优势。
致谢
衷心地感谢本文所引用的这些优秀文章的作者,他们的文章提供很大的帮助;同时也感谢衢州职业技术学院提供了一个研究创作的卓越平台。
基金项目
诚挚地感谢衢州科技计划项目(No2018k25)和教育厅一般科研项目(Y201839845)赞助该项课题。
参考文献