1. 引言
手写签名鉴别作为生物识别领域中的一个热门课题,已成了辨别个人身份的一种有效方法。通常情况下,依据数据获取方式的不同,签名鉴别系统可分为在线签名鉴别和离线签名鉴别等两种类型 [1] 。由于离线签名鉴别处理的是静态图像,缺少加速度,时间,压力等动态信息 [2] 。因此,脱机签名鉴别比在线签名鉴别难得多。
近年来,对于签名鉴别技术国内外的研究人员已经提出了不少的实现方法并得到了较高的鉴别效率。如Serdouk [3] 等人提出了一种新的梯度局部二值模式(Gradient Local Binary Patterns, GLBP)并在GPDS-300公共签名数据库上进行实验得到了6.48%的签名鉴别率。王剑 [4] 等人提出了以手写签名几何中心为特征值的签名识别和认证算法并得到了较好的实验结果。Kovari [5] 等人提出一种简化的概率模型来进一步提高了手写签名的签名鉴别率。库尔班·吾布力 [6] 等人利用欧氏距离和支持向量机(Support Vector Machine, SVM)对维吾尔文手写签名图像进行签名鉴别得到了较理想的实验结果。栾方军 [7] 等人根据动态时间规整(Dynamic Time Warping, DTW)算法的原理来,对时间序列局部曲线的变化情况进行分析和改进得到了平均错误率为3%的实验结果。Manoj Kumar [8] 等人用SVM分类器来进行签名鉴别实验获得了93.98%的签名鉴别率。
目前,基于中文 [9] [10] 的手写签名鉴别技术已经得到了较成熟的研究成果。但基于维吾尔文的签名鉴别研究仍处于一个空白课题。因此考虑到新疆地区在司法,公安检察,金融等领域中的安全问题,对维吾尔文手写签名图像进行快速,有效地鉴定并能正确地鉴别出签名者的真实身份是当今社会迫切需要的一个重要问题。本文,以弥补我国少数民族离线签名鉴别体系中这一漏洞的前提下,结合维吾尔文的书写风格及特点提出了一种16维的方向特征提取方法。该方法是以预处理后的签名样本图像为基础,首先对其进行垂直分割,然后统计每一个被分割区域内各个方向上黑像素点信息的分布情况来实现的。在分类决策阶段使用距离分类器(欧式距离,卡方距离,曼哈顿距离)来计算并比较出训练样本和测试样本之间的距离,从而判别出待测试签名的真假。
2. 签名图像的数据采集和预处理
本文所用的维吾尔文手写签名样本来自于不同年龄和不同性别的10个人的600个(20个原签名样本/每人+20个熟练模仿的伪签名样本/每人+20个简单模仿的伪签名样本/每人)签名样本图像。签写时要求每个签名者把自己的名字书写在已被等分成横七竖三排共21个方框的一张A4纸上 [11] 。签写完之后,对每一张签名样本按300 dpi的分辨率来进行扫描并以BMP图像格式输入到计算机就可以获得签名样本图像。如下面的图1所示的是本文采集的部分维吾尔文手写签名样本示例图。

Figure 1. A part of Uyghur handwriting signature samples
图1. 部分维吾尔文手写签名样本示例图
由于采集签名图像时,扫描仪分辨率的高低,签名者所用笔头的粗细程度以及手写签名的随意性等都对签名图像的质量产生一定的影响和噪声。然而这使得随后的特征提取和分类决策结果的有效性降低。因此,为了消除并减少签名图像上的这些干扰信号及冗余信息,必须对收集到的签名样本进行预处理操作。本文用的签名图像的预处理操作包括:签名图像的灰度化,二值化,平滑去噪和归一化等四个步骤。
2.1. 签名图像的灰度化
签名图像的灰度化是指把一个含有256色的BMP图像转换为灰度图像的过程。其运算公式是如下:
(1)
其中i,j表示某一个像素点在该图像中的位置。R表示红色分量,G表示绿色分量,B表示蓝色分量,
表示该像素点转换后的灰度级别。
2.2. 签名图像的二值化
本文对签名图像的二值化处理是通过设定阈值的方法来实现的。即签名图像的灰度级大于或等于阈值的像素点设置为1 (白点),而小于该阈值的像素点设置为0 (黑点)。设原始图像的灰度级为
,经过变换后的二值图像为
,设定的阈值T为200,则图像二值化算法的公式可表示为:
(2)
2.3. 平滑去噪
对签名图像进行平滑去噪的目的是消除签名图像上的一些干扰信号及噪声。本文利用Unger3×3平滑模板来实现了签名图像的平滑去噪。Unger 3 × 3平滑算法的窗口如下表1所示。
设
为当前的目标像素点,
为该像素领域内的各个像素点,则Unger3 × 3平滑准则过程为:
(1)当
为白像素时,
中至少有三个元素为黑,则将
改为黑,否则
保持不变;
(2)当
为黑像素时,如果
和
中至少有一个元素为黑,同时
和
中至少有一个元素为黑色或者
和
中至少有一个元素为黑,同时
和
中也至少有一个元素为黑色,则
不变,否则改为白。
2.4. 签名图像的归一化
预处理操作的最后一个步骤是签名图像的归一化。对签名图像进行归一化的主要目的是消除由签名字形的大小不一致以及书写力度的不同而产生的影响。本文对签名图像进行归一化之后,每一个被裁剪签名图像的长度和宽度分别为384像素和96像素。如下面的图2(a)~图2(d)所示的是已进行归一化后的签名样本图像的预处理效果示意图。
一般情况下,签名鉴别问题中所用的签名样本可分为真签名(原签名)样本和伪签名样本等两类。其中
伪签名样本又分为简单模仿的伪签名样本和熟练模仿的伪签名样本。简单模仿的伪签名样本是指伪造者仅仅知道被伪造者名字的情况下自己模仿书写的签名。熟练模仿的伪签名是指伪造者明明知道被伪造者签名的具体书写特点及信息而刻意模仿的签名。因此,从鉴别方面来讲熟练伪签名的难度比简单模仿的伪签名难得多。然而,怎样才把这类伪造签名更准确并有效地识别出是自动签名鉴定的一个重要任务。本文采集的伪签名样本是指让原签名签写者之外的专门人,在不同的时间段及环境下模仿写出其他人的签名而形成的签名。如下面的图3(a)~图3(c)所示的是一个人的原签名样本,熟练模仿的伪签名样本和简单模仿的伪签名样本示意图。
3. 签名图像的特征提取
手写签名鉴别问题中,从签名样本图像所包含的信息中提取出最有效并具有代表性的特征信息,从而用这些有效的数字信息来判断出待测签名样本的真伪类别是整个签名鉴别工作中的一个核心部分。一般情况下不同人的手写笔迹,其字体的形状和写法之间有一定的差异。但对于同一个人来说,由于长时间的书写习惯,其写下的字与字之间的差别是相对稳定的。因此,签名字体中笔划的粗细程度及曲度,走笔的方向,笔画的长短等这些因素都可以作为签名的特征。
方向特征的提取
维吾尔文签名的手写规则都没有一定的标准。每个人都是按照自己的书写风格和平时的手写习惯来

Table 1. Unger 3 × 3 smoothing algorithm window
表1. Unger 3 × 3平滑算法窗口

(a) 原签名样本图像 (b) 灰度化的签名样本图像
(c) 二值化的签名样本图像 (d) 平滑去噪的签名样本图像
Figure 2. An example of signature image pre-processing
图2. 预处理后的签名样本图像示意图


(a) 原签名样本 (b) 熟练模仿伪签名样本 (c) 简单模仿的伪签名样本
Figure 3. Three kinds of handwriting signature sample
图3. 三种形式的签名样本示意图
签字。由于离线签名鉴别所研究的是签名图像上的静态信息,其基本上丢失了签名的本质特征和最能反映出签名者书写习惯的动态信息。而且签名者的签字过程很容易被受到外界环境及签名者当时的情绪等客观因素的影响。另一方面维吾尔文的文字结构比较复杂,同一个字母有好几种不同的书写形式。因此,比起其它文种的签名鉴别,基于维吾尔文的签名鉴别难度是相当大的。本文结合维吾尔文的书写风格和特点提出了一种16维的方向特征提取方法,其实现流程如下图4所示。
上述过程可归结为以下几个步骤:
1) 读取预处理后的维吾尔文签名样本图像;
2) 把每一个签名样本图像按垂直方向等分成四个网格区域;
3) 对每一个签名网格区域分别以水平(0˚),主对角线(45˚),垂直(90˚),副对角线(135˚)等四种方向进行扫描;
4) 统计出每一个网格中各个方向上的连续黑像素点数目;
5) 形成16维的方向特征并完成特征提取;
按照上述原理,对应于某个人的方向特征向量可表示为:
(3)

Figure 4. Flow chart of directional feature extraction
图4. 方向特征的提取流程图

(a) 四个网格区域 (b) 四种扫描方向
Figure 5. Schematic diagram of feature extraction process
图5. 特征提取过程示意图
其中,
代表某个人的训练样本,q表示特征向量的维数,M为参与训练的对应于某个人的代号。如下图5(a)~图5(b)所示的本文的特征提取过程示意图。
4. 判别决策
从理论上来讲,手写签名鉴别的分类问题可以归结为模式识别领域中的一个特征匹配过程。也就是说,对于训练样本和测试签名样本都可以使用任何一种分类器来进行分类。判别决策的基本原则是:将特征空间中各点之间的距离作为训练样本和测试样本的相似性度量原理,并用各类训练样本所构成的集合来表示其决策区域。本文将欧式距离分类器,卡方距离分类器和曼哈顿距离分类器作为签名样本之间的相似性度量方法,其计算公式为如下:
(1) 欧式距离(Euclidean distance):
(4)
(2) 卡方距离(Chi-square distance):
(5)
(3) 曼哈顿距离(Manhattan Distance):
(6)
式(4)~(6)中,N表示特征向量的维数,
和
,
分别表示待鉴别样本X和训练样本Y的各维元素。
5. 实验结果与分析
对于离线签名鉴别系统来说,其性能是由错误拒绝率FRR(False Rejection Rate)和错误接受率FAR(FAR Acceptance Rate)来评估衡量。其中FRR指的是真签名误判为伪签名的错误发生率。FAR指的是伪签名误判为真签名的错误发生率。此外,用总正确率ORR(Overall Right Rate)的高低来判断整个系统对真伪签名的综合能力。一个理想的签名验证系统在有效的特征空间上能够把真签名和伪签名正确地分开,使得FRR和FAR都减小到最低程度,这三者之间的关系式为如下:
(7)
本文为了提高签名鉴别的总正确率,利用选择阈值的方法来对签名样本图像进行了分类鉴别。也就是说,当待测签名样本与模板样本之间的距离d(x, y)小于或等于所选择的阈值T时,待测签名为真,否则为假。实验中为了便于进行分析和比较,将600个手写签名样本中的300个(10个原签名样本/每人,10个简单模仿的伪签名样本/每人,10个熟练模仿签名样本/每人)样本被用于进行训练,而剩下的300个(10个原签名样本/每人,10个简单模仿的伪签名样本/每人,10个熟练模仿签名样本/每人)签名样本被用于进行测试。对于本文提出的16维的方向特征,用欧式距离分类器来进行实验时选取不同阈值下的签名鉴别效率如下表2所示。
从表2可以看出,当利用欧式距离分类器来进行签名鉴别时,随着阈值的增加系统的签名鉴别率相差不大。在每一个不同的阈值下签名鉴别总正确率都在80%以上。而当阈值取为3的时候鉴别效率达到最高。即FAR = 14.80%,FRR = 13.66%,总正确率ORR = 85.77%。因此,对于真伪的维吾尔文手写签名来说,欧式距离分类器的分类鉴别能力不是很理想。下面为了进一步验证出其它距离分类器的鉴别效率,在选取相同的阈值下用卡方距离分类器来进行实验,其实验结果如下表3所示。
从表3可以看出,卡方距离分类器的签名鉴别率在阈值设定为2.5的时候达到最高。即FAR为9.09%,FRR为5.75%,总正确率ORR为92.58%,这与欧式距离分类器的最高鉴别效率相比,增加了6.81%。相对于维吾尔文手写签名鉴别目前的研究情况来说,该实验结果可以算是比较理想的,能较好地反映出维吾尔文手写签名的特点。下面再用相同的阈值来验证曼哈顿距离分类器的分类鉴别能力。其实验结果如下表4所示。

Table 2. Verification results of using Euclidean distance classifier
表2. 欧式距离分类器的签名鉴别率

Table 3. Verification results of using Chi-square distance classifier
表3. 卡方距离分类器的签名鉴别率

Table 4. Verification results of using Manhattan distance classifier
表4. 曼哈顿距离分类器的签名鉴别率
从表4可以看出,在整个阈值范围内曼哈顿距离分类器的签名鉴别效率都不是很理想。签名鉴别的最高总正确率才达到82.80%,这比欧式距离分类器和卡方距离分类器的最高签名鉴别效率分别降低了2.97%和9.78%。因此,比起欧氏距离和卡方距离分类器,曼哈顿距离分类器没能发挥较好地分类鉴别性能,不适于利用该分类器来对维吾尔文手写签名样本图像进行分类鉴别。从总体的签名鉴别效率来看,在相同的实验环境及条件下,卡方距离分类器的签名鉴别率优于欧氏距离和曼哈顿距离分类器的签名鉴别率。因此,对于本文提出的16维方向特征来说基于卡方距离的分类鉴别方法是比较合理的。
对于一个完整的手写签名鉴别系统来说,一方面要提高签名的正确鉴别率的同时,也要考虑系统的签名鉴别所用的时间(速度)。本文为了进行比较和分析,利用三种距离分类器来对相同数目的手写签名样本进行了分类鉴别实验。然而当使用不同的分类器时,系统每一次所用的时间最多为5秒左右。因此,对于系统的实用价值来说这是一个可以接受的持续时间。此外,本文的相关研究工作是用Lenovo M7400 Printer类型的扫描仪,CPU为i5 4460 3.20 Hz,内存为4.00 GB的Microsoft Windows 7电脑和Microsoft Visual C++ 6.0计算机编程语言来编写代码而完成。
6. 结束语
本文以维吾尔文手写签名的书写风格及签名字迹的黑像素点信息为基础,先对收集的维吾尔文签名样本图像进行了预处理操作。然后把预处理后的每一个签名样本图像等分成四个网格区域,并对每一个网格区域分别以四种方向进行扫描而形成了16维的方向特征。在特征提取与选择部分中,进一步阐述了该特征的具体提取与选择思路。在判别决策阶段分别用欧式距离,卡方距离和曼哈顿距离等三种距离分类器来进行了签名鉴别实验。实验结果表明,该特征的提取思路清晰,结构简单,比较适合于离线式的维吾尔文签名鉴别。然而在未来的工作中,将进一步研究出更有效的特征提取以及分类方法,提高签名鉴别系统的通用性,使得它适合用于其他哈萨克,柯尔克孜等少数民族的手写签名鉴别问题上。
基金项目
国家自然科学基金项目(No. 61163028, 61563052)。