1. 引言
中国书画艺术作品是中国传统文化的重要组成部分,具有艺术、文化、历史、教育和经济价值。它们以独特的艺术形式和表现手法展现了中国文化的魅力,是中国艺术的瑰宝。同时,这些作品记录了中国历史的发展和变迁,体现了中国传统的道德观念、人生观和世界观,是研究中国历史和文化的重要资料。此外,它们可以启发思考,培养审美能力和艺术素养,具有教育价值。随着艺术品投资热情的提高,它们也具有经济价值。因此,对中国书画艺术作品的鉴别和研究具有重要意义 [1] [2] 。
印章在中国书画艺术作品中起着关键作用,包括签名、装饰、表达情感和鉴别收藏等方面。艺术家通常用印章作为签名,证明作品的真实性。印章的形状、大小、颜色和位置也是作品的一部分,影响整体效果。艺术家会根据作品内容和风格设计印章,有时通过印章表达情感或态度。对于收藏家和鉴赏家,印章是鉴别作品真伪和了解艺术家的重要线索,可以通过研究印章了解艺术家的身份、作品的创作时间和背景等信息。因此,印章在中国书画艺术作品中起着重要作用 [3] [4] 。
印章鉴别是中国书画艺术作品研究和收藏的关键,但面临技术难度、伪造问题和信息缺失等挑战。鉴别需要专业知识和技能,对印章的多个方面进行分析。技术发展使伪造印章更难识别,且部分印章因年代久远或保存不当可能信息丢失。尽管如此,印章鉴别的重要性不容忽视。它可以保护文化遗产,确认艺术作品真伪;有助于研究历史,了解艺术家身份、作品创作时间和背景;并增加艺术作品的理解和欣赏,提高艺术素养。因此,印章鉴别是一项重要且具挑战性的工作 [5] 。
当前书画艺术印章的鉴别与检测以人工为主,存在主观性强、效率低、易受环境影响、需要专业知识以及难以复制和标准化等问题,特别是随着伪造技术的不断提高,人工鉴别可能存在误判的风险。因此,本文提出一种采用计算机视觉技术的书画印章检测算法,以提高印章鉴别检测的效率与准确性。
2. 书画艺术作品印章特点及研究现状
印章在中国历史上起源于新石器时代的陶印,用于标记陶器所有权。商周时期出现玉印和金印,象征等级和权力。秦汉时期,印章使用普遍,私人印章用于签署文件和证明身份。唐宋时期,印章艺术性提升,出现精美印章作品。明清至现代,印章使用和制作技术达高峰,印章艺术成为中国传统艺术重要部分。印章种类包括官印,证明文件正式性和权威性;私印,用于签署文件、证明身份和艺术创作;书画印,用于书画作品,作为艺术家签名和作品装饰;收藏印,注重艺术性和历史价值 [6] ,用于收藏。
中国书画印章的图像特点主要体现在以下几个方面:形状多样,常见的有方形、圆形、椭圆形等,也有一些特殊形状的印章,如菱形、三角形等;印章文字的书写风格也各异,有篆书、隶书、楷书、行书、草书等;除了文字,印章上也常常刻有图案,如龙、凤、花、鸟、山水等,这些图案既可以独立存在,也可以和文字相结合,增加印章的艺术效果;印章在书画作品中的位置和大小也是其图像特点之一,艺术家会根据作品的整体布局和内容,精心选择印章的位置和大小,使其和作品形成和谐的整体 [7] 。
印章鉴别是中国书画艺术作品鉴定的关键环节 [8] 。现阶段以人工鉴别主,主要依赖专业鉴定人员通过对印章多个方面的细致分析来判断真伪和年代。常用的方法包括有:根据字体鉴别印章真伪 [9] ,主要观察字体是否均匀对齐及字间距等;根据颜色鉴别印章真伪 [10] ,主要观察印章颜色是否均匀,印油在纸上的扩散特点等;根据形状进行印章鉴别,主要观察印章是否变形歪曲,以及印章大小等;根据角度进行鉴别,主要依据原印章的用印习惯的角度来判断印章是否为伪造印章;根据方位进行鉴别,有些印章会在纹路的预留一部分防伪标记,依此防伪标记的方位来鉴别印章真伪。
随着科技的发展,近年来计算机计算如数字图像处理、人工智能等也开始被应用于印章鉴别。文献 [11] [12] 提出了采用模式比对的方法进行中国印章图像进行鉴别的方法,主要对印章进行全域图像的比对。文献 [13] 提出的相似性理论进行印章类别的鉴别,主要应用于公安侦察办案过程中。文献 [14] [15] 提出的采用光敏印章的鉴别方法,采用光敏技术进行印章真伪与类别进行鉴别。文献 [16] 提出的基于微观点迹特征鉴别印章的方法,从印章的细微纹路特征进行鉴别研究。文献 [17] 中采用数字图像处理技术对印章进行鉴别。另外还有采用防伪标记进行鉴别的方法 [18] 以及采用神经网络对印章进行鉴别 [19] 。目前大多数印章鉴别主要针对公文与公章进行鉴别,其应用范围主要在公安司法领域与银行金融领域。在书画艺术作品的印章领域的鉴别检测还是以人工鉴别为主,缺少相应的计算机鉴别技术的研究。
3. 印章鉴别算法
因书画印章所使用印油颜色、印章材质以及纸张类别不同,印章图像所呈现的效果也不同,但其印章轮廓是保持不变的。结合书画印章的图像特点,本文主要从印章图像的轮廓细节进行检测算法研究。算法主要分为四个步骤:
1) 对真印章进行特征区块选取;
2) 对待测印章进行图像纠正,使其与真印章图像大小及方向一致;
3) 采用特征区块对待测印章进行模板匹配,得出相似度评分;
4) 采用双曲线变换对相似度评分进行优化,得到待检测印章图像的最终评分。
3.1. 特征提取
市面上伪造印章的制作方法主要根据真印章图像纹路进行仿刻。因印油在纸张上会有扩散现象,通常印章图像与印章本身的轮廓是不能完全匹配的,特别是在印章纹路比较尖细的地方区别更为明显。这样通过用真印章图像仿刻出来的印章,再印到纸上得到的印章图像与真印章之间的差别会进一步扩大。因此印章的特征提取主要从印章图像中选择轮廓纹路尖细的文字边缘处作为特征区块。为了尽可能提取出整个印章的纹路特征,特征区块的数量应保证至少10个。
在进行特征区块进行提取前,首先需要对印章图像进行二值化处理 [20] ,以排除一些背景的干扰。首先对原图进行灰度处理,然后再进行二值化处理,印章图像处理如图1所示。


a) 原图 b) 灰度图 c) 二值化图
Figure 1. Seal image processing
图1. 印章图像处理
选择一个真印章图像作为标准印章图像进行特征区块选取,从印章图像中选取N (N不小于10)个特征区块,特征区块选取原则为印章图像中纹路相对比较尖细的区域。特征区块选取如图2所示。
记录所选取的特征区像素坐标rect (x1, y1, x2, y2),其中x1、y1为特征区块左上角的坐标,x2、y2为特征区块右下角坐标。
3.2. 图像纠正
对于待检测的印章图像,可能大小和方向与标准印章图像不一致,在检测前需要对待检测的印章图像进行纠正。具体步骤为:
1) 将待检测印章图像缩放到与标准印章图像大小一致,图像方向尽可能通过图片处理软件调整到与标准印章图像相对一致的方向。
2) 在标准印章图像上选择若干个锚点(数量不小于3)并记录锚点的中心坐标OC(x, y),锚点的选取原则是印章图像上是唯一的,不可有另外的图像区域与锚点相似;锚点的选择如图3所示。
3) 用锚点图像在待检测印章图像上做模板匹配,得到锚点在待检测印章图像上的中心坐标NC(x, y)。
4) 通过仿射变换把待检测印章图像调整到与标准印章图像一致的大小与方向。仿射变换公式如式(1)所示。
(1)
式中
为变换矩阵,
为输入的坐标向量,
为平移向量,
为输出的坐标向量。变换矩阵通过opencv的getAffineTransform函数获取得到,平移向量此处设置为0。经过仿射变换后的印章图像如图4所示。

a) 变换前印章图像 b) 变换后印章图像
Figure 4. Affine transform image processing
图4. 仿射变换图像处理
3.3. 特征区块匹配
在调整好待检测印章图像与标准印章图像大小后,采用在标准印章图像上已选取好的特征区域块的坐标分别从标准印章图像与待检测印章图像上截取出特征区块图像并一一进行模板匹配,得到每一个特征区块图像的匹配相似度评分。然后采用加权平均方式对所有特征区的相似度评分进行求和得出待检测印章图像的整体相似度评分,计算公式如式(2)。
(2)
式中,Si为单个特征区块评分,wi为单个特征区块的权重,S为总体评分。权重值wi的计算采用轮廓长度与像素密度作为输入参数,具体的计算方式如式(3)。
(3)
式中,Li为第i个特征区块的轮廓长度,Mi为第i个特征区块的像素密度,
为所有特征区块的轮廓长度之和,
为所有特征区块的像素密度之和。
3.4. 评分优化
书画印章图像由于用印力度、印油浓度、纸张材质等不同因素的影响,印章图像呈现的效果也有所区别。在用特征区块对待检测印章图像进行检测后得到的相似度评分中,多个测试结果会散落在相对比较分散的区间,但真假印章的相似度评分还是有比较明确的区分。为了使检测得到的最终分数更能体现真假印章的区别,需要对相似度评分进行优化。有多种方法可以对相似度评分进行优化,如采用正态分布函数、抛物线函数等,本文采用双曲线函数来对相似度评分进行优化,其特点是可方便进行曲率与分割点进行调整。具体的最终分数p的计算方法如公式(4)。
(4)
式中,Sp为双曲线从起点到p点的长度,S100双曲线从起点到100的长度,双曲线长度的计算公式如式(5)所示。
(5)
式中R为双曲线的纵向系数,G为双曲线的横向分割点,offset为横向偏移量。
通过双曲线变换,对分数落点在双曲线上进行拉长,然后再压缩到原有长度,使得最终分数能更明显体现真假印章的区别。
4. 实验和结果
4.1. 实验设计
本文印章检测算法在特征区块与锚点的选取上对于不同的印章图像是不尽相同的,需要针对不同的印章图像来具体选择不同的特征区块与锚点,选取好特征区块与锚点称之为一个印章检测模型。因此,在对特定印章进行检测的前置工作是对该印章的图像做好检测模型。印章检测流程如图5所示。
印章的检测模型数据采用配置文件的方式来保存,方便程序进行读取。印章检测模型数据包含印章名称、锚点坐标与特征区块的坐标。以下是一个印章检测模型的数据文件例子:
[seal_hzc]
anchor_1=[577,127,760,258]
anchor_2=[69,605,228,737]
anchor_3=[764,656,879,839]
features_1=[453,177,513,237]
features_2=[122,267,198,343]
features_3=[678,304,744,370]
features_4=[841,385,895,439]
features_5=[368,408,436,476]
features_6=[110,466,162,518]
features_7=[967,596,1009,638]
features_8=[588,640,644,696]
features_9=[106,664,154,712]
features_10=[27,854,73,900]
开发环境配置上,采用Python做主编程语言,集成开发环境是Jetbrains的Pycharm软件,图像处理采用OpenCV,配置文件采用configparser包,界面程序采用tkinter包进行开发。书画印章鉴别检测软件界面如图6所示。

Figure 6. Seal detection software interface
图6. 印章检测软件界面
印章鉴别检测软件操作流程为:
1) 选择一个已做好的印章模型,选择模型后会在模型下方显示此模型的标准印章图像;
2) 选择待检测图片,选择图片后会在左则图像区显示所选择的图片;
3) 开始检测,检测完成后会显示检测结果,以百分数形式显示待检测图像与标准印章的匹配相似度,同时会在图像区上显示出所有特征区块的匹配相似度值。
4.2. 实验结果和分析
为了对比印章检测算法对真假印章的检测效果,需要分别收集同一个印章的真、假印章图像数据进行验证。由于私自仿制印章是不合法行为,因此在向真印章所有人说明印章用于科研目的并得到授权后才进行印章仿制。印章仿制方法为采用一张真印章的标准印章图像进行印章仿刻,得到一枚与真印章相似度较高的假印章。另外为了对比印章检测算法对在不同纸张上的印章图像的检测效果,需要收集真、假印章在不同纸张上的印章图像数据。本次实验共收集真印章在宣纸、普通打印纸上的印章图像数据各1000张,收集假印章在宣纸、普通打印纸上的印章图像数据各1000张。检测结果如图7、图8所示。

Figure 7. The detection result of the seal on xuan paper
图7. 印章在宣纸上的检测结果

Figure 8. The detection result of the seal on ordinary printing paper
图8. 印章在普通打印纸上的检测结果
从图7与图8的结果可知,印章在普通打印纸上的检测结果要高一些,主要是因为印油在宣纸上的扩散程度比普通打印纸上的扩散程度大,会丢失部分细节的纹路特征。从检测数据上看,真印章的检测相似度主要集中在80%~95%之间,假印章的检测相似度主要集中在35%~60%之间,检测算法对真假印章的区别度比较好。以相似度70%作为阈值,那么检测算法对真假印章的检测准确率可达98%以上。
5. 结束语
本文通过对中国书画艺术作品印章图像特点进行分析,从印章图像细节轮廓与纹路进行印章检测算法研究。首先对印章图像进行处理,利用二值化图像排除印章背景图像的干扰;其次通过多锚点的方法对待检测印章图像进行纠正,使其与标准印章图像大小与方向一致;最后计算待检测图像与标准印章图像的特征区块匹配相似度,并采用双曲线函数对特征区块匹配相似度评分进行优化,使真、假印章的检测评分得到明显的区别。通过对真、假印分别在宣纸与普通打印纸上进行盖印后采集的图像数据进行检测结果验证,算法对真假印章的检测准确率可达98%以上。基于印章检测算法开发的印章鉴别检测软件,可减少对专业知识与经验的依赖,提高书画印章检测效率与准确率,在中国书画印章鉴别检测领域具有较好的应用前景。
基金项目
本文由“亚太人工智能学会AI艺术研究计划”项目资助。
NOTES
*通讯作者。