1. 绪论
民间美术根植于中国各民族的生产生活与风俗仪式,在长期的发展中催生出剪纸、雕塑、刺绣纺织等民间美术,承载着丰厚的文化底蕴。民间美术代表的是民众在社会生产中展现的精神风貌,具有极高的文化价值和社会价值。20世纪中叶以来,中国科学技术领域蓬勃发展,社会日新月异,各种新兴技术层出不穷,社会节奏不断加快。与此同时,因其“重传承少创新”的特点,民间美术因其传承方式的口传心授、工艺复杂及创新动力不足,面临严峻的生存挑战[1]。
近年来,人工智能技术的突破为民间美术的传承与创新带来了新的契机,早期国家对于民间美术的数字化保护有数字化采集和建立数据库(如国家非遗数据库),然后过渡到利用三维技术以及本体构建等,如利用三维扫描、纹理映射、三维建模等技术在记录立体造型类民间美术的完整工艺流程与形态细节;利用高光谱成像能捕获人眼无法识别的光谱信息,分析民间美术品的颜料成分、发现隐藏的底稿或修复痕迹,为科学保护和真伪鉴定提供依据;以及利用虚拟现实技术将观众置身于长江三峡地区的传统村落,深入欣赏当地的年画、石刻、木雕、皮影等美术作品,观赏当地民间艺术家创作艺术作品的全过程等[2]。数字化技术已然成为保护民间美术的必不可少的手段。
但如今的数字化技术对于民间美术的保护仍具有局限性,一方面其大多仍停留在“静态档案”阶段,海量的民间美术图案仅仅能够被记录,但难以挖掘民间美术深层的文化语义及艺术特征;另一方面,民间美术的艺术表现形式在这个时代急剧萎缩,资源难以检索,因此民间美术亟待创新以更好地适应时代的发展。伴随着数字化浪潮,人工智能技术应运而生并逐渐在保护民间美术中产生举足轻重的影响。作为人工智能领域的重要分支,近年来计算机视觉(CV)和生成式人工智能(AIGC)等技术飞速发展,为深度学习和理解民间美术的文化内涵带来新的技术。
2. 理论基础与技术框架
(一) 民间美术的内涵与特征
1. 民间美术的内涵
民间美术是广大民众在生产劳动中产生的一种兼具实用性与审美性的艺术,它既在劳动生产中产生又被运用到劳动生产中,具有鲜明的地域性、民族性和群众性特征[3],是中华文化的重要物质载体。民间美术还蕴含着丰富时代特征,如新石器时代的彩陶艺术,秦汉十七的石雕、陶俑,魏晋时期的版画、年画、雕塑等。民间美术展现了不同时代人民群众的精神风貌,丰富了社会文化生活,展现了人民群众的美好愿景,且对于后来的国内外文化艺术具有深远的借鉴意义。
2. 民间美术的特征
(1) 艺术形式
民间美术注重通过外在表现形式表达独特的内在底蕴。其艺术形式丰富多样,如绘画类(版画、年画、壁画、建筑彩画等)、雕塑类(彩塑、木雕、面塑、建筑石雕等)、器皿类(陶器、瓷器、木器、竹器等)、玩具类(泥玩具、布玩具、纸玩具等)、戏具类(木偶、皮影、面具、花卉造型等)、剪纸类(窗花、礼花、刺绣、刺绣花样等)、纸灯纸扎类、编织类(草编、竹编、柳条编、秫秸编、麦秆编等)等。民间美术的外在形式与人民群众的生活紧密联系,注重审美与实用的统一,如剪纸窗花为迎春,虎头鞋护佑孩童。
(2) 色彩表现
民间艺术的色彩表现兼具对比与和谐。不论是哪种形式的民间美术,创作者在创作中对色彩的运用十分夸张且大胆,且夸张不失和谐,大胆又深藏寓意。如山西的布老虎运用了黄与紫、红与绿、黑与白等多种强烈的对比色,塑造了喜庆威猛且充满活力的瑞兽形象。
(3) 文化寓意
民间美术“图必有意,意必吉祥”。其内容不是简单的物象表达,而是综合象征、谐音等手法将其中蕴藏的文化内涵充分表达(如“莲”谐音“连”,“鱼”象征“余”,“石榴”寓意“多子”)。蝙蝠(福)、鹿(禄)、桃(寿)等物象都是文化符号。
(二) 人工智能技术概述
1. 深度学习
深度学习是机器学习的一个重要分支,其核心思想是使用多个处理层的人工神经网络,从原始数据中自动学习多层次的特征表示和抽象。“深度”指的是神经网络中层的数量,与早期的“浅层”网络相比,深度学习网络拥有更多的隐藏层,使其能学习更复杂的非线性关系。“学习”是通过叫做“反向传播”的算法,利用大量数据自动调整网络内部数百万甚至数十亿的参数,让网络的输出更加接近期望目标。它通过构建深层的神经网络,对海量非结构化数据中复杂模式的自动化特征学习与表征。它能够从原始数据学习最佳特征,对于复杂图案、文本等的识别更加卓越。目前主流的神经网络架构有前馈神经网络、卷积神经网络、循环神经网络、Transformer和生成模型。深度学习的产生为各种人工智能应用如计算机视觉、自然语言处理、语音技术等带来了前所未有的发展,它极大地提高了这些技术对于大量数据的分析、处理和生成的能力。
2. 计算机视觉
计算机视觉是赋予机器“看”与“理解”的技术,通过摄像机等成像设备模拟眼睛,通过算法模型模拟大脑,实现对收集的视频或图像进行提取、分析和决策。其核心目的是让计算机像人一样能够感知、认识与理解环境,从环境中获取信息。
计算机视觉经历了一系列的发展。20世纪60年代到80年代是计算机视觉的萌芽与理论奠基阶段,大卫·马尔提出了视觉计算理论,当时的计算机视觉侧重于对图像的处理以及特征提取。进入90年代,随着支持向量机、随机森林等方法广泛应用于分类与识别,使得机器学习方法成为主流,特征学习得到发展;进入21世纪,深度学习如卷积神经网络、Vision Transformer为计算机视觉带来了突破性进展,CNN在ImageNet竞赛中取得历史性成功,推动了在分类、检测等各项任务上的普及。
为实现“看懂”图像的目的,计算机视觉发展出了一系列层次分明的核心任务,构成了一个完整的技术栈:图像分类、目标检测、语义分割、实力分割、关键点检测、目标跟踪、三维重叠、图像生成与编辑以及视频理解。如今,计算机视觉技术日趋成熟,并被广泛应用到自动驾驶、医疗影像、工业检测等行业,是驱动产业智能化变革的核心引擎。
3. 基于生成式AI的民间美术创新设计方法研究
(一) AI辅助式创新设计框架构建
本框架围绕“数据驱动、知识引导、人机协同”进行AI辅助式创新设计,包含三个相互关联、循环渐进的核心阶段,共同构成一个动态的创新设计系统。
1. 数据采集阶段。综合采用高精度扫描、三维建模、过程录像、口述访谈等方式构建包含视觉、工艺、文化语义在内的多角度数据,随后对纹样、色彩、构图等视觉特征和文化寓意、地域流派等深层语义信息进行标注,形成“视觉–语义”关联的数据对。在此基础上,构建民间美术知识图谱,根据文化逻辑将分散的数据连接成一张关系网,为后续AI生成设计方案提供数据基础。
2. 人机协同阶段。设计师通过草图、风格参考图等向AI传递设计方向,AI则基于知识图谱的引导和风格学习,从构建的数据集中检索、融合,快速生成多样化的初始设计方案。
3. 评估优化阶段。设计师围绕技术、美学、文化、创新四个维度对生成方案进行评估并反馈给AI,AI进一步进行探索与调整,生成优化的设计方案。
(二) 面向民间美术的数字化学习
1. 构建民间美术数据集
民间美术具有丰厚的文化寓意,因此在对其数据集的构建时不能只是单纯的外观特征,还要将所代表的文化一同记录。另外,民间美术作品形式丰富多样,对于不同表现形式的作品应当采用不同的技术进行采集,尽可能地减少误差。
对于平面作品(如壁画等)采用专业级别的大幅面扫描仪或者高分辨率数码相机对作品进行扫描、拍摄采集,此类大型作品则采用多图像拼接技术以保证整体与局部细节的完整性;对于立体作品(如雕塑、器皿等),采用结构光扫描或激光扫描对作品构建高精度的三维模型,同时结合多角度摄影获取表面纹理特征信息,从而生成极具真实感的三维数字模型,实现作品的最大化还原。另外,采用延时摄影、多机位摄影等方式相机记录手艺人制作民间美术作品的制作与创作过程,通过口述访谈、纪录片及相关文献记载等作品进行深刻记录及解读。
2. 生成知识图谱
知识图谱旨在通过三元组(实体–关系–实体或实体–属性–属性值)描述概念、实体及其关系的知识库,梳理实体和实体之间的关系,构建关系网。
其一,在视觉上采用Mash R-CNN等实例分割模型,将作品中的独立纹样或元素进行自动识别与分割,利用风格迁移网络或特征提取技术将核心实体类型分为图案纹理(如万字纹)、文化符号/寓意(如富贵)、工艺技法(如扎染)、材质载体(如紫砂)、历史时期/地域流派(如明代、湘西苗族)、人物/机构(如传承人、故宫博物馆)、文献/作品(如《考工记》、藏品“清乾隆粉彩百鹿尊”),关系体系分为象征关系(如牡丹纹象征富贵)、采用关系(如江南土布服饰中的蓝印花布纹样)、源自关系(如起源于陕北地区的剪纸技法)、影响关系(如受唐代宝相花纹启发而出现的宋代瓷器纹饰)、组成关系(如由凤凰纹分解的凤冠、凤尾、凤翅)。
其次从结构化数据和非结构化数据文本提取三元组。结构化数据提取是最直接的,可直接映射为知识图谱中的实体和实体之间的关系,如“ID:001,纹样:莲花,寓意:纯洁,工艺:苏绣”。从非结构化数据中提取是难点与重点,针对文献、口述访谈等文本资料,采用基于Transformer架构的预训练语言模型(如BERT)进行命名实体识别和关系抽取,如从“戴上威武的虎头帽,远离邪魔病毒,健康成长,儿童虎头帽里贮满了平安幸福的期盼”中抽取出三元组(虎头帽,象征,驱邪平安)。利用图神经网络(GNN)对构建的知识图谱进行嵌入学习,将实体和关系映射为连续向量。通过向量运算,进行语义相似度计算,从而发现潜在的文化关联。
3. 民间美术创新设计的知识图谱本体构建
为实现AI从数据中精确理解文化语义,从而支撑人机协同的知识引导,本研究构建了一个结构化的民间美术知识图谱本体(Ontology)模型,该模型是旨在为民间美术领域的知识提供机器可理解、可推理的语义框架。
本体的核心框架由四个相互关联的模块构成:
民间美术模块:该模块为核心模块,形式化定义民间美术的核心知识,包括民间美术门类(如剪纸、年画)、作品、艺术元素以及技法和文化语义,将视觉元素与文化背景连接在一起。
设计创新模块:创新设计的过程,包括设计任务、设计流程(如灵感、草图等阶段)、创新方法(如解构、重组),将创作过程结构化,为机器提供可操作的路径。
AI技术应用模块:AI辅助创新的技术工具,涵盖AI模型(生成、分析、评估)、AI任务(风格迁移、图案生成等)和工具。
文化语义网络模块:深度构建民间美术与文化象征,包括文化符号、意义系统(字面义、象征义、情感义)、故事叙事与隐喻,使得抽象的文化语义能够被计算。
通过“实体–关系–实体”或“实体–属性–属性值”对数据进行精确建模,如“莲花 象征 纯洁”、“布老虎 采用 强对比色”,本模型将分散的图案、色彩、技艺与文化寓意编织成一张语义关联的网络,不仅为生成式AI提供了精确检索与融合的知识库,还为创新设计引导提供了逻辑基础。
(三) 结果生成与创新设计
设计师从参考图中直接提取色彩、图案纹样、构图方式等,通过组合创作出大致的作品框架,向AI精确传达设计意图,将视觉思维外化与结构化,尽可能地减少传递时产生的误差。而后,AI基于此前构建的知识图谱,在其中进行搜索相关特征信息,根据设计师的设计意图生成一批设计方案,设计师选择最符合自己设计意图的方案并对给予反馈,设定不同的生成方向,AI根据设计师给予的反馈,沿着“抽象化–具象化”、“繁复–极简”、“传统用色–现代用色”等多个轴线生成方案,使得传统民间美术图案特征突破传统,将现代化元素融入其中从而实现民间美术的创新设计,如天津美术学院的“泥人张AI专属模型”通过此方式让艺术家能够快速实现风格迁移和主题创新。
(四) 生成结果评估与优化
1. 多维度评估
对于AI生成结果建立可描述、可操作、可复现的评估标准,围绕技术、美学、文化、创新四个维度,将模糊的感性评估转化为结构化的理性评估,使AI能够对设计师给予的评估进行精准调整优化。
技术评估:技术评估需检测生成的设计方案的视觉元素是否完整(如线条是否闭合、结构是否完整)、风格是否一致以及方案与目标载体是否适配。
美学评估:美学评估需要判断构图的视觉平衡、色彩表达是否正确、所提取的民间美术特征是否能够正确运用,而不是生搬硬套。
文化评估:这是评估的核心维度,需要对生成的设计方案进行严格的文化语义检查,判断核心特征使用是否准确,图案组合所传递的整体寓意是否明确、积极,是否保留了传统民间美术背后的精神内核(如祈福、丰收),而不是各种纹理图案等简单的拼凑。
创新评估:创新评估需要分析传统民间美术元素和现代文化融合的巧思,判断设计方案时提供了新颖的设计还是提出了新的应用场景、交互方式或文化解读。其最高标准在于该设计方案是否为运用的该民间美术类别的生存与发展提供启发。
2. 优化循环
围绕“生成–评估–反馈–再生”,设计师从技术、美学、文化、创新四个维度出发,对生成的设计方案进行评估并得出结论,将结论转化为AI可以精准执行的反馈指令,AI根据反馈指令,基于构建的数据集和知识图谱进行定向搜索与调整,生成新一轮的优化方案。此循环快速迭代,直至方案与设计师的创作方向高度符合。
(五) 蔚县剪纸的AI辅助创新设计实践
为验证本文提出的“数据驱动、知识引导、人机协同”框架的可行性,本研究选取河北蔚县剪纸作为具体实施对象。蔚县剪纸以其独特的阴刻为主、阳刻为辅的工艺、丰富的戏曲题材和深厚的寓意著称[4],具有鲜明的视觉特征与文化代表性,适合作为验证本框架的案例。
1. 微型数据集构建
本研究构建了聚焦于蔚县戏曲人物和吉祥纹样的数据集,收集了10幅蔚县剪纸作品。在数据预处理阶段,将所有图像进行了色彩校正等标准化处理,并为每幅作品建立了结构化元数据。另外,对作品进行纹样轮廓标注,识别出“凤凰”、“莲花”、“鲤鱼”等元素(见表1)。
Table 1. Composition of the Weixian paper-cutting micro-dataset
表1. 蔚县剪纸微型数据集构成
作品ID |
作品名称 |
主题类别 |
核心视觉元素 |
文化寓意 |
YX-01 |
《连年有余》 |
吉祥图案 |
莲花、鲤鱼 |
连年丰收、富贵有余 |
YX-02 |
《丹凤朝阳》 |
吉祥图案 |
凤凰、太阳 |
光明美好、吉祥幸福 |
YX-03 |
《五福(蝠)捧寿》 |
吉祥图案 |
五只蝙蝠、寿桃/团寿纹 |
福寿双全、吉祥圆满 |
YX-04 |
《瑞雪》 |
风景画 |
雪景 |
瑞雪兆丰年、吉祥丰收 |
YX-05 |
《生命之树》 |
象征图案 |
枝叶、树 |
生命、繁荣永恒 |
YX-06 |
《富贵繁荣图》 |
吉祥图案 |
牡丹 |
富贵兴盛、繁荣昌盛 |
YX-07 |
《黛玉》 |
人物画 |
林黛玉 |
才情美貌、古典雅致 |
YX-08 |
《猫趣》 |
动物画 |
猫 |
活泼乐趣、吉祥好运 |
YX-09 |
《长城》 |
风景画 |
长城 |
坚强永恒、民族精神 |
YX-10 |
《马到成功》 |
吉祥图案 |
马 |
事业顺利、成功 |
2. 构建知识图谱
为实现从“图像”到“文化知识”的跨越,本研究基于数据集构建了蔚县剪纸微型知识图谱。首先设计本体结构定义实体与关系:
实体:作品、视觉纹样、文化寓意、工艺技法、色彩。
关系:包含、象征、采用技法、具有色彩,关联。
而后通过语义标注和阅读文献,将标注数据与文献解读转化为三元组形式(见表2),基于三元组生成知识图谱(见图1)。
Table 2. Core triples of the Weixian paper-cutting domain knowledge graph
表2. 蔚县剪纸领域知识图谱核心三元组
序号 |
头实体 |
关系 |
尾实体 |
1 |
《连年有余》 |
包含 |
莲花 |
2 |
《连年有余》 |
包含 |
鲤鱼 |
3 |
莲花 |
象征 |
纯洁 |
4 |
莲花 |
谐音关联 |
连年 |
5 |
鲤鱼 |
象征 |
富裕 |
6 |
《连年有余》 |
采用 |
点染 |
7 |
《连年有余》 |
具有色彩 |
品红色 |
8 |
《丹凤朝阳》 |
包含 |
凤凰 |
9 |
《丹凤朝阳》 |
包含 |
太阳 |
10 |
凤凰 |
象征 |
祥瑞 |
11 |
《丹凤朝阳》 |
具有色彩 |
红色 |
12 |
《五福(蝠)捧寿》 |
包含 |
蝙蝠 |
13 |
蝙蝠 |
谐音关联 |
福 |
14 |
《五福(蝠)捧寿》 |
采用 |
阳刻 |
15 |
《五福(蝠)捧寿》 |
具有色彩 |
绛紫色 |
16 |
《富贵繁荣图》 |
包含 |
牡丹 |
17 |
牡丹 |
象征 |
富贵 |
18 |
《瑞雪》 |
包含 |
雪景 |
19 |
雪景 |
象征 |
丰收 |
17 |
《瑞雪》 |
具有色彩 |
红色 |
18 |
《生命之树》 |
包含 |
树木 |
19 |
树木 |
象征 |
生命 |
20 |
《生命之树》 |
具有色彩 |
红色 |
21 |
《富贵繁荣图》 |
包含 |
牡丹 |
22 |
牡丹 |
象征 |
富贵 |
23 |
《富贵繁荣图》 |
采用 |
点染 |
24 |
《富贵繁荣图》 |
具有色彩 |
粉红色 |
25 |
《黛玉》 |
包含 |
人物 |
26 |
黛玉 |
象征 |
才情 |
27 |
《黛玉》 |
采用 |
线刻 |
28 |
《黛玉》 |
具有色彩 |
淡青色 |
29 |
《猫趣》 |
包含 |
猫 |
30 |
猫 |
象征 |
吉祥 |
31 |
《长城》 |
包含 |
城墙 |
32 |
长城 |
象征 |
红色文化 |
33 |
《长城》 |
具有色彩 |
青色 |
34 |
《马到成功》 |
包含 |
骏马 |
35 |
骏马 |
象征 |
成功 |
36 |
《马到成功》 |
采用 |
彩绘 |
37 |
《马到成功》 |
具有色彩 |
枣红色 |
该知识图谱成功将分散的视觉元素、作品和文化寓意连接成可查询、可推理的语义网络,为AI理解文化语义提供可靠的逻辑支撑。
3. 生成式设计与评估优化
本设计以“新春”为主题,其紧密关联“祈福”的文化寓意。通过知识图谱,聚焦于“鲤鱼”、“莲花”、“福字”,作为此次设计的核心载体,形成此次设计主题——《福裕》新春海报。
为实现精确设计,需将知识图谱中的风格特征转化为可控制生成过程的结构化指令,指令需包括主题定位、风格约束、元素、形式与质感四个维度。以《福裕》为例,从五个维度出发形成指令:以中国新春为主题,采用河北蔚县剪纸风格,阴刻与阳刻技法相结合,色彩使用鲜艳的品色,以红色和金色为主,进行渐变点染。视觉中心是一个由“双鱼戏莲”图案构成的艺术化“福”字。背景可加入“元宝”、祥云、波纹等元素。构图饱满对称,具有镂空质感,画面充满喜庆的氛围,细节丰富。将上述结构化指令输入生成式AI工具(本研究使用即梦AI),进行了“初代生成–分析–指令优化”的两轮迭代。
Figure 1. Knowledge graph of Weixian paper-cutting
图1. 蔚县剪纸知识图谱
Figure 2. The two-round generation process for “Fu Yu”
图2. 《福裕》两轮生成作品
第一轮生成的作品(见图2)基本符合预期,对其从技术、审美、文化、创新四个维度进行评估:作品实现了对称构图且线条自然,结构完整;色彩鲜艳,是用红色和金色并进行点染渐变,充分表达展现了喜庆氛围;并且出现的“鱼”“莲”等元素使用正确,但左上角的印章内容不明且图案模糊;作品中使用的元素是“春节”“祈福”的主要代表,准确突出“新春”主题;且巧妙地将“鱼”“莲”融合进“福”字中,创新了“福”字的艺术设计。针对第一轮作品的不足,第二轮指令则优化增加并附上传统印章字体示例:左上角的印章要清晰可见字“新春纳福”,字体使用传统篆刻印章字体,如图所示,字体要清晰,只能有四个字,不能出现重复。最终生成的作品(见图2右)所示——福字结构清晰,双鱼与莲纹巧妙融入笔画,色彩喜庆华丽,镂空感逼真,成功体现了蔚县剪纸的特色与新年主题。
4. 结论
人工智能技术对于民间美术的数字化保护和创新设计具有重要意义,通过构建从底层数据及构建到顶层人机协同创新设计的完整理论框架和技术路径。通过构建民间美术数据集并生成知识图谱,将文化知识转化为机器可以理解的数据。设计师基于技术、美学、文化、创新四个维度对生成的设计方案进行评估,将评估结论转化为人工智能可执行的指令,引导人工智能不断调整最终生成既突破传统形式又不失原本文化内涵的最佳方案。蔚县剪纸的案例实践表明,本文提出的框架能够有效指导从数据构建到创新生成的全过程。尽管面临数据规模与自动化程度的局限,“数据驱动、知识引导、人机协同”的核心机制已显现出其在保护文化语义准确性上的关键价值。然而,本研究亦存在局限性,如高质量数据集的构建面临文化解释的多样性、标注标准化的挑战以及人工智能生成成果的版权界定与伦理规范需要法律和社会共识同步建立。本研究认为,人工智能辅助下的民间美术创新设计的目的并非机器代替人类,而是人类作为主导者,利用人工智能放大想象力和文化洞察力,以前所未有的广度与深度去理解和传承民间美术,赋予民间美术新的文化活力。
基金项目
2024年江西农业大学校级教改项(2024B2ZZ40)研究成果;2024年江西省基础教育研究项目(SZUNDMS2024-1014)研究成果。
NOTES
*通讯作者。