1. 引言
人工智能技术在近年来以不可思议的速度发展,从最开始的生成文本、生成图像到现在的动画、模型生成。技术的发展让动画制作行业从业者开始尝试让人工智能参与到创作的环节中。2022年,运用人工智能生成的动画短片《乌鸦》荣获2022戛纳电影短片节最佳短片,短片运用人工智能相关技术将实拍片段转化为二维动画效果。随着科技的飞速发展,AI生成技术在全球范围内持续引发热议。如何将这项技术更有效地融入大众的工作与生活场景,已然成为亟待探讨的重要课题。
《千秋诗颂》是中国第一部文生AI视频系列动画片,该系列动画由中央广播电视总台综合频道策划推出,教育部教材局、人民教育出版社提供学术支持。《千秋诗颂》将义务教育阶段课本涉及的部分古诗词内容以AI文生动画形式做了全新的演绎。中国古诗词作为中华优秀传统文化的一部分,折射出中国人的传统价值取向,涵盖了民族的优秀精神传承,《千秋诗颂》的诞生无疑是先进技术结合中华优秀传统文化的重要成果。然而《千秋诗颂》的面世伴随的不仅是赞扬,还有来自网友的质疑。本文将以《千秋诗颂》为例,分析AI动画参与传统文化传承推广的现实意义,《千秋诗颂》作为中国首部运用AI文生视频动画的表现,探讨未来AI技术会以何种姿态参与动画制作。
2. 技术革新带来的行业机遇:AI动画参与文化传承推广的现实意义
当前,越来越多动画创作者深入挖掘中华优秀传统文化的精神内核,致力于将水墨意境、武侠精神等传统美学元素与“仁义礼智信”等人性价值理念融入作品创作,不仅在国内引发年轻观众的情感共鸣,更凭借独特的东方美学与叙事在国际影展中获得专业领域认可。AI生成技术作为新出现的生产力工具,参与到动画制作的过程中,为动画未来技术发展提供了新的可能性。
不断演进的技术既是文化传播的工具和载体,也是文化传播的加速器[1]。现在AI已经趋向应用普及型技术,越来越多的比赛开放AI生成作品的专属赛道,美国科罗拉多州博览会艺术比赛中《太空歌剧院》的夺冠代表着AI生成作品的原创性得到了艺术行业的认可。技术的更迭往往会带来艺术表现形式的更新,动画这种艺术表现形式从最开始的赛璐璐动画到二维无纸作画的转变表现了它可以适应技术变革、展现形式多样的特质,在与AI技术的结合条件上具备曾多次技术迭代的经验基础。作为一门结合了文学、绘画、摄影、音乐等诸多因素于一体的艺术形式,它所能承载的信息量是单一艺术形式不能比的。《千秋诗颂》系列动画的诞生,应用了央视和上海人工智能实验室联合推出的支持故事性、多镜头的央视听媒体大模型,让包含优秀传统精神文化的动画作品伴随着新技术的发展,在大众面前拥有了更丰富的创作可能性,推动了文化内容的输出。
因为AI生成技术是可以让生产效率显著提升的工具,所以这项技术在商业设计领域中被高度关注。AI生成一张岩彩风格,带完整背景的A4尺寸图像在输入关键词后只需要大约一分钟的时间就可以完成,但是如果采用传统架上绘画的方式创作,根据创作者对工具的掌握程度,完成作品可能需要数日至数周不等的时间,这种效率上的差异同样会在动画的创作上体现,并且体量较小的制作团队由于资金受限,与大厂相比,在制作环节往往需要耗费更长时间。《哪吒之魔童降世》(2019)的出品人王长田说:“AI能够有效弥补动画电影产能不足的问题,帮助团队去完成场景搭建、分镜头设计和形象设计等方面的制作,辅助创作者拓宽创作视野,也可以避免低质量产品的出现。此外,AI能有效实现降成本”[2]。
AI参与《千秋诗颂》动画制作是一次AI生成技术在商业领域应用的一次大胆尝试,《千秋诗颂》里尝试将场景和角色的传统手绘技法替换为AI生成,它在出产效率上的突破或许意味着未来某些类型、题材的动画在制作环节中需要花费的时间和资金会降低,由此带来创作门槛的降低会吸引更多创作者加入动画创作的行列,对于行业整体产能的提升和文化的传播都是有利的。值得关注的是,“人工智能技术监制”职员表中汇聚的算法开发、模型训练及数据处理等跨领域技术人才,其复合型人才矩阵的构成,正折射出AIGC技术重构动画工业流程的革新图景。
3. 创新实践对未来发展的借鉴意义:《千秋诗颂》的研究价值
《千秋诗颂》作为中国首部全流程应用央视“央视听媒体大模型” + 多模态工具链制作的动画,在技术层面具有突破性的意义:从前期文本脚本、角色及场景生成、角色动画绑定,到最后的配音合成、视频剪辑环节均用AI完成。AI正在以灵活的姿态参与到动画项目制作中:例如特定历史时期的人物为保证形象的真实可考,在实拍人物后用AI进行动画制作,五官细节部分出现的问题则交由后期团队进行修改。《千秋诗颂》的播出验证了AI技术全流程应用在技术层面的可行性[3]。央视听媒体大模型具有优秀的开放世界理解和内容生成能力,可以准确地在理解内容要求的基础上生成符合风格参考的图片,央视听媒体大模型的成功和中央广播电视总台与上海人工智能实验室双方的深度合作有密不可分的关系。央视听媒体大模型的诞生基于上海人工智能实验室开发的书生通用大模型体系,集合了中央广播电视总台的海量视听数据与上海人工智能实验室的原创先进算法和大模型训练的基础设施优势。针对AI生成模型质量参差不齐,性能缺乏量化标准进行评估的情况,为《千秋诗颂》提供技术支持的上海人工智能实验室2023年发布了大模型开放评测体系“OpenCompass”。OpenCompass提供了多样化的评测方式与全面的测评方向,并且参与到了书生通用大模型体系的评测工作中。从技术社区HuggingFace官方发布的评测榜单OpenCompass LLM Leaderboard中可以看到书生通用大模型体系中的模型在榜单上名列前茅,书生·浦语大模型当期排名仅次于GPT-4和ChatGPT,充分说明央视听媒体大模型对比同时期的同类大模型具有比较卓越的性能。
在AI图形模型训练方面,通过训练AI大模型学习水墨画风、唐代服饰或建筑等元素,突破了西方AI工具在中国文化符号表达上的局限性。中国画作为一种起源于汉代、具有鲜明民族特色的古老绘画形式,历经数千年的艺术流变,形成了深厚的文化积淀。其中,文人画更发展出“诗画一体”的独特传统——题画诗不仅以书法形式融入画面构图,更与绘画意境形成深层次的审美呼应。在以诗为主题的动画中融入水墨风格,契合了中国传统书画中文人画的意境。
以《山水情》为代表的传统水墨动画呈现出中国动画艺术的独特审美趣味,然而传统水墨风格动画的制作对动画技术有较高的要求,不适合在短时间内大批量生产,对于《千秋诗颂》这样一个大体量,更新快的项目来说显然是不适用的。水墨风格AI模型的诞生及在动画制作中的应用,可视为以较低成本将水墨风格融入动画的一次尝试。
中央广播电视总台作为中国具有相当影响力的文化传播机构之一,同时作为国家的主流媒体,肩负了一定的公共审美教育功能,此平台上的作品在一定程度上代表了国家当下的技术前沿和审美潮流。《千秋诗颂》在反映现阶段AI的开发与运用程度上具有一定的代表性,它的诞生也是AI文生视频应用成果的阶段性展示。
《千秋诗颂》作为中国第一部全流程AI参与的作品,也必然有它的不足之处,无论成功还是失败,它对后续AI大模型的开发以及解答AI以何种角度参与到动画制作流程中这一问题都是有借鉴意义的。
4. AI工具在动画制作过程中的双面性:《千秋诗颂》在技术运用方面以及艺术表现
分析
《千秋诗颂》对于中国AI生成应用技术起到的探索作用固然重要,也表现出来一些AI技术在动画领域中应用的局限性,从哔哩哔哩视频网站上人民教育出版社的官方视频评论区看大众对于这部动画的评价还是不尽人意的,很多观众对于此次AI技术在动画中的应用接受度较低,分析其原因有以下几点。
首先,一部动画的选题奠定了它的整体基调。在全球化的浪潮下,我国的传统文化与价值取向承受着来自西方世界价值观的冲击。古诗词作为中华民族流传千年的文化瑰宝,承载了中华民族的审美志趣与价值取向,古诗词中的韵律美也向世界传达了汉语言的博大精深。制作组选择古诗词作为主题并将其与AI动画相结合,是一次对于古诗词表现方式的创新尝试。《千秋诗颂》第一集《别董大》通过对诗篇进行故事化的改编,动画该集在离别桥段以雪景衬托离别的苦楚,同时反衬二人面对离别的坚强信念,展现了高适与董大二人的真挚情谊和虽然境遇困顿,但依旧以乐观豁达的心态面对未来的开朗胸襟。《千秋诗颂》的改编向大众展现了动画在情感与价值观传达上的可能性,有益于中国传统文化题材的创作繁荣。
其次,从画面观感上看,动画是属于空间和时间的艺术,动画规律就是专门研究空间、时间、速度、张数这几个动画因素的概念及其相互关系,从而确保动画动作的节奏规律[4]。优秀的人物动作演出可以表现出角色的特质。现在AI生成技术的核心基础有生成对抗网络与降噪扩散概率模型。生成对抗网络通过构建生成器与判别器的对抗博弈框架,实现图像的快速生成。降噪扩散概率模型的核心思想是通过模拟数据在前向扩散过程中的逐步噪声化与反向去噪过程中的逐步重建,合成单帧图像。AI模型训练中的噪声化与去噪的过程导致了即使输入相同的提示,微小种子差异会导致生成路径的分叉,最终输出结果出现显著不同。现在AI技术还在持续高速发展阶段,由于生成的画面具有随机性,AI生成技术在作画可控性方面十分欠缺。《千秋诗颂》在人物作画上只能保证人物特征的相对稳定,但是无法保证动作的流畅度,不少动作的完成仅仅是在两张关键帧作画之间添加过渡效果,省略了中间画,并且一个动作的首尾缺少缓冲,人物动作缺乏表现力。传统的动画为保证动作流畅,对于每秒作画张数有一定的要求,一般情况下,每秒作画张数低于8张时在视觉上就会出现动作卡顿。《千秋诗颂》摒弃了一些传统动画的要素,让角色运动的韵律感与视觉连续性较之常规动画呈现出明显落差。
《千秋诗颂》中还存在着绘画语言不统一的问题,当前全球通用(国内也在使用)的大模型数据训练集里,中文语料仅占1.3%。数据训练的过程也是在底层定义生成式人工智能大模型输出内容的过程[5]。基于此背景,央视推出融合中国传统美学的央视听媒体领域大模型并运用到了《千秋诗颂》的制作过程中,诞生了具有中国特色的人工智能生成模型,对于未来在全球范围内借助先进人工智能生成技术推广中国传统文化也是一次大胆尝试。但是出品方没有把借助模型生成的内容做好结合,导致背景的拼贴痕迹过重,动画会出现上一个场景是写实风格的背景,画面转到下一个场景就变成了水墨风格的情况。商业原动画系统为了避免前后风格不统一的情况,往往会让作画监督担任起统一画面风格的任务,如有动画作品中出现前后风格不统一,往往是出于艺术表达的需要,《千秋诗颂》在缺乏这种前置条件的情况下反复出现作画风格不统一的问题,表现出一部动画不该有的割裂感,画面中还能看到生成过程中出现的一些未经修整的细节问题,例如非必要的断线、线头,表明了目前模型在生成过程中对于细节还是缺乏把控能力,这些问题都需要后期花费人力进行调整。
由市面上常见的初代生成式人工智能模型生成的图像,画面缺乏虚实关系和空间感,有很重的AI生成痕迹。就目前《千秋诗颂》呈现的画面效果反映出在动画制作阶段应用的模型依旧受市面上初代的生成模型影响。央视听媒体大模型现阶段已经可以准确地理解并生成具有中国传统的水墨,工笔风格的美术图像,但是从《千秋诗颂》反映出来,这一模型目前只做到了对某一类型艺术风格的单纯模仿,目前还无法完全理解传统绘画中的美学原理,最终的生成结果只是杂糅了多种绘画风格的图像,没有在全片中呈现出令人满意的中式美学意境。
AI能参与到制作流程的前提是它在降低制作成本的同时保持了良好的视觉感受。2000年后,中国为了扶持文化产业的发展推出了针对动画行业的补助政策,导致一段时间内动画行业出现了野蛮生长的态势,部分“水作”开始涌现,不仅破坏了以几大美术电影制片厂建立的“美术片”口碑,一度让中国商业动画在大众心目中成了有量无质的代表,这种口碑下降带来的后果是大众对于中国动画产业的不信任,尤其当智能手机和电脑已经普及,大家接触信息的方式多样化,可以选择的范围也会扩大,大众会自然把目光投向有品质保证的一方。《千秋诗颂》在视觉方面的表现无疑是不够优秀的,信息爆炸的时代背景下,如果一个作品无法在开篇吸引观众,就极有可能被淹没在网络冗杂信息中,动画展现的视觉表现力如果不能在一开始就征服观众的话,其承载的精神内涵与文化气质也难以继续传播推广。
最后值得一提的是《千秋诗颂》在台词表现方面有它的独到之处。《千秋诗颂》系列动画片选取的是义务教育阶段的诗歌篇目进行改编,主要的受众群体是6~12岁左右的小学生,如何将台词写得让学生们能听懂的同时保持汉语的美感成为了制作团队在台本撰写时需要考虑的因素之一。片中将一部分文言文的要素融入台词,例如“乃”、“而”、“之”、“于”等文言虚词在台词中的大量出现。在不影响受众理解基本含义的同时将文言虚词带入到文言文的语境中,在体会古诗文传达的精神内涵时感受汉语的语音美,形式美。展示了制作团队对于产品有清晰的定位,对目标群体有明确的认知,并且依托人民教育出版社提供的强大学术支持表现出来的中华文化的深厚底蕴。
总体来看,《千秋诗颂》受众范围有一定局限的特点决定了这只是一次针对AI技术在动画作品应用的试水,作为对于先进技术的大胆应用与将中华传统优秀文化融入新技术应用的尝试,具有进步性,但作为一部动画作品来看是不理想的。
5. 以谨慎的态度运用AI工具:未来AI技术参与动画制作的设想
针对人工智能技术的研究从上个世纪就已经开始,但是它的大面积推广应用还是近几年,人工智能应用缺乏相关的行业、技术规范,需要行业相关从业者以谨慎的态度去对待其在动画领域中的应用。
面对目前靠AI难以独立解决的问题,应该考虑如何让AI与人协作,将呈现效果最优化。例如2024年暑期档上映的《异人之下》,制作方在演员表演的基础上,利用AI摹片技术将三维画面转换成二维风格,致敬漫画原著。通过AI摹片让实拍片段高度风格化的方法在2023年就已经被应用,例如由Corridor Digital团队制作的“Anime Rock, Paper, Scissors”:团队在前期已经完成了分镜头设计与演员表演的摄制,演员的优秀表演一定程度上掩盖了当时由于AI动画的技术限制产生的僵硬感。对比《千秋诗颂》的角色表演,“Anime Rock, Paper, Scissors”在演出上有更加流畅的视觉体验。2025年开播的动画《双子hinahima》在宣传PV中也放出了AI摹写真人表演的片段。针对传统AI无法准确识别手部结构的问题,《双子hinahima》的制作组在真人摄制后用AI摹片,从动画片段中可以看出,手部的结构经AI处理成二维画面后依旧清晰准确,展现出AI摹片技术对于维持动画作画稳定性的切实帮助。并且AI摹片对比直接生成需要的学习成本更低,风格的一致性更高。所以,针对目前《千秋诗颂》动画中出现的动作僵硬问题也可以考虑将AI摹片技术结合到动画制作中,提升角色动作的流畅性,让动画表演自然生动,提升观众的观看体验。
包括电视动画在内,所有艺术文化产品的海外推广与文化传播都需要符合接受者的心理预期[6]。从某种程度上来说,大众对于作品的接受程度极大地影响了作品文化内核的传递,大众希望看到更高质量的作品。诚然高新技术的应用是佳作的判定标准之一,但是技术是为了作品表现服务的,《千秋诗颂》目前应用新技术所展现出来的成果是不理想的,新技术的应用可以为传统文化带来关注度,却不应该成为单纯的噱头,文化传播需要拿出更有诚意的作品,让AI投入到生产环节中,需要发挥这门技术高效率优势。现阶段AI技术还有缺陷,没办法完全替代制作流程中的一些环节。
中华优秀传统文化的传播应该走创新路线,与时俱进。目前AI生成技术需要依靠大量“投喂”已有的艺术成果进行训练,并且生成的结果会带有模仿痕迹。现在各个视频网站上已经有大量根据吉卜力动画工作室的经典作品的画面风格生成的AI影像。这就导致人们担忧在AI进入动画制作环节的同时是否会产生作品过于同质化的现象,摆脱模仿是改进AI动画工具的高级别技术难题,是无法回避和刻不容缓的优先级任务[7]。中华传统文化具有深刻的积淀,在全球多元文化中特色鲜明,有大量独特的文艺形式,所以,可以利用中华传统文化对数据库进行训练并且扩充已有的模型数据库,让更多包含中国传统美学的数据模型库在众多同质化的数据库中脱颖而出。在模型数据库训练的同时,还应当重视训练用数据的版权问题,当前,大模型的出现对人类作者及社会将产生何种影响尚未完全显现,面对大模型训练数据语料库对版权作品日渐强烈的需求,如何解决科技发展与版权保护间的矛盾陷入了治理困境[8]。要解决这一问题,AI模型的训练者们可以尝试通过从作者手中购买作品用于模型训练的使用权等方法规避版权方面的争议,平衡双方的利益冲突,为世界范围内AI生成技术在动画制作领域中的运用提供行之有效的方法,进一步为作品在世界舞台上的推广营造舆论优势,从而将带有中华优秀传统文化的作品推广开来。同时大力推广技术革新,利用AI生成具有创新内容的东西可以成为下一个突破口。
6. 结语
AI技术虽然已经推出了一段时间并且它的应用成果在一些正式场合得到了认可,但是AI该不该在动画中使用却一直没有在大众心中达成道德层面的共识。《千秋诗颂》的出品方作为“第一个吃螃蟹的人”,不仅在技术应用上作出了突破创新,也颠覆了传统的动画制作模式,让动画从业者开始思考新的高效工作模式。
AI动画在结合中国传统文化上也有卓越的潜力,从水墨风格在模型训练中的应用到文生视频环节对文字的理解能力上的突出表现,AI在动画艺术创作中展现出了强大的易用性。AI这种高效生产工具的开发如果能持续下去,有望以更高的效率生产出高质量的具有传统文化特色的文艺作品,增加传统文化在世界舞台中的曝光度。
基金项目
北京印刷学院校内研发项目——科普动画研发模式研究,项目编号Ee202211;
北京印刷学院学校基础研究一般项目——网络强国新时代动画创作及动画人才个人IP开发研究,项目编号Ec202215。