1. 引言
随着我国国际地位日益提升、对外交往持续深化,“一带一路”倡议对中国文化软实力建设提出了更高要求。时代背景下,中国国际传播正经历从“单向输出”向“对话共生”的深刻转型。近年来,以5G为核心网络技术的发展,集语言、图像、声音于一体的多模态视频大量涌现,成为文化传播的核心载体。同时,人们对翻译认知的不断深化,翻译研究开始迎来“多模态转向”[1],由过去单模态为主的研究更多地转向多模态的翻译研究。而动画凭借其多模态叙事技术,能够综合运用视觉、听觉等多种模态,生动传达文化内涵和情感,在跨文化传播中形成了独特的媒介优势。
韩国教育动画品牌Little Fox作为这一进程的典型案例,于2019年依托其全球最大的线上英语动画资源库,通过跨国播放平台推出英文版《西游记》动画系列,全球播放量已逾千万次。截至2025年8月5日,在中国知网对“多模态;动画;话语分析”进行检索,共找到235条结果,其中仅有46篇学术期刊文献,主要集中在字幕翻译、角色形象分析、跨文化传播等。总体上看,此前研究多关注字幕翻译和文化符号的传递,但对动画如何通过动态模态间协同在海外儿童群体中实现文化传播的系统研究仍较少。因此,本研究拟结合张德禄的多模态话语分析框架[2],探究动画片《西游记》是如何整体把握文化、语境、内容和表达四个层面,协同语言、视觉、听觉等模态以指导字幕翻译,旨在优化中国文化传播的方式,更适应海外儿童受众的认知特点,降低其体会中国文化的潜在难度。
2. 多模态话语分析
多模态话语研究的理论框架可追溯至Jakobson提出的“符际翻译”,主张跨符号系统的转换亦属翻译行为[3]。Halliday基于系统功能语言学,提出语言的概念、人际、语篇三大元功能,从社会符号学视角揭示了语言的意义建构机制[4]。Kress与van Leeuwen在其基础上将三大元功能扩展至视觉符号领域,构建“视觉语法”体系[5],系统解析图像、色彩等非语言模态的表意规则。此后,翻译研究逐步突破语言文本的局限,数字时代的“媒介转向”[6]与“后翻译”理论[7]重构翻译范畴,主张文学向戏剧、影视等模态的转化均属翻译行为,由此推动翻译研究从语言文本向多模态协同表意的系统性转型。国内学者虽然对多模态话语研究起步较晚,不过后面也及时关注到媒介发展对翻译的影响。李战子[8]最早将多模态话语研究引介到国内,胡壮麟、朱永生、张德禄等学者从系统功能语言学等视角切入,对多模态话语分析的理论基础、研究方法、应用领域等进行了研究。
张德禄于2009年发表论文《多模态话语分析综合理论框架探索》,梳理了国内外多模态话语分析研究现状。他以系统功能语言学为理论依托,构建文化、语境、意义、形式和媒体五个层面的理论框架;随后结合Lim多模态整合框架,指出语言和图画作为交际模态,共包含意识形态、体裁、语域和话语意义四个层面,最终构建了文化、语境、内容和表达四个层面多模态话语分析综合理论框架(见图1)。
Figure 1. Multimodal discourse analysis framework
图1. 多模态话语分析框架
该框架中的四个层面并非相互独立,而是各有侧重又相互关联,协同对同一多模态语篇框架进行描述。图1是从四个层面的相互关系出发,对多模态语篇框架的展示。文化层面是多模态交际得以实现的关键,可以说,它决定了其他三个层面以及整个多模态话语能否顺利展开。以动画版《西游记》第24集为例,当虎精抓回唐僧,“I found the Tang Monk!”, cried the tiger. 此处黄风怪又惊又喜,“I have heard that anyone who eats the Tang Monk will live forever”,就创设了特定的情景语境:在幽暗洞穴中,妖怪们围炉密谋,塑造了妖之间密谈的神秘氛围,传达出黄风怪作为掠夺者与唐僧作为圣僧的身份关系。当角色瞳孔收缩的视觉模态、气息不稳的听觉模态与字幕的语言模态协同时,看似突兀的又惊又喜情绪便通过多模态互文获得了合理性。若剥离“长生肉”文化层面,妖怪的夸张表情将沦为滑稽表演,声音的戏剧化处理也会失去情感支点,多模态系统将因缺少文化性而丧失叙事说服力。以上也可看出,若无文化层面,情景语境就没有解释能力。情景语境的三个方面制约了内容层面的三种话语意义,而话语意义又通过语言、视觉和听觉模态实现。最后所有的模态都要落实到语言和非语言的媒体形式当中。
冯德正、Kay O’Halloran [9]认为该框架“对多模态教材和课堂教学分析在理论和研究方法上也更加系统深入。”潘艳艳、李战子[10]认为“对推动国内的多模态话语分析的研究起到了宏观指导的作用。”袁小陆、乃瑞华[11]则认为对于构建“文化中国”国际传播多模态分析框架有重要意义。近年来,该理论已广泛应用于小说绘本、影视改编、副文本等跨媒介翻译实践[12],揭示图文、声画等模态的互文机制。
3. 多模态话语分析《西游记》动画片
在动画《西游记》研究领域,近年来诸多学者从不同视角展开了一系列探索。金暻泰、高在锡[13]用文化价值理论对中日韩动画《西游记》进行比较研究;吴静等人[14]基于文化符号理论,探究动画《西游记》的传播形象以及在现代传播技术发展下大圣形象的多元化;张仁倩[15]借助跨媒介改编理论,论述动画《西游记》的跨媒介改编对原著的影响;白茜茜、王佳菲[16]对比分析Little Fox版和央视版动画《西游记》中人物形象差异。但是,上述论文仅探究了动画《西游记》在某一特定视角或单一模态下的表现,尚未从文化、语境、内容及表达层面,深入探究多模态之间的协同作用,以及其对动画片字幕翻译的指导意义。因此,为了突破单一模态分析与文化传播的静态讨论,本研究基于多模态话语分析框架,通过“跨模态等效”原则揭示视觉、听觉、语言符号的动态协同机制,以期体现动画片儿童教育功能,同时促进中国文化传播。
为克服“便利取样”的偶然性局限,提升研究结论的信度与效度,本研究样本选取严格遵循“目的性抽样”原则。笔者具体依据以下四个标准,从Little Fox版《西游记》动画全108集中筛选出较具分析价值的典型片段:其一,优先选取蕴含深厚中国文化内涵、可能对海外儿童观众构成认知障碍的关键文化点;其二,凸显模态间协同,聚焦视觉、听觉、语言三种模态互动频繁、协同叙事突出的高潮情节或冲突场景;其三,涵盖能典型反映权力关系、身份建构与跨文化交际策略的对话场景;其四,体现一定的跨文化适配性,关注译文在处理文化专有项时采取明显归化或异化策略的片段,以对比其传播效果。
基于上述标准,本研究最终选定第8集(A Job in Heaven)、第11集(Trouble in Heaven)、第12集(The Bet)、第13集(The True Scriptures)、第24集(The Tiger Spirit)、第27集(The Ginseng Fruit)及第32集(Lady Whitebone)等作为核心分析样本。这些片段贯穿故事主线,覆盖主要人物,能有效支撑从文化、语境、内容、表达四个层面进行系统性的多模态话语分析。
(一) 文化层面
多模态话语分析基于系统功能语言学的框架,将文化语境视为多模态符号资源(如图像、声音、动作等)意义生成的基础。可以说,不同符号资源所产生的意义受制于文化惯例。文化语境还包括意识形态和体裁两个核心要素。意识形态是指文化含有的价值观和认知,通过符号互动进行无意识的传递,强化特定文化群体深层价值观或认知,在动画中常以不明显的方式呈现。例如动画Journey to the West第32集“Lady Whitebone”(三打白骨精)中,孙悟空识破白骨精伪装的村妇并将其打跑,唐僧却发出斥责,闭目合掌默念紧箍咒。唐僧庄严默念与悟空痛苦扭曲的动作形成师徒关系对比,将唐僧代表的佛教“不杀生”文化表现出来,同时也为儿童观众理解佛教戒律规则提供了直观视觉与叙事的基础。而体裁则涉及文化规约下的表达形式与接受习惯,影响意义的接受。原声英文动画片Journey to the West主要结合英语国家文化语境和儿童文学体裁进行改编,因此要体现英语语言相应的表达形式,兼顾儿童接受习惯。例如唐僧对孙悟空警告:“If you do, I’ll recite the spell until your head explodes.”此处英文台词使用条件句与夸张表达“head explode”,实则是将中文原版含蓄的“你若再犯,休怪为师”转化为海外儿童最熟悉的因果逻辑性威胁的表达习惯,这种处理方式旨在适配海外儿童观众的表达。
张德禄认为“建构多模态话语主要用以在社会交际中取得最佳效果、达到交际目的。”[17]这样,衡量多模态话语的质量不是以正确与否为标准,而在于它在多大程度上有效地实现交际目标。因此,许多包含典型中国传统文化内涵的表达在翻译时应符合国外儿童观众的认知[18],要根据文化层面来进行合理翻译。下面以Little Fox (LF)推出的西游记《动画片》中几个特色词语和余国藩(余译)于1977年在芝加哥大学出版社出版的《西游记》全译本中的翻译作对比(见表1)。
Table 1. Translation comparison: Little Fox (LF) Version vs. Yu’s Version
表1. LF版和余译版翻译对比
|
LF版 |
余译版 |
蟠桃会 |
Peach Festival |
Peach Banquets |
王母娘娘 |
the Queen of Heaven |
the Queen Mother |
大闹天宫 |
Trouble in Heaven |
make great havoc in the palaces of Heaven |
LF版“Peach Festival”直接点名“蟠桃会”是一年一度的节日、盛会,而余译版“Peach Banquets”则着重于宴会形式。相比之下,少了节日全民参与、欢快庆祝的氛围,在动画片快速呈现时,余译版可能难以快速让海外儿童观众理解“蟠桃会”的文化内涵。LF版将“王母娘娘”译为“the Queen of Heaven”,直接点明角色地位,符合海外儿童对神话人物的想象。余译本采取异化翻译策略,将其译为“the Queen Mother”,保留了“王母”的字面概念,同时大写首字母暗示专有名词的特殊性,在神话场景中也可联想到神仙,而非简单的皇室成员。不过,在动画多模态体裁下,儿童难以在短时间快速理解人物身份,这样就会导致角色形象联想混乱。此处的“大闹天宫”为动画片第11集片名,LF版“Trouble in Heaven”仅用三个单词,简短有力。余译版“made great havoc in the palaces of heaven”采取直译的翻译方法,也完整解释了大闹天宫的意思,不过结构稍显复杂。从主流儿童英语教育标准来看,“trouble”被美国《Dolch基础词汇表》列为三年级(约8岁)高频词,语义具体、常用度较高,符合低龄儿童的认知水平;剑桥少儿英语(YLE)《Flyers》教材也广泛采用该词描述日常小困境。相比之下,“havoc”未被纳入此类低龄常用词表,语义相对抽象、使用频率低,超出海外低龄儿童的典型词汇范围,因此“trouble”更为适用,符合低龄儿童观众的心理承受力。
(二) 语境层面
张德禄认为“在具体的语境中,交际要受到语境因素的制约,包括话语范围、话语基调、话语方式所决定的语境因素。”[2]张德禄强调所有符号系统都与语言符号存在深层关联,而情景语境作为文化语境在具体交际事件中的具象化呈现,对多模态符号的解读至关重要。Kress与van Leeuwen的视觉语法理论表示,图像等非语言符号的意义必须通过情景语境才能得以有效说明[5]。以动画片为例,这种多模态体裁通过图像、文字、声音等符号构建多种意义空间,若各模态之间未能形成协同配合,可能就会使儿童观众难以理解。这样一来,接收者要想真正理解信息发出者的意图,就要依靠具体语境中三个方面的配合。其中,话语范围指交际中的具体事件,即图像和文字发生在同一个事件中,协同表现这件事的意义;话语基调指谁和谁谈话,以及互相的角色关系;话语方式指语言在语境中的作用,即对语境的依赖性。下面笔者从语境层面对动画片《西游记》第8集“A Job in Heaven”的多模态话语进行了分析(见表2)。
在交际中,语境是制约信息传递的主要因素,我们不能完全脱离上下文来理解信息。这一集是个多模态交际场景,其话语范围是描绘玉帝将孙悟空安排到看似重要,实则边缘的职位,来实现压制监督的作用。动画片中一开始就描写天庭的森严等级,整个话语基调是正面描写玉帝作为统治者与孙悟空的权力对峙(见表3)。
Table 2. Analysis of the contextual level in multimodal discourse
表2. 多模态话语的语境层面分析
情景语境 |
话语范围 |
先展现天庭云中宫殿的环境,之后是对孙悟空的职位安排 |
话语基调 |
体现出玉帝作为统治阶层与孙悟空之间悬殊的权力关系 |
话语方式 |
仪式化口语交际 |
Table 3. Chinese and English subtitle comparison
表3. 中英文字幕对照表
|
中文字幕 |
英文字幕 |
例1 |
阎王有事求见,陛下。 |
The Judge of the Dead would like to speak with you, Your Majesty. |
例2 |
那就请孙悟空来天庭吧。 他就负责看管蟠桃园。 |
Invite Wukong to come to live in Heaven. He will be in charge of the Royal Peach Garden. |
例3 |
当悟空走进凌霄宝殿, 他并没有行礼。 |
When Wukong entered the royal court in the Cloud Palace, he didn’t bow. |
例1中,这部分内容是信使以通报的方式说出的话。此处“有事求见”翻译为“would like to speak with you”,表明即使是阎王这样超自然的存在,仍需遵守觐见玉帝的礼仪。该结构句式简单、表意清晰,符合欧洲语言共同参考框架(CEFR) A1级能力的核心礼貌句式,语言复杂度与目标受众的认知水平适配。这种语言选择体现了译者以适配儿童认知水平为目标的翻译策略,试图在多模态交际中融入教育功能。若处理为“request an audience with”,儿童就难以从中获得教育和启发,也会破坏动画的话语基调,与视觉模态不符。例2中,英文部分是由玉帝以口语方式说出,“蟠桃园”译为“the Royal Peach Garden”,凸显天庭权威,增译“Royal”一温和措辞与in charge of的责任表述达成平衡,即保留上位者姿态,又契合儿童动画友好互动需求。话语方式上,采用“come to live in Heaven”的口语化表达,配合动画场景中云端宫殿的视觉呈现,符合这一动画的话语基调。例3中,是孙悟空授职后半部分内容,此处英文字幕也充分考虑了当时的语境问题。天庭中,玉帝地位尊崇,行礼是臣子的重要礼仪。此处英文字幕将中文的“行礼”直接译为具体动作“bow”(鞠躬),也和画面中其他人的行礼动作相符。若译为较为复杂的词汇“perform a courtesy”,国外儿童也难以立刻理解在中国传统文化背景下所特有的礼仪行为。
(三) 内容层面
内容层面分为话语意义和话语形式两个方面。话语意义又分为语篇意义、交际意义和概念意义,而话语形式是实现话语意义的不同形式系统。Kress & Leeuwen指出,在社会文化环境下,同样的意义可以用不同符号模式来表达[5],因此研究的重点就在于多种话语模式在社会实践中共同所产生的“合力”。我们要注意到,在动画片这种多模态语篇文本中,话语不是以单一模式参与,而是集多种符号资源于一体,共同在交流中发挥作用。下面以动画片《西游记》中第12集“The Bet”的对话为例,彰显出多模态表达的独特作用与儿童教育价值。
英文字幕:“Grr!” Wukong grunted, and pushed with all his strength.
The mountain started to rise.
Buddha pulled a small sheet of magic paper from his sleeve.
He laid the paper on top of the mountain.
The mountain dropped back down.
中文字幕:“啊!”悟空叫了一声,用尽所有力量挣扎。
压在他身上的那座山被抬起了一点。
如来从他的衣袖中拿出了一张符咒,
贴在了山顶上。
那山又被压了回去。
在这段动画中,画面、声音和文字共同传递了故事的不同意义。概念意义通过字幕直接说明:中英文的“用尽力量抬山”和“符咒压山”形成对比,点明孙悟空与如来的力量对抗。交际意义由视觉和听觉配合完成:画面里悟空咬牙挣扎、如来轻松贴符的动作对比,加上“嘎吱”的用力声和“嗡”的符咒生效音效,通过这种多模态的强烈对比,清晰传达了“孙悟空不敌如来”的叙事信息,凸显出力量差距。语篇意义贯穿于多模态的叙事节奏中:山体摇晃声由强变弱、镜头从悟空切到如来的画面变化,暗示冲突结束和后续结束镇压,与唐僧一道“取真经”故事的开始。
由此可见,运用语言、视觉、听觉这三种模态可以传达出多模态交际中内容层面的三种话语意义。我们还必须注意,动画片是多模态的呈现方式,在传达时要高度契合儿童的认知特点与接受能力。这种多模态呈现方式意在创造一个低认知负荷、高吸引力的观看环境,为传播中国传统文化提供潜在可能。又如下面《西游记》第27集(The Ginseng Fruit“人参果”)中短对话所示:
英文字幕:The Tang Monk screamed.
On the tray lay a tiny sleeping baby.
“It’s not a baby,” said one priest. “It’s a ginseng fruit.”
“Please take it away!” cried the Tang Monk.
中文字幕:唐僧尖叫起来。
那盘子上躺着一个睡着的小婴儿。
“这不是婴儿。”一个道士说,“这是人参果。”
“请把它拿开!”唐僧大叫。
概念意义通过语言模态直接呈现。动画字幕描述了“盘子上躺着熟睡婴儿”这一核心画面,奠定人参果具象化的基础。交际意义则通过视觉与听觉模态传递,体现为唐僧紧皱的眉头、急促摇头的动作配合阴沉的背景音乐,既暗示人参果婴儿形态打破人们对常规水果认知,又强化了他坚守佛家戒律、“不杀生”的价值观。视觉上,动画片中设计的Q版婴儿果实既符合儿童审美又制造出“为何水果像人?”的悬念。而这时骤然变换的诡谲音效也进一步增强了神秘紧张的氛围,与后面孙悟空闯祸毁坏人参果的情节相呼应。综上所述,在此处的动画片段中,三种模态协同传达了多模态交际中内容层面的三种话语意义。
(四) 表达层面
多模态话语分析的表达层面包括语言媒体和非语言媒体。动画片作为典型的多模态语篇,可以看作一种交际手段,借助多种表达方式来构建意义、进行交际。媒体本身只是意义的载体,需通过形式层面的组织才能直接表达具体含义。不同模态的媒介既各具独特性又相互关联,其中语言模态依赖词汇与语法规则;视觉模态通过图像构图等来传递信息层级与视觉焦点;听觉模态则借助音调、节奏强化情感氛围。例如,口语中的音高突显可反映为图像亮度的对比,音调变化对应画面色调的过渡,而视觉构图的阅读路径(如从左到右的观看顺序)则会影响观众的信息接收。
下面以《西游记》动画片第13集“The True Scriptures”中观音和唐僧的短对话为例。在非语言媒体的表达上,主要包含视觉模态和听觉模态两类。在表达层面,表4选取了视觉、听觉和语言三个模态,对动画片短对话的语篇进行分析(见表4)。
Table 4. Analysis of the expression level in multimodal discourse
表4. 多模态话语的表达层面分析
语言模态 |
视觉模态 |
听觉模态 |
“Wide rivers and steep mountains will block your path. |
画面1 |
身着中国传统服饰的观音伸出一只手,背景出现高山、河流和阴沉暗淡的天空 |
背景音乐1 |
神秘且紧张的节奏,渲染情境的危险 |
Fierce creatures and evil demons will try to attack you. |
画面2 |
观音面露忧虑,身后出现表情凶狠、戴着骷髅头的一群妖怪 |
背景音乐2 |
切换下个画面的电子闪烁音,音调低沉阴森 |
But don’t fear—you will have help from me. |
画面3 |
画面恢复原状。观音微笑,双手合十,身后出现金色“背光”。 |
背景音乐3 |
音调上扬,“背光”出现时“唰——”的音效以及庄严的背景音 |
如图2所示,视觉模态上,观音说话之时,其形象始终处于画面前方,面部表情与话语内容相呼应,身上的中国传统服饰无声、直观地展示着中国传统文化。当展示妖怪时,众多妖怪形象挤满画面,直观地营造出危机四伏的氛围,让儿童观众能真切感受到危险(见图2(a))。描绘艰难地形时,仅露出一小部分陡峭山路,通过局部暗示整体的艰险,这种“画面留白”可以充分激发儿童的想象力(见图2(b))。场景切换从暗紫色调的山川到金黄色调的宫殿,鲜明的色彩对比不仅展现出不同环境的特点(见图2(c)),还暗示了情节的发展,有助于增强观众参与感。听觉模态与画面紧密配合。从音谱图可以看出(见图3),画面呈现妖怪或讲述困难时,音频的音高和强度波动较大,有力地增强了紧张氛围(见图3(a),图3(b));而观音安慰唐僧时,音乐从紧张转为舒缓,音频趋于平稳(见图3(c)),使人安心,同时也暗示了“西天取经”之路虽充满艰难,但终有希望的大体过程。语言模态上,“Wide rivers and steep mountains will block your path.”“Fierce creatures and evil demons will try to attack you.”这两句直接点明困难,到“But don’t fear—you will have help from me.”则给出希望。此处三种模态相互配合,共同构建了一个融合视觉、听觉与语言模态的多义性文本,据Little Fox官方YouTube频道数据显示,自2018年11月27日发布起,该集动画已获逾50万次播放。这一数据间接表明,多模态协同叙事具有显著的吸引力,有助于创造一个让海外儿童观众更易于接受和感受中国传统文化的低认知平台。
(a) (b) (c)
Figure 2. Screenshots from the animation
图2. 动画中的画面截图
(a) (b) (c)
Figure 3. Sound spectrum fluctuation graph of background music
图3. 背景音乐–音谱波动图
4. 结语
动画片以视觉模态为主、文字模态和声音模态为辅,在跨文化传播和英语语言教育中表现出重要的意义。研究发现,以佛教文化和神话文化为精神内核,通过不同的视觉模态突出不同内容,以不同声音模态烘托动画不同阶段内容,以文字模态传递情感、判断,语言与非语言符号相互融合,是动画片在对外传播中为追求效果最大化的重要策略。其中,多模态话语分析理论框架兼顾文化、语境、内容、表达四个层面,融合各个模态,以儿童受众的文化为导向,以情景语境为基础,将听觉模态和视觉模态的内容与表达层面相结合,给出了恰当的翻译策略和叙述方式。同时,研究发现,充分利用文字、声音、画面等多种模态的有机结合,可以从文化、语境、内容、表达四个层面增强动画片的表现力和逻辑性,从而为引发观众共鸣、优化对外传播效果创造了条件。
《西游记》动画片作为中国经典文本改编的“返销式”作品,其成功经验为未来中国文化国际传播提供了重要启示。在国际传播中,中国不仅需要将文化产品推向世界,更要利用自身文化优势吸引其他国家主动参与中国文化的传播,从而在国际舞台上更好地传递中国声音。通过多模态手段的协同作用,动画片字幕翻译可以在保留文化内核的同时,降低跨文化受众的认知门槛,以期同时服务于语言学习与文化传播的双重目标。这种模式不仅适用于动画片的字幕翻译,还可以拓展到其他文化产品上,为中国文化在国际上的广泛传播提供新的思路和方法。