1. 引言
党的二十大报告明确指出,讲好中国故事、传播好中国声音,展现可信、可爱、可敬的中国形象,提升国际传播效能,是新时代文化对外传播工作的核心要求和重要方向。在这一背景下,外宣短视频以其时长短、传播快、受众广的特点,成为塑造国家与地方文化形象的重要载体。其中,《我来自江西》系列短视频精准聚焦江西省非物质文化遗产,包括赣剧、樟树中药炮制技艺、景德镇手工制瓷技艺,通过人格化的叙事方式、宏微结合的镜头语言与精心设计的双语字幕,构建了兼具历史厚重感与时代鲜活感的江西文化形象,是地域文化对外传播的一个典型研究案例。
在文化强国战略深入推进的背景下,“讲好地方故事”已成为完善中国文化对外传播体系的重要任务。通过具象化呈现地方非遗、民俗等文化符号,既能填补国际社会对中国地域文化的认知空白,又能以微观叙事丰富国家文化形象的内涵,为中华文化对外传播注入多元活力。在视听媒介中,字幕翻译作为连接语言模态与非语言模态(如图像、声音)的关键环节,其质量直接影响文化意义的跨文化传递效果。尤其是《我来自江西》中“赣剧”、“中药炮制”等富含地域文化特质的负载词,在语言转换中易出现文化信息损耗。尽管多模态话语分析在翻译研究中逐渐受到重视,但现有成果仍多集中于影视、广告等通用体裁,对系统性展示地方非物质文化遗产的短视频关注不足,更缺乏针对其“语言、视觉、听觉”三模态协同机制的系统探讨。基于此,本研究以多模态话语分析为理论框架,以《我来自江西》系列短视频为研究案例,探究其字幕翻译通过与视觉模态(镜头画面)、听觉模态(配乐、唱腔)的协同配合,实现地域非遗文化信息传递的路径。通过分析语言符号与非语言符号在文化意义建构中的互动关系,本研究旨在为新媒体时代中国地域文化的对外传播提供参考。
2. 多模态话语分析
法国符号学家Barthes通过探讨图像与语言的互动意义,首次提出研究多模态的必要性,引发了多模态语法的一系列研究[1]。Kress与van Leeuwen在其奠基之作《多模态话语:当代传播的模式与媒介》中,将系统功能语言学的基本原理延伸至图像、色彩、版式等非语言符号的分析,为解读视觉语法奠定了理论基础[2]。
“模态”指信息交流的渠道与媒介,包括语言、图像、声音、动作等多种符号资源;而“多模态话语”则指综合运用听觉、视觉、触觉等多种感官,借助上述多种手段进行的交际活动[3]。事实上,话语的多模态性是人类社会交往与进化过程中的固有特征。该理论在数字时代展现出强大的解释力与应用价值[4]。Jewitt指出,数字环境中的多模态传播整合了视频、音频与互动元素,使信息传递更为复杂且高效[5]。Cresswell的案例研究也证实,融合视频、图像与文字的城市宣传能有效塑造受众的深刻印象[6]。随着数字媒体的发展,国内外关于多模态话语分析的研究已从对静态文本的关注转向对动态视听文本意义传递机制的深入探讨。国际研究聚焦于影视、纪录片等领域的字幕翻译,形成了“模态互补”的核心原则。例如Baker以纪录片为研究对象,探讨文化负载词的多模态翻译策略,强调字幕需与画面、音效协同以优化传播效果[7]。国内研究则遵循了一条从引介国际理论到构建本土框架的路径,特别是张德禄提出的综合理论框架,即多模态话语是多种感官与符号资源共同参与的交际过程,并基于系统功能语言学,构建了涵盖文化、语境、意义与形式四个层面的综合理论框架,极大地推动了该理论的本土化发展与实际应用[8]。他将“文化层面”置于核心,弥补了西方理论在分析中国外宣文本时的不足。同期,胡壮麟[9]、朱永生、李战子[10]等国内学者也分别从不同维度对多模态话语分析的理论框架与研究路径进行了探索与补充,共同促进该领域在国内的繁荣。如今,多模态话语分析已被广泛应用于翻译研究等领域,特别是在涉及文化与社会意义建构的政治讽刺、广告及视听翻译中,为分析多模态语篇的意义共建与跨文化转换提供了关键的理论视角[11]。多模态话语分析在国内的应用研究虽已覆盖视听翻译领域,但从现有成果来看,语料选择呈现明显的“电影偏向性”:例如武建国、李育静以影片《我和我的祖国》为例,分析并总结字幕翻译在影视文化传播中的多模态语境重构过程与原则[12]。张文鹤、文军以航空航天影视字幕为语料,提出了航空航天影视字幕翻译四大原则[13],以期提升跨文化观众对电影剧情与文化内涵的理解。
相较于这些“热门”阵地,国内学界对正成为地域文化外宣重要载体的“地方外宣短视频”的关注则严重不足。而这与短视频在实际传播中日益增长的重要性形成了鲜明对比。正因如此,本研究将依托多模态话语分析综合框架的文化、语境、内容、表达四个层面,针对《我来自江西》系列外宣短视频的字幕翻译展开深入探究,旨在揭示字幕翻译如何在不同模态的协同作用下,有效传递短视频所承载的江西非遗文化、地方形象特质及文化情感内涵。
3. 《我来自江西》介绍及语言特点
《我来自江西》是2025全国两会期间江西新闻客户端特别策划的中英双语短视频,以第一人称拟人化视角呈现江西三大非物质文化遗产的历史底蕴与传承活力,向世界传递江西非遗魅力。其中,赣剧讲述自身数百年历史,提及声腔融合特点与戏服色彩象征,展现从传统场景到当代受年轻人喜爱的传承变化;樟树中药炮制技艺介绍核心技艺环节与“制虽繁,不惜工”的理念,回顾历史地位并说明当下在“药都”的坚守创新;景德镇手工制瓷技艺追溯起源与发展历程,强调工艺繁复性及代表性品类,体现其从工艺到文化符号的价值与古今传承。三者共同构建起江西非遗“技艺精湛、历史悠久、传承有序”的形象。
3.1. 拟人化叙事
该视频字幕语言贴合短视频传播属性与非遗主题,首先采用非遗项目“自我言说”的拟人化表达,突破传统客观叙事,让非遗从静态技艺变为动态生命体,更具亲和力与感染力,适配短视频轻量化传播需求。例如,赣剧单元,以“活了几百年,依然精神矍铄”以及“衣柜里挂满了五彩斑斓的戏服”等表述赋予其人格化特征,并结合央视春节戏曲晚会亮相的现代场景,构建古今对话的叙事语境,拉近与受众的心理距离。
3.2. 蕴含丰富的文化负载词
非物质文化遗产是国家与民族历史文化成就的重要见证,其魅力在相关视频中,常通过大量承载江西地域文化的专业术语与文化符号展现。这些元素不仅是视频双语传播的核心载体,更彰显了内容的专业性与文化深度。例如“浮梁磁局”(元代江西官方瓷业管理机构)、“弋阳腔”(江西发源的古老戏曲声腔)、“白芍飞上天”(江西特色传统民俗表演)等文化负载词,因承载深厚地域历史与独特文化内涵,给字幕翻译带来显著挑战。这类词汇的翻译,既要求译者精准把握其真实文化意涵,洞悉在江西地域文化语境中的特殊价值;还需运用合理翻译策略,在保证译文准确的同时,实现文化信息完整传递,避免受众因文化差异产生理解偏差,保障双语传播的文化桥梁作用。
4. 多模态话语分析视角下字幕翻译研究
4.1. 文化层面
文化决定了交际的传统和形式,是多模态交际中的关键层面。文化包含两个层面:一是内在的意识形态,如思维方式、生活哲学与社会规范;二是外在的实践方式,即承载该意识形态的特定交际模式与行为结构。不同地方的外宣视频往往展现出独特的地域文化和风土人情,这需要译者充分了解其中的文化内涵。在不同场景的翻译实践中,译者需要基于不同的翻译原则,采取相应的翻译策略;同时,译者也应该注重文化场景,达到字幕翻译的目的。在跨文化语境下,赣剧作为江西极具地域特色的传统艺术形式,对于国外观众而言较为陌生,若其相关外宣内容(如字幕、画面等)呈现不当,可能会影响国外观众对赣剧艺术价值与文化内涵的理解。因此,译者需要采取合适的翻译与多模态呈现策略。
例1:我是赣剧,一个“老戏骨”,活了几百年依然精神矍铄。
译文:I am Gan Opera, a time-honored virtuoso of the stage, who has lived for centuries yet remains vigorous.
分析:在中文语境中,“老戏骨”是对演艺精湛、经验丰富且兼具深厚艺术积淀的戏曲表演者的尊称,这一表述背后,实则蕴含着赣剧历史悠久的文化内涵。在对应的英文翻译中,译文并未对原文做简单的字面直译,而是围绕文化适配性展开转化,这样既贴合赣剧自身的艺术特质,也契合国外受众的艺术认知习惯。具体来看,译文将“老戏骨”译为“a time-honored virtuoso of the stage”,“time-honored”这一词精准传递出赣剧历史悠久的文化属性,“virtuoso”(即艺术大师)则着重凸显赣剧在戏曲领域的精湛水准与行业权威性,二者结合,完整还原了“老戏骨”所承载的赣剧艺术深厚底蕴与高超技艺。从受众接受与传播效果来看,对国外受众而言,“virtuoso”(艺术大师)是其熟悉的艺术领域表述,能帮助他们快速建立对赣剧艺术地位的认知。这一翻译策略通过精准转化文化词汇,成功将赣剧这一相对陌生的中国地方传统艺术形式,转化为国外受众能够理解且感兴趣的文化符号,既实现了赣剧文化内涵的有效传递,也为地域文化跨文化传播提供了有益的实践范例。
例2:泥土为料,烈火塑型
译文:Earth my canvas, fire my brush.
分析:例2中的这八字是景德镇手工制瓷技艺的精髓,它客观描述了制瓷的基础原料与关键工序,同时,字里行间还凝聚着匠人对泥土材质的敬畏之心与对火温把控的极致追求,最终让普通黏土蜕变为承载千年东方美学的瓷之珍品。在翻译处理上,若采用直译方式,译为“Taking earth as material, shaping with fire”,虽能传递字面信息,却难以承载其中的哲学意蕴。译者创造性地选用“Earth my canvas, fire my brush”这一译法,将制瓷过程类比为绘画艺术。如此处理,一方面通过“画布”和“画笔”这些西方受众熟悉的艺术概念,构建起直观的认知桥梁,使他们能够迅速理解制瓷的本质是一种艺术创作;另一方面,中文原文采用了一个经典的八字对偶结构,前后两个分句在音节、语法上工整对应,富有节奏感和诗意。译文同样采用了两个并列的名词短语,在英语语境中还原原文的语言风格。除此之外,在观看短视频时,观众扫视字幕的时间极短。该译文所用词汇均为基础、具象的英语单词,构成的隐喻(将制瓷比作绘画)也是跨文化、直觉性的。这使得目标观众能在一秒之内理解其核心比喻,实现了信息传递的高效性。
4.2. 内容层面
内容层面包括意义层面和形式层面。其中意义层面即为话语意义,该内容包括:概念意义、人际意义、谋篇意义。概念意义即人类对在真实世界中所认知的经验片段与逻辑关系概念的阐述;人际意义即在交际过程中的言语功能和对说话人的态度、判断等;谋篇意义即语言通过自身机制将词句组成连贯的语篇,对概念与人际意义进行阐述[14]。对外宣传片综合运用语言(字幕、旁白)与非语言(画面、音乐)元素传递信息与情感。译者的核心任务,是确保语言转换的准确与客观,从而有效达成跨文化的信息沟通与情感共鸣。
例3:我可以是古朴淡雅的青花瓷,也可以是灵巧透亮的玲珑瓷,或是异彩纷呈的颜色釉瓷,乃至妙笔生花的粉彩瓷。
译文:They include the simple yet elegant blue-and-white porcelain, the delicate and translucent rice-pattern decorated porcelain, the colorful vitreous enamel and even the exquisitely painted famille rose porcelain.
分析:例3展现了译者如何处理中文里特有的文化概念。面对“玲珑瓷”这一在英语中没有对应词汇的器物,译者没有执着于字面意思,而是捕捉其核心工艺特征,译为“rice-pattern decorated porcelain”(米粒纹装饰瓷)。这个译法既形象地描绘了其镂空工艺形成的视觉形态,也让不熟悉中国陶瓷的读者能够立即建立起一个大致准确的印象。同样,对于“粉彩瓷”和“颜色釉瓷”这类专业术语,译者分别采用了国际收藏界通用的法语词“famille rose”和“vitreous enamel”(玻璃质瓷釉),确保了译文的专业性和在目标文化语境中的认可度。整体来看,译者并未追求字字对应的机械翻译,而是致力于在英文中“重建”这些瓷器的核心身份。其策略可以概括为:对具有普遍认知的“青花瓷”使用通用译名;对独特工艺的“玲珑瓷”进行创造性解释;对专业品类则沿用国际公认的术语。
在字幕翻译中,译者要从跨文化视角出发,体现内容层面的话语意义,既要保证翻译质量、传达源语内涵,同时要考虑技术限制,确保字幕翻译的有效性。语言要素与非语言要素多维互补、相互呼应,构成完整的话语意义[15]。
从语言层面出发,译文准确捕捉了每类瓷器的核心审美特质。每个对应译法都确保了源语文化概念的完整传递。从人际意义看,译者充分考虑目标受众的文化认知水平,对专业概念进行适度转换。将工艺独特的“玲珑瓷”译为“rice-pattern porcelain”,通过米粒意象建立直观联想。这种译法既保持了文化特色,又避免了理解障碍,在介绍中国文化的同时建立起与受众的信任关系。从谋篇意义看,译文通过递进结构,完整再现了原文的枚举逻辑。这种编排既保持了对瓷器种类的完整介绍,又通过层层递进营造出认知上的期待感,使四种瓷器的呈现具有内在节奏,增强了文本的引导性与感染力。该译文通过三个意义的有机配合,既确保了文化信息的准确传达,又实现了与目标受众的有效沟通,最终形成具有说服力的外宣话语。
4.3. 语境层面
在具体的语境中,交际要受到语境因素的制约,包括话语范围、话语基调、话语方式所决定的语境因素。话语范围指的是语篇所运用的情境与语境;话语基调指的是活动参与者之间的角色关系和交际意图;话语方式指的是交际中所运用的媒介或渠道[16]。语境决定文本的意义与解读。脱离语境的翻译无法准确传递内容和情感,必然导致交际失效。因此,译者必须依托由多模态元素构建的整体语言环境,才能确保字幕翻译的交际有效性。
例4:我的声音是不是很特别,融合了弋阳腔的高亢与昆曲的悠扬,以及弹腔的活泼。
译文:Isn’t my voice very unique? It fuses the loudness of Yiyang Tune, the melodiousness of Kun Opera, and the liveliness of Tanqiang Tune.
分析:原文核心是介绍赣剧声音的独特性,即融合了弋阳腔、昆曲、弹腔各自的艺术特点。译者采用直译为主的方式,将“高亢”译为“loudness”、“悠扬”译为“melodiousness”、“活泼”译为“liveliness”,精准传递了赣剧声音融合多种戏曲腔调特色这一核心概念意义,同时保持了翻译的简洁性,符合内容层面“让目标语观众容易理解”的要求。原文以“我的声音是不是很特别”这种带有询问、自豪的语气展开,体现出赣剧希望与受众交流,展示自身艺术魅力的交际意图。译文“Isn’t my voice very unique?”采用反问句形式,延续了原文的语气,很好地传递出赣剧的自豪与期待受众认可的交际意义,有助于目标语观众感受赣剧的情感态度。此内容处于赣剧介绍自身艺术特色的语篇环节,起到了承上启下,进一步深入阐述赣剧艺术魅力的作用。简洁明了的翻译,让目标语观众能快速抓住赣剧声音特色这一要点,保证了语篇意义的连贯性,使整个介绍赣剧的语篇流畅自然。
例5:我出生于唐朝中晚期。有一位长我几百岁的“冶陶”哥哥。他粗犷实在,我细腻俊秀。相比哥哥,我更受帝王贵族的青睐。
译文:I was born in the mid-late Tang Dynasty. Compared with my brother, I am more favored by the imperial and noble families.
分析:将“冶陶”称为景德镇瓷器的“哥哥”,这一拟人化表达源于中国陶瓷的技术发展史。从历史演进来看,陶器制作早于瓷器:中国新石器时代已普遍制作陶器,而瓷器直至商周时期才出现原始形态,景德镇成熟的制瓷工艺更要到唐代才成型。因此,冶陶为兄的比喻,形象地确立了陶器作为瓷器前身与先驱的历史地位。二者虽同源,却在材质与美学上各具特色。陶器胎质疏松,风格质朴豪放,体现为粗犷实在;而瓷器选用优质瓷土,经高温淬炼后质地致密莹润,展现出细腻俊秀的特质。这一兄弟比喻,巧妙地将漫长的技术演进史转化为亲切的亲缘叙事,充分体现了中国传统工艺表述的独特智慧。然而,在面向国际受众的外宣短视频中,若将此类文化负载过重的表达直译,易因文化认知差异引发理解障碍,甚至削弱内容的严肃性与传播有效性。译者采取战略性省译,仅保留“Compared with my brother”这一核心比较结构,是充分考虑短视频媒介特性后的理性选择。外宣短视频是语言、视觉、听觉模态深度融合的产物。字幕(语言模态)不能孤立运作,必须与其他模态协同表意。原文中“粗犷实在”与“细腻俊秀”这类具象的、感官化的属性,恰恰是视觉模态最擅长传递的信息。当画面并置展示古朴的陶器和光洁的瓷器时,两者的质感差异一目了然。在这种情况下,省译是最优选择。它避免了语言信息对视觉信息的冗余性重复,实现了模态间的高效互补。文字负责构建逻辑框架,画面负责提供感官证据。这种分工符合多模态传播的原则,使整体信息传递更高效、更符合观众的认知习惯。
4.4. 表达层面
表达层面的媒体系统涵盖语言媒体与非语言媒体,非语言媒体又细分为视觉模态和听觉模态[17]。从传统的语言学研究角度出发,实现意义传播的媒体形式主要有两种:声波传导的声音符号和由笔等生成的书写符号。在《我来自江西》中,意义的构建依赖于多种模态的协同配合。双语字幕与旁白提供核心信息,而图像与配乐则强化情感与氛围。这些语言与非语言要素深度融合,共同构建出一个充满江西地方文化特色的完整语篇,有效引导观众理解与感受。
例6:听,我的声音是不是很特别?
译文:Listen, isn’t my voice unique?
语言要素中,译文在策略与语气上高度贴合原文。采用直译思路并保留反问结构,精准传递了原句的互动属性。若仅通过单模态语言要素,叙事方式单一,直译译本将会单薄无力,无法呈现出语言背后深层次的文化背景以及文本内容与情感,难以达成交际的目的。表达层面要注重多层次转换,语言要素与图觉、声觉相连,补充语言内容。
在图觉方面,呈现了央视《2025春节戏曲晚会》的赣剧表演场景与手机端“江西新闻”的赣剧演出画面。前者以传统中式舞台、演员华丽戏服(色彩鲜艳的戏服、精致头饰)等视觉符号,具象化赣剧的表演形态与传统艺术场景;后者通过手机屏幕展示赣剧演出照片,拓展了赣剧的“新媒体传播场景”,暗示其在当代的传承活力。
在声觉方面,背景音选取赣剧原生唱腔,其声腔融合弋阳腔的高亢清亮、昆曲的婉转悠扬与弹腔的活泼灵动,形成独特的听觉标识。从传播逻辑来看,这一声觉设计并非单纯的背景音乐,而是为后续语言要素做前置铺垫:一方面,通过真实的唱腔原声,让受众先从听觉维度直观感知赣剧的声腔特色,初步建立赣剧声音有别于其他戏曲的认知;另一方面,唱腔中蕴含的韵律感与情感张力,能烘托传统戏曲的文化氛围,激发受众对“声音为何特别”的好奇心,为后续字幕的互动式提问埋下伏笔,避免语言要素单独出现时的突兀感。
视觉模态让赣剧的“表演形态、文化符号”从抽象变为具象,帮助受众“看见”非遗;听觉模态补充“声腔韵味、情感氛围”,让受众“听见”非遗。两者与文字翻译协同,构建起视、听、读多感官接收通道,使赣剧不再是平面的文字描述,而是立体的艺术体验。
5. 结语
由张德禄提出的多模态话语分析综合框架,为短视频字幕翻译研究提供了坚实的理论支撑。本研究基于此框架,从文化、语境、内容与表达四个层面,对江西非遗系列短视频中典型案例的字幕翻译进行了深入探讨。研究表明,非遗外宣字幕翻译的有效性远超纯文字转换,它高度依赖于画面、声音等非语言模态的协同。在《我来自江西》中,这种多模态结合使非遗项目得以立体呈现,有助于激发国际观众的兴趣,并有效传递了其核心技艺、历史底蕴与文化美感。然而,本研究主要聚焦于江西非遗短视频的字幕翻译,研究对象与案例范围仍有一定局限。未来研究可从两方面拓展:一是扩大研究范围,纳入民俗节庆、传统舞蹈等其他非遗类别,或对比不同地域非遗短视频的翻译策略;二是结合技术发展趋势,探索人工智能在地域非遗外宣字幕翻译中的应用方向,在提升效率的同时,保障文化信息传递的准确性与表现力,是值得进一步探讨的方向。