1. 引言
党的二十大报告指出,要“增强中华文明传播力影响力。坚守中华文化立场,提炼展示中华文明的精神标识和文化精髓,加快构建中国话语和中国叙事体系,讲好中国故事、传播好中国声音,展现可信、可爱、可敬的中国形象”[1]。中宣部对外推广局的外宣纪录片《万象中国》正是一部由中国互联网新闻中心精心打造、旨在面向国内外受众,讲述中国文化的短视频节目,它巧妙地从中华文化资源库中取材,结合时代特点,通过丰富的多模态手法进行当代表达,以此展现中华文明的精神象征与文化内核。
随着多媒体和计算机技术的蓬勃发展,信息传播方式日益多元化,人们越来越倾向于借助图片、视频、音频等多模态形式来获取与理解信息。多模态话语分析的研究内容、方法和理论基础也随之得到显著发展[2]。《万象中国》作为一档短视频影视节目,充分利用了这些多模态传播手段,不仅适应了当代广大受众希望通过直观、生动的形式了解和感受文化的新需求[3],还通过精美的画面、生动的解说和丰富的音效,满足了观众对于文化传播的期待。
本研究拟借助人际意义、互动意义、以及张德禄提出的多模态话语关系理论,深入剖析《万象中国》节目中,语言模态和图像模态意义的构建,并探讨模态之间的相互关系。通过这一分析,旨在揭示该纪录片吸引观众、引发情感共鸣及增强文化理解的内在机制。此外,通过采用定性和定量相结合的研究方法,可以丰富多模态话语分析理论,以进一步为中华文化有效传播提供理论支持,此外研究将深化对影视语言的理解,推动文化类节目制作模式的创新和发展。
2. 文献综述
2000年,“多模态话语”(Multimodal Discourse)首次作为学术术语,出现在Van Leeuwen和Jewitt [4]合著的专著“Handbook of Visual Analysis”中。张德禄[5]提出,多模态话语指的是包括文字在内的多种模态,如图像、声音、动作等,整合构成了多模态符号资源,并生成意义,达到有效交际目的。此外,多模态话语分析(Multimodal Discourse Analysis)指在进行话语分析时,需把人类使用的非语言符号纳入意义交流过程,这些符号包括图像、动作、眼神、姿态等等,同时关注语言符号与非语言符号之间的相互关系[6]。
基于李梦洁,冯德正和邓谊[7]高频术语的分布和相关性分析,过去十年,国际多模态话语分析理论发展可归纳为两个主要方面:(1) 社会符号学理论的新发展[8]:(2) 学科内和跨学科的理论融合[9]。潘艳艳和李战子[10]提出国内多模态话语分析主要有四个研究方向:(1) 以系统功能语言学和社会符号学为理论基础的多模态话语分析;(2) 多模态隐喻分析;(3) 多模态语料库分析;(4) 多模态互动分析。另外,多模态话语分析的研究对象集中在印刷文本、数字媒体、身体语言与教学模式等方面。总体而言,数字技术赋能的多模态话语分析理论与方法进一步融合创新,研究领域逐步由系统功能语言学的一个分支发展成为多学科[7]。但相比于传统的静态体裁的多模态话语研究,动态体裁的研究起步较晚,具有局限性。此外,对于国内的研究,我国学者对多模态话语的研究也取得了一些成绩,但在研究方法上需要在定性研究的基础上寻求新的突破等问题[2]。
《万象中国》这一纪录片主要从字幕翻译[11]、跨文化传播[12]、以及叙事[13]的角度进行了探讨,而并未有研究从多模态话语分析的角度来进行讨论。
3. 理论基础和研究框架
本研究的理论基础包括系统功能语法中人际意义、视觉语法中的互动意义以及张德禄的多模态话语分析框架中不同模态之间的关系理论。
3.1. 人际意义
系统功能语法是Halliday构建的语篇分析理论框架,是一种比其他理论更适合于语篇分析的理论[14]。人际意义作为三大元功能之一,是指表达讲话者的身份、地位、态度、动机和他对事物的推断、判断和评价等的功能[15]。人际意义主要包括语气和情态两个子系统。语气主要由疑问句、祈使句和陈述句构成。Halliday [16]按照“可能性”等范畴给每个情态动词赋予相应的值,这些值被归类为低、中、高三个等级。较高的值体现出说话者更果断、强硬的态度。此外,较低的值则表明一种更温和、礼貌的姿态,能让交谈对象在回应时有更多的空间和选择余地。
3.2. 互动意义
互动意义来源于Kress和van Leeuwen [17]年提出的视觉语法,旨在在表征对象与观看者之间建立起紧密的联系以及互动体验,使得信息能够有效传递,并引起情感共鸣。互动意义包括四个要素:接触、社会距离、态度和情态。
3.2.1. 接触
接触可分为两种类型,一种是“索取”,另一种是“提供”。接触可分为两种类型,“索取”和“提供”。“索取”意味着被再现的参与者与观看者有直接的眼神交流,视频中所呈现的参与者似乎在向观众索取某物或要求他们采取某项行动。“提供”则是指被再现的参与者与观看者没有直接的眼神交流,只是在客观地呈现信息。
3.2.2. 社会距离
社会距离与画面尺寸相关,其由不同的镜头类型所界定,范围涵盖从特写镜头到远景镜头[17]。特写镜头通常展现出亲密或私人距离,画面中只有主体的头部和肩部。中景镜头通常展现出社交距离,主体大约在膝盖部位被截断。此外,远景镜头通常展现出非私人或公共距离,整个人物或人像大约占据画面高度的一半。
3.2.3. 态度
态度可以通过镜头的角度来体现[17]。视角主要由两种角度构成:水平角度和垂直角度。水平角度体现观看者的参与度,可进一步分为两种类型:正面角度和斜侧角度。此外,垂直角度也可进一步分为三种类型:俯视、平视和仰视。
3.2.4. 情态
情态是指图像表征的真实或逼真程度[17]。在视觉语法中,情态主要包含三种类型:高情态、中情态和低情态。高情态指的是色彩饱和度高的画面,中情态指的是色彩饱和度低的画面,低情态指的是黑白色调的画面。
3.3. 张德禄模态关系理论
张德禄[5]基于系统功能语言学建立了一个多模态话语分析的综合框架。其中,张德禄提出模态之间的关系,包括互补关系和非互补关系。互补关系指的是单靠一种模态无法充分表达其意义,需要另一种模态协助表达的情况。非互补关系是指一种模态对另一种模态所表达的意义没有显著贡献,但仍作为一种独立模态存在的情况。
4. 研究设计
4.1. 研究问题
(1) 在纪录片《万象中国》中,语言模态如何建构人际意义?
(2) 在纪录片《万象中国》中,视觉模态如何建构互动意义?
(3) 在纪录片《万象中国》中,语言模态和视觉模态如何通过互动建构节目整体意义?
4.2. 研究对象
《万象中国》是由国务院新闻办公室对外推广局指导,由中国互联网新闻中心制作,并由艺术中国策划摄制的中英双语系列短纪录片。该作品于2019年被列为中共中央宣传部重点对外推广的影视项目之一。2022年11月至12月期间,《万象中国》在中国网、腾讯视频以及各大海外社交媒体平台同步上线,获得了广泛的好评和认可。
4.3. 研究工具
4.3.1. UAM Corpus Tool
UAM Corpus Tool是一个语料库分析软件工具,由Mick O’Donnell基于系统功能语法(Systemic Functional Grammar)创建于1998年,能够用于文本和图像的半自动标注与分析。它可以在一个系统化的环境中分析文本,并作为一个多功能的语料库工具,整合了语料库建设、检索和统计分析等功能。本研究借助UAM Corpus Tool进行语言模态数据的标注与分析。
4.3.2. Elan 6.8
ELAN (EUDICO Linguistic Annotator)是由荷兰马克斯·普朗克心理语言学研究所开发的跨平台软件,主要用于多模态话语研究。该软件可以精确到0.001秒播放视频,允许用户进行精确的时间对齐、细致的分段和标记。通过多层次标注,ELAN可以实现对语言、图像、语音和语调等元素的详细分析。本研究借助多模态音视频分析标注软件ELAN6.8进行视频数据标注和分析。
5. 结果与讨论
5.1. 人际意义的分析
5.1.1. 多模态元素在人际意义中的分布
Table 1. Frequency of mood system in China Bouquet
表1.《万象中国》中的语气系统使用频率
语气 |
陈述句 |
疑问句 |
祈使句 |
总数 |
数量 |
140 |
4 |
3 |
147 |
频率 |
95.24% |
2.72% |
2.04% |
100% |
Table 2. Frequency of modality system in China Bouquet
表2. 《万象中国》中的情态系统使用频率
情态 |
|
数量 |
频率 |
低情态 |
can |
8 |
44.44% |
could |
2 |
11.11% |
中情态 |
will |
2 |
11.11% |
should |
3 |
16.67% |
would |
1 |
5.56% |
高情态 |
must |
2 |
11.11% |
总数 |
|
18 |
100% |
见表1,在纪录片《万象中国》中,“陈述句”所占比例远远高于疑问句和祈使句的比例。陈述语气是用于传达事实、信息或描述状态的一种语法形式,因此陈述语气的使用能够让观众接收到清晰、直接、客观的数据或叙述,增强了纪录片信息传递的可信度。
见表2,在纪录片《万象中国》中,低情态话语出现频次最多,占比最大,低情态表达能够给观众一种较为谨慎和客观的感觉。它不像高情态表达那样强烈地肯定或否定某一观点,而是以一种相对委婉的方式表达内容,这种表达方式让观众感受到纪录片制作的严谨性,增强了纪录片的可信度。
5.1.2. 多模态元素在人际意义中的实现
1) 语气
“The country is the world’s largest tea consumer and producer, so here it is often the variety, rather than the brand, that defines the tea.”
这句话出自《中国茶味》一集,采用的是陈述语气。陈述句用于描述事实、传达真实信息。陈述语气在纪录片中使用得最为频繁,因为纪录片最重要的功能就是最大限度地向观众传达真实信息。这部纪录片的主要目的是向观众传递中国文化的可信信息,帮助观众更深入地了解中国文化的内涵,所以陈述语气是最佳选择。这句话揭示了中国茶文化的一个重要特点:茶的种类比品牌更加重要。相比于其他市场上可能更强调品牌的营销策略,在中国,消费者往往更看重茶叶本身的品质和特色,这反映了该国深厚的茶文化和历史传统。
“Add a few dry leaves, pour boiled water into the cup.”
这句话使用了祈使语气,它选自《中国茶味》一集,是在建议泡茶的步骤。祈使语气的功能是请求、要求、命令、劝告、告诫以及建议他人做或不做某事。在纪录片《万象中国》中,祈使语气很少使用,因为生态纪录片主要是向观众传达真实信息,很少带有个人情感。
2) 情态
情态是言语模式实现人际功能的另一种方式,它反映了人们的情感与态度,情态的运用有助于人们与他人进行交流并影响他人的行为。通过识别情态动词就可以对不同句子中的情态从高到低进行分析。
“Without stir frying or kneading, the tea can retain the original nutrients to the greatest extent.”
这句话选自《中国茶味》一集,该句中的情态副词“can”是低情态的典型代表。低情态的使用意味着信息的确定程度不高,存在多种可能性。在这句话中,“can”意味着一种相对宽泛的可能性,表明在这种特定条件下,茶叶有能力达成这样的效果,但并非绝对肯定或必然的情况,依旧可能存在其他因素或情况会影响茶叶最终保留的营养程度。
“After being steamed and then fried with chicken meat inside, it would still retain its nutritional and medicinal properties.”
这句话出自《美味的药》一集,该句中的情态副词“would”是中情态的典型代表。“would”体现了在特定条件下对事物保留其营养和药用特性的一种推测性的判断。它暗示了这种情况不是完全确定或必然发生的,但有一定的可能性,给观众一种较为适中的预期,让观众在理解这一信息时感受到一种相对灵活且具有一定可信度的表述。
5.2. 互动意义的分析
5.2.1. 多模态元素在互动意义中的分布
见表3,在纪录片《万象中国》中,“提供”行为所占比例远远高于“索取”行为的比例。该纪录片的目的在于传播客观、真实的中国文化,加深国内外观众对于中国文化的理解。在纪录片中,有许多镜头里并没有人物出现,即便有人物,参与者与观众之间大多也是间接的眼神交流。因此,其意义构建实现了向观众传递有关中国文化的客观信息的目的。
见表4,“近景镜头”所占比例最大,“远景镜头”次之,“中景镜头”所占比例最小。远景镜头一般出现在纪录片的开头和结尾部分。从意义传递的角度来看,“远景镜头”体现的是社交远距离,“特写镜头”展现的是亲密距离,“中景镜头”反映的是社交距离。在纪录片《万象中国》中,远景镜头主要被充分利用来强调特定细节或关键时刻,引导观众关注重要的信息点,帮助他们更好地理解中国文化的关键。
对于“态度”方面,见表5,在水平视角中,“正面角度”所占比例高于“斜侧角度”,这种方式往往会提高观看者的参与感,拉近视频中的呈现者与观众的距离。在垂直视角中,见表5,“平视”占比
Table 3. Frequency of contact in China Bouquet
表3. 《万象中国》中的接触使用频率
接触 |
索取 |
提供 |
总数 |
标注时长(秒) |
27.21 |
342.76 |
369.97 |
频率 |
7.35% |
92.65% |
100% |
Table 4. Frequency of social distance in China Bouquet
表4. 《万象中国》中的社会距离使用频率
社会距离 |
特写镜头 |
中景镜头 |
远景镜头 |
总数 |
标注时长(秒) |
334.16 |
81.49 |
220.49 |
636.14 |
频率 |
52.53% |
12.81% |
34.66% |
100% |
Table 5. Frequency of attitude in China Bouquet
表5. 《万象中国》中的态度使用频率
态度 |
|
标注时长(秒) |
频率 |
水平角度 |
正面视角 |
310.52 |
52.85% |
斜侧视角 |
277.03 |
47.15% |
总数 |
|
587.55 |
100% |
垂直角度 |
俯视 |
156.49 |
37.78% |
平视 |
174.36 |
42.10% |
仰视 |
83.32 |
20.12% |
总数 |
|
414.17 |
100% |
Table 6. Frequency of modality in China Bouquet
表6. 《万象中国》中的情态使用频率
情态 |
高情态 |
中情态 |
低情态 |
总数 |
标注时长(秒) |
923.33 |
160.58 |
30.20 |
1114.11 |
频率 |
82.88% |
14.41% |
2.71% |
100% |
最大,“俯视”次之,“仰视”占比最小。平视所用占比较大,有助于在所呈现主体与观看者之间形成一种平等的关系,这可以拉近作品与观众之间的距离。
在互动意义中,情态可分为“高”“中”“低”三个等级。见表6,发现“高情态”占比82.88%,其主要展现自然风光、居民社交和生活场景、建筑内外观等等。“中情态”意味着画面颜色饱和度不是太高,它占比14.41%。纪录片中的中情态画面主要展示了冬天的室外景象、建筑的墙面、以及人物被采访的画面。而低情态画面,即黑白色调的画面,主要展示了一些具有悠久历史的人物和建筑老照片。纪录片中高饱和度画面的使用展示了中国人民真实、鲜活的生活。
5.2.2. 多模态元素在互动意义中的实现
1) 接触
见图1,此行为属于“索取”范畴,展现的是一位药膳师傅前往厨房准备制作药膳的场景。在这之前,他已经按照中医的搭配和精确用量,采摘并且准备好了食材,就等着通过烹饪来展现自己精湛的技艺,为顾客制作美味又健康的食物。画面中他直视镜头,与观众有了直接的眼神接触,仿佛在邀请观众一同学习他即将展示的,中国独有的药膳烹饪方法。这不仅展示了药膳师傅对传统技艺的自信与自豪,也透露出他希望与观众分享这一传统烹饪技艺的渴望,体现了中国传统饮食文化的传承与交流。
见图2,此行为属于“提供”范畴,视频中的参与者是一位正在准备药膳烹饪食材的厨师。从镜头所展示的画面来看,这位厨师专注地盯着眼前的中药食材,认真地进行采摘工作,全程没有与观众进行眼神交流。此时,视频仅仅向观众传递了客观信息。这种展示让观众了解到传统药膳烹饪的专业与严谨,能够对药膳烹饪前的准备工作有一个较为清晰的认识,感受到传统烹饪文化的魅力。
2) 社会距离
见图3,是一个“特写镜头”,展示了视频中参与者与观众之间亲密的关系。视频中的参与者满面笑容,正在讲述自己大家族在四合院中一起吃饭时,和谐团圆的场景。通过这个近景镜头,被呈现的参与者与观众之间的距离缩短了,观众能够真切地感受到视频中参与者在回忆家族团聚时的温馨与幸福,使观众产生了想要参与其中的冲动。此外,这个场景也让观众对中国传统四合院文化有了更深刻的认识,体会到家族团聚在中国人心中的重要意义。
Figure 1. Example of demand behavior in China Bouquet
图1. 《万象中国》中索取行为举例①
Figure 2. Example of offer behavior in China Bouquet
图2. 《万象中国》中提供行为举例①
Figure 3. Example of close-up shot in China Bouquet
图3. 《万象中国》中特写镜头举例②
Figure 4. Example of medium shot in China Bouquet
图4. 《万象中国》中中景镜头举例③
见图4,是一个“中景镜头”,展示了参与者与观众之间的社会关系。通过中景拍摄,被呈现的参与者与观众之间的距离相对缩小,使得观众能够更清晰地观察到参与者的表情、动作以及他们所处的环境。视频中的两位参与者在皮影与京剧的跨界合作上达成了共识,体现了当代年轻人在传承中华传统优秀文化方面所作的努力和创新。
3) 态度
态度可以通过拍摄角度体现出来,主要包含两种角度类型:水平角度和垂直角度。水平角度反映了观众的参与程度,而垂直角度反映了视频中参与者与观众之间的权力关系。
水平角度可进一步分为两种类型:正面角度和斜侧角度。具体而言,前者反映了观众对视频所描绘世界的参与感,而后者则意味着疏离感。
Figure 5. Example of frontal angle in China Bouquet
图5. 《万象中国》中正面视角举例④
见图5,为“正面视角”。画面中的参与者正在认真地制作茶叶,正视视角使得观众仿佛置身于现场,更加直观地感受到制茶过程的细致与艰辛。此外,正视视角使观众能清晰地看到参与者手上的动作,像是在亲自参与其中,这种强烈的参与感增加了观众想要加入制茶工艺中的愿望。此外,通过正视视角,观众对茶叶制作的整个流程有了更深入的了解,体会到了传统制茶工艺的独特魅力和价值。
垂直角度可分为俯视、平视和仰视。俯视体现了观众的主导地位,平视代表视频参与者与观众之间地位平等,仰视则代表视频参与者处于主导地位[17]。
见图6,采用了“平视”角度进行拍摄。从这个角度拍摄,体现出了视频中参与者与观众之间地位平等,拉近了参与者与观众的距离,使观众在看到参与者手中的皮影时,能在心理上产生一种共鸣,激发了他们对传统文化的认同和责任感。
4) 情态
见图7,展现了在盛产白茶的福建,人们采茶的场景,高情态,即“高饱和度”画面体现了视频画面的真实性、可靠性。此外,高饱和度的色彩展现了福建茶园的生机与活力,还从侧面反映了当地茶叶种植的蓬勃发展。
见图8,运用“低情态”,即“低饱和度”镜头,呈现出一张黑白色调的四合院老照片。画面中,四合院的建筑轮廓线条简洁而清晰。低饱和度的色彩使得照片仿佛蒙上了一层淡淡的灰雾,营造出一种静谧、古朴的氛围,让观者感受到四合院深厚的历史底蕴。
Figure 6. Example of eye-eye angle in China Bouquet
图6. 《万象中国》中平视视角举例③
Figure 7. Example of high-modality image in China Bouquet
图7. 《万象中国》中高情态画面举例④
Figure 8. Example of low-modality image in China Bouquet
图8. 《万象中国》中低情态画面举例②
5.3. 语言模态和视觉模态之间的关系
根据张德禄[5]的观点,多模态及其关系可分为两种类型,即互补关系和非互补关系。互补关系表示一种模态不能将交际者意义表达清楚,从而利用另一者来进行强化、补充达到更加充分或者尽量充分表达意义,便于听话者理解话语的目的。
非互补关系表示第二种模态对第一种在意义的体现上并没有大的贡献,但仍然作为一种模态出现,还存在一种模态的话语对另一种起到抵消作用、甚至是两种模态相斥的现象[5]。根据互补定义和非互补关系的定义分析后发现,语料库中的大多数模态主要是通过不同模态之间的互补关系体现出来的。视觉和语言模态的协同作用,使得信息传递更加清晰、完整,更易于观众理解。以下是具体的例子。
在纪录片《四合院》的这一集里,见图9,当语言模态介绍四合院的布局构造时,时段00:01:05~00:01:15这个时间段内,视觉模态发挥了重要作用。通过展示具体的图示,它为语言模态提供了有力补充。在介绍四合院布局构造时,视觉模态以直观的图像形式呈现出四合院的整体布局,包括各个部分的位置关系、建筑的分布等。这些图示帮助观众在脑海中构建起四合院的空间结构,使观众能够更清晰地理解语言描述。
Figure 9. Example one of complementary relationship image in China Bouquet
图9. 《万象中国》中互补关系画面举例1②
Figure 10. Example two of complementary relationship image in China Bouquet
图10. 《万象中国》中互补关系画面举例2④
见图10,是在《中国茶》一集对茶的分类介绍。在时段00:02:25~00:02:36之间,视觉模态在展现茶的颜色和形态时,不仅呈现了茶的外观特征,还与语言模态相互配合。例如,当描述茶的颜色时,画面上展现的色彩与语言描述相呼应,使观众更直观地理解茶的颜色。此外,视觉模态能够呈现出茶叶的形状、质地等细节,进一步丰富语言表达。因此,通过视觉模态与语言模态的协同作用,观众可以更全面、深入地了解茶的分类。这种协调不仅提高了信息的传递效率,还增强了观众对茶的认知和感受。
6. 总结
6.1. 主要发现
在人际意义的实现过程中,陈述句(95.24%)的使用频率高于疑问句和祈使句。这是因为陈述句能够以一种客观、直接的方式向观众传达信息,使得观众接收到的内容更加真实、可靠,能够最大程度地保证信息的准确性和完整性。此外,低情态(55.55%)的使用在纪录片中尤为突出。相较于其他情态,低情态的运用体现了纪录片语言的严谨性。它通过对信息的适度表达,避免了过于绝对或主观的陈述,使观众感受到一种更为客观的态度。这种严谨性不仅增强了纪录片的可信度,还让观众在接收信息时更加理性地思考和判断。以上回答了第一个研究问题。
就互动意义的实现而言,“提供”类镜头(92.65%)的使用比“索取”类镜头(7.35%)更多,主要是提供客观信息,以便让观众更好地了解中国文化的相关信息和内涵。“特写镜头”(52.53%)相较于其他镜头更为常用,其目的在于向观众提供更具体和关键的信息。此外,在纪录片中,“正面角度”(52.85%)和“平视角度”(42.10%)通常被采用,以此拉近观众与画面中参与者之间的距离,展现双方平等的关系,让观众产生强烈的体验感和参与感。“高情态”镜头(82.88%)在视频中使用较多,主要提供更加真实可靠的信息,给观众带来更多的视觉冲击和享受。以上回答了第二个研究问题。
对于第三个研究问题,通过分析发现,在纪录片中,多模态话语的互动关系主要体现为互补性。视觉模态和语言模态的协同作用,使得纪录片的信息传递更加清晰、完整,更易于观众理解。
6.2. 研究局限和启示
首先,由于空间有限,作者仅挑选出4集作为研究数据。如果能投入更多的时间和精力,研究结果肯定会更具代表性和全面性,从而提高研究的可靠性和代表性。此外,本研究中不可避免地存在主观性。未来的研究可以通过访谈、调查问卷等方法收集观众的反馈和看法,从而能够更准确地评估纪录片创作的效果和影响力。
注 释
①图1和图2来源:网页引用(https://b23.tv/yBhsVyF)。
②图3、图8和图9来源:网页引用(https://b23.tv/0ChcXzQ)。
③图4和图6来源:网页引用(https://b23.tv/jr0PZa4)。
④图5、图7和图10来源:网页引用(https://b23.tv/iBU7Lmy)。