1. 引言
随着改革开放和全球一体化的加速,中国越来越积极地参与国际事务。同时,中国与其他国家的关系也日益紧密。政治文本的翻译对于提升国家的国际形象和维护国家主权至关重要,它为外国人了解中国的指导方针、政策以及在政治和民主等领域取得的巨大进步提供了一个窗口。正因如此,政论文翻译研究成为研究的热点。不仅中央政府,地方政府也意识到了政论文翻译的重要性和必要性。然而,目前大多数政论文翻译研究主要基于翻译理论和译者经验,缺乏结合客观数据的全面、有说服力的结论。本文选取2022年《政府工作报告》及其英译文为研究对象,借助语料库软件,参照2022年美国《国情咨文》,以得出当下政治文本英译的语言特征。《政府工作报告》和《国情咨文》分别是中美政府的施政纲要,这两份报告均覆盖经济、政治等多个领域的内容 [1] 。因此,本文选择同一时期的《国情咨文》作为参照。
2. 《政府工作报告》英译的相关研究
政府工作报告,作为最为重要的政治文件之一,在每年的人民代表大会和中国政治协商会议上由各级政府发表。总体来看,它包含三个主要部分:对过去一年政府工作的综述;下一年的工作目标和计划;以及政府职能、民主建设和法制建设的完善。政府工作报告象征着民主执政,使人们了解政府过去所做的努力和未来的目标。
考虑到政论文在国与国交往中的关键作用,有不少学者从多个角度对《政府工作报告》的英文翻译进行了研究。在翻译理论方面,李红霞以2010年中英文版《政府工作报告》为语料,从功能目的论出发,探讨政论文的文本功能及翻译目的 [2] 。胡峰笙等人以《2010年政府工作报告》为实例,从语篇衔接理论出发,分析了语篇衔接理论在政治文献翻译中的实用性和有效性 [3] 。在翻译问题方面,武光军从句子和语篇两个层面分析了2010年政府工作报告英译本中的迁移性冗余 [4] 。陆仲飞和王大伟研究《2016政府工作报告》英译文用词的灵活性,译文在多种情况下小幅度地偏离原文,以便更好地被目标语读者所接受 [5] 。此外,还有一些学者对《政府工作报告中》某类词的英译进行了研究,如田绪军研究了情态动词 [6] 、汪晓莉和谭苗研究了虚化动词 [7] 。
3. 研究问题
本文采用基于语料库的方法,结合客观数据,旨在探索以下问题。
1) 2022年《政府工作报告》英译本有何语言特征?
2) 构成这些特征的原因是什么?
4. 研究设计
本文选取了2022年《政府工作报告》的原文、英译文以及2022年美国《国情咨文》作为研究材料,采用基于语料库的方法,在定量分析的基础上,结合汉语和英语的特点以及汉英翻译技巧做一些定性分析。在语料库语言学的帮助下,对《政府工作报告》译文语言特征的描述将会更加科学和客观。
本文选用的研究工具有SegmentAnt软件、TreeTagger3.0软件以及WordSmith6.0软件。SegmentAnt软件可用于中文文本的分词及词性标注。TreeTagger3.0软件可用于对英文文本进行词性标注。WordSmith6.0是由MikeScott开发的一款语料库软件,通过该软件我们可以获得类符/形符比、词长分布、句子数量、平均句长、高频词等语言参数。
研究步骤可分为数据处理和数据分析两个阶段。首先,数据处理阶段。1) 在新华网(http://www.xinhuanet.com)获取2022年《政府工作报告》原文(以下简称RWGC)及英译文(以下简称RWGE),在美国白宫官网(https://www.whitehouse.gov/)获取《国情咨文》(以下简称SUA)。2) 对文本进行清洗,再以txt形式保存在D盘的文件夹中。3) 使用TreeTagger3.0软件对英文文本进行标注,注意确认编码为UTF-8。4) 使用Segment Ant软件对中文文本进行分词及标注。5) 因为WordSmith6.0只认Unicode和UTF-16LE编码,故将文本编码先都改为UTF-16LE,再通过WordSmith6.0中的Wordlist功能获取三个语料库(RWGC/RWGE/SUA)的语言参数。其次,数据分析阶段。对呈现的语言参数进行分析,总结出2022年《政府工作报告》的语言特征,挖掘构成这些特征的原因。
5. 发现与讨论
5.1. 词汇丰富度(类符/形符比)
词语丰富度是指相同长度的语料中不同的词语数量,可通过语料库的类符/形符比(TTR)来衡量 [8] 。形符是指出现在一个文本中的单词的数量,类符是指不同单词类型的数量。如果一个单词在同一文本中出现两次或两次以上,只能算作一个类符。TTR的数值越高,表明文本的词汇丰富度越高,文本的阅读难度越大;反之,词汇丰富度越低,文本的阅读难度越小 [9] 。但是TTR值可能会受到文本长度或语料库容量的影响 [10] 。当扩充一个较短的文本时,文本的形符数会明显增加,但类符数可能不会增加。因此,Scott由此提出“标准类符/形符比”(STTR)的概念,STTR计算的是每1000个单词的平均TTR值 [11] 。本文的三个语料库的标准类符/形符比如表1示。
就篇幅而言,通过观察形符数和类符数,我们可以得知RWGE语料库的文本长度远高于RWGC语料库和SUA语料库。RWGE语料库中类符数也远高于SUA语料库。而类符数更多并不意味着该文本的词汇更丰富,因为文本长度是导致类符数更多的重要原因。反观标准类符/形符比,前者的标准类符/形符比要略小于后者。这些表明,2022《政府工作报告》英译本中的词汇丰富度低于2022美国《国情咨文》。这是由于外国人用词更为灵活,常用不同词汇表达同一意思。其次,我国政治文本的英译要求严谨、忠实原文,因而造成许多词汇及表达的重复使用,降低了词汇的丰富度。
5.2. 词汇密度
词汇密度是一个文本中实词数的占比。词汇密度可以用来衡量文本信息量和阅读难度。词汇密度越大,文章越难理解 [12] 。在英语中,单词可以根据它们所表达的意思分为实义词和功能词。表达语法意义的词,如连词、介词、代词和冠词等都是功能词。那些有词汇意义的,也就是那些指物质、行为和性质的,如名词、动词、形容词和副词都是实义词。在本研究中,在用词性赋码软件标注后,根据赋码集,在Word中检索三个语料库中的所有实义词,最后计算两个语料库的词汇密度,结果如表2所示。
从表2可以看出,2022年《政府工作报告》中文版的词汇密度大于英文版,而《政府报告》英文版略大于《国情咨文》。这是由于汉语和英语的语言结构及形式的差异。中文重“意合”,英文重“形合”,故而在英文中会频繁出现一些连接词、介词等功能词。因此,中文文本的词汇密度会高于英文文本。《政府报告》英文版与《国情咨文》的词汇密度相差不大,说明该英译符合英文的使用习惯。
通过对表2的观察,发现在《政府报告》中动词数要大于名词数。而在英译本中,名词要远多于动词。这主要是由于显化现象和动词的名词化现象。在此我们先探讨名词化现象。在英语中,动词名词化是常见的,并且是词汇丰富和表达灵活的重要手段。动词的名词化通常涉及特定的词缀,如:-tion,-sion,-al,-ment,-y,-ing等。通过WordSmith的Concord功能检索到《政府报告》英译文中有大量词缀为-tion,-ment、-sion的动词名词化词汇,如development/employment/construction/implementation/expansion /cooperation等。动词名词化可以使语篇正式、客观和简洁。此外,它还可以作为语篇中的衔接手段。具体来说,名词化在语篇中使用得越多,语篇就越抽象,越正式。名词化有利于表达客观事实。它使信息更加密集,从而使文本更加简洁,更有凝聚力 [13] 。因此,在《政府工作报告》中我们能发现大量名词化词汇。
5.3. 词长分布
平均词长是指一段文本中,每个词的平均字母字数,是通过一篇文本的总字母数与总词数相除得出。研究平均词长可以帮助我们了解文本的语言风格和文本特征。较短的平均词长通常反映着简洁、流畅的表达,适合快速传递信息;而较长的平均词长则可能表明复杂、深入的探讨,语体更为正式,适合学术等领域。例如,学术类文本的平均词长会大于报刊类文本,报刊文本平均词长又会大于各类小说;而语体正式程度也在依次递减。因此,语体正式程度与平均词长也有着一定的联系 [14] 。表3显示了2022年《政府工作报告》英文版和美国《国情咨文》的平均词长和词长标准差,图1、图2显示了各自的词长分布。

Figure 1. Word length distribution in RWGE
图1. RWGE词长分布

Figure 2. Word length distribution in SUA
图2. SUA词长分布
在书面语言中,尤其是正式或官方文件倾向于使用复杂而长的词语。较长的平均词长反映了文本的正式程度。表3中的数据显示RWGE语料库的平均词长要明显高于SUA语料库,这表明GWRE比SUA使用的长词更多。通过图1、图2可以发现,SUA中长词数很少,这也意味着《政府工作报告》要比《国情咨文》的语体更为正式。因为《政府工作报告》本身是一个专业性强的政治文本,所以该译文也保留了原文的特色。在上节中讲到了《政府工作报告》中的名词化现象。名词化的词通常比其他形式的名词长,因此这也是RWGE平均词长高于SUA的原因之一。
5.4. 高频词分布
词频是语料库研究的基本方法。高频词是在语料库中出现频率较高的单词,它们在自然语言中扮演着重要角色。通过分析高频词的使用,我们可以揭示语言的基本结构和模式。利用WordSmith6.0软件的WordList功能,很容易得到按降序排列的词频列表。表4显示了这三个语料库中出现频率最高的前20个单词及其频率,以及分别在全文中的百分比。
通过观察表4的数据可以得出以下发现:(1) RWGC语料库的前20个词中仅有2个是虚词,实词占80%,而RWGE和SUA中都仅有2到3个实词,故而可以应验前文所说的中文文本中的虚词要远少于英文文本,中文文本词汇密度往往更高。(2) 源语文本中“和”字的占比为2.58%,而其英译本中“and”占比高达7.11%,之所以这数值翻倍增长,正是由于英文更注重语篇的衔接。因此也印证了汉语重“意合”,英语重“形合”这一说法。(3) 在RWGE中出现频率第3的实词“government”在对应的源语文本中出现的频率并不算很高,这是由于中文无主句句式英译时可能需要添加主语。(4) 在SUA的前20个高频词中出现“I”和“You”,而RWGE前20个高频词中并未出现,表明《政府工作报告》比《国情咨文》的语体正式。
5.5. 平均句长
平均句长是指一个句子中的平均词数,通常是用文本中的总词数/该文本的总句数来计算。标准差反映了数据的集中程度和离散程度,标准差越大,文本的句子长度变化越大。语料库中的平均句长可以在一定程度上反映句子的复杂程度。一般来说,句子越长,就越难理解,文本也就越正式。表5列出了三个语料库的句子数量、平均句长和句长标准差。
通过表5可知,(1) RWGE的句数要多于RWGC,这是因为汉语句子的特点是连续句子结构;而英语句子的特点是树型结构,它有一个独立的句子来表达重要信息,有许多从属分句和短语来表达次要信息。在翻译RWGC中的长句时,需要分析整个句子所表达的所有意义,确定它们之间的主次关系,然后将原句分离成几个句子。(2) RWGE的平均句长要多于RWGC,这是由于汉语强调“意合”,英语强调“形合”,英文文本常用一些连词来反映句子之间的逻辑关系。因此译者在翻译具有逻辑关系的句子时经常需要使用连接词将两个句子合并成一个句子,这也使得RWGE的平均句长更长。(3) RWGE语料库的平均句长大于SUA语料库。导致这一结果的原因是因为受到源语文本的影响。在《政府工作报告》中经常会出现一些专业术语、中国特色词汇以及缩略词,因此要在英译时需要对词进行解释,也就是下文要讲的英译中的显化现象。
5.6. 显化
显化现象是一种语言的表达手段,旨在将抽象的概念具象化,使其可以通过语言传达给他人。显化现象分为形式显化和意义显化,可以体现在连词和解释性词汇的使用上 [15] 。通过表4可以看到,“和”与“and”分别是政府工作报告及其英译本中出现频率最高的词,但值得注意的是,英译文本中“and”的出现频率(7.11%)要远远高于源语文本(2.58%)。而且,表1的结果显示RWGE中的总字数多于RWGC,表2显示译文的名词数量远高于源语文本,表5显示RWGE中的平均句长多于RWGC。以上结果都表明在2022年《政府工作报告》的英译上存在显化现象。因为汉语不需要连词、代词等也能理解句子的内在关系。而英语中的逻辑关系必须通过连词、代词和介词来表达完整的意思,因此便出现了形式显化。在2022《政府工作报告》的英译过程中,译者通过增加连词和人称代词,使得翻译句子的意思更完整,更容易理解。例如:提升科技创新能力。实施基础研究十年规划,加强长期稳定支持,提高基础研究经费占全社会研发经费比重。
We will raise our capacity for scientific and technological innovation. We will press ahead with the 10-year action plan on basic research to ensure stable support over the long term, and increase the share of basic research spending in the country’s total R&D expenditures.
意义显化是指汉语中的一些成语、谚语等词,在英语中需要用更多的词来解释其真实意义。在2022年《政府工作报告》必然会有许多中国特色词及缩略词等,因此在英译过程中也固然会出现意义显化现象。如:“放管服”改革——the reform to streamline administration and delegate power, improve regulation, and upgrade services;纠治“四风”——tackle pointless formalities, bureaucratism, hedonism and extravagance;“十四五”规划——14th Five-Year Plan;坚持“两个毫不动摇”——work unswervingly both to consolidate and develop the public sector and to encourage, support and guide development of the non-public sector等。
6. 结论
本文以语料库为辅助工具,从词汇、句子两方面对2022年《政府工作报告》原文(RWGC)、英译文(RWGE)和同期的美国《国情咨文》(SUA)进行了全面的定量和定性分析。在词汇层面讨论了词汇丰富度、词汇密度、词长、高频词和名词化现象;在句子层面对句数、平均句长、显化现象进行了讨论。经过对比研究,发现2022年《政府工作报告》英译本有以下几个特征:第一,译本词汇丰富度较低,这是由于政治文本翻译要求较高的准确度,使得译者翻译原文中的一些词时倾向于重复使用一些英语单词,而本族语者则在语篇中使用不同的单词或短语来表达相同的意思。第二,因为RWGC中有许多缩写,译者需要使用更多的词汇来传达更多的信息,因此译文相对于SUA具有较高的词汇密度。这结果也表明词汇密度高不一定意味着词汇更丰富。第三,由于名词化现象使得译文中的名词数显著增高,平均词长更长,文本更为正式。第四,由于汉语是分析性语言,不受句子结构的限制,所以RWGC中有大量的无主语句子,在英译时大部分是通过加主语“we”和“government”翻译出来的,这也导致了RWGE中这两词使用频率的增加。第五,由于政治文本的特性及英译的显化现象,使得译文中使用“and”的频率相较于原文显著增高,总词数增多,平均句长更长。