1. 引言
2020年5月22日,国务院总理李克强在第十三届全国人民代表大会第三次会议上做了本年度的政府工作报告。2020年是中国发展的关键一年,是中国第一个百年目标的收关之年,国家目标在2020年全面建成惠及十几亿人口的更高水平的小康社会。此外伴随新冠肺炎病毒在全球范围内肆虐,本年度也是中国政府打好疫情防卫战的关键之年。报告回顾了中国2019年在社会各方面取得的工作成果,并为今年的政府工作设定了目标,制定了计划。在国务院官方网站发布中文政府工作报告全文的同时,中国官方新闻媒体新华网也于6月10日发布了相应的英文版。鉴于中国政府在国家发展以及抗击疫情中取得的重大成就,英文版政府工作报告的发出有利于国外借鉴相关经验以及塑造良好的中国国际形象。
政府工作报告的英译版是翻译界的重点关注对象之一,众多学者从理论应用的视角出发,探讨了各理论在政府工作报告英译文中的应用及作用,例如,童孝华(2014 [1])研究了不同翻译主体在译文中的体现及作用,其他理论还有目的论(李红霞,2010 [2])、语篇衔接理论(胡峰笙,2012 [3])、权力话语理论(赵琦,2016 [4])、以及评价理论(司炳月、高松,2019 [5])等。也有研究探讨了报告中概念隐喻的翻译(王瑞昀,2016 [6];田苗,2016 [7]),还有研究探讨了报告英译文中的翻译问题及对应策略,例如宏观层面的迁移性冗余问题(武光军,2010 [8])以及具体层面的词汇翻译问题(吴文子,2006 [9];陆仲飞、王大伟,2016 [10])。在研究方法层面,有研究运用了语料库分析工具来研究英译文的语言特征(朱晓敏,2011 [11];李晓倩、胡开宝,2017 [12])。
中国政府工作报告英文版的主要受众是海外人群,因此有必要将政府报告英译文同目标语原创文本进行比较,以此分析政府工作报告的英译质量,而国内现有针对政府工作报告英译的研究鲜有从翻译共性的视角出发,采用语料库检索工具的研究也相对较少。鉴于当前对2020年政府工作报告的研究较少,而其对国外借鉴中国发展及抗疫经验意义重大,且关乎中国国际形象塑造,本文将2020年政府工作报告及其英译文为研究语料,应用语料库翻译学的理论的方法,通过与美国2020年国情咨文进行比较,尝试从多个维度考察报告英译文的语言特征。
2. 翻译共性理论
“翻译共性”这一概念最早是由Mona Baker (1993 [13])提出的。她指出:“翻译共性即通常出现在翻译文本而不是源语文本中的特征,并且不是特定语言系统干扰的结果”(Baker, 1993: 243 [13])。这意味着她将翻译语言视为一种独立的语言,并强调其表现出的不同于非翻译语言的普遍特征。胡开宝(2011:86 [14])解释道,Mona Baker关于翻译共性的定义具有双重意义,首先,翻译共性概率分布在特定的语言(目标语言)之中,依靠统计归纳而体现;其次,翻译共性是翻译过程本身的结果,具有独立于源语言和目标语言系统的差异。Mona Baker (1996 [15])将翻译共性分为四种类型,即简化、显化、范化和整齐化。本文主要从简化和显化两个维度出发,探讨中国2020年政府工作报告英译文的语言特征。
1983年,Blum-Kulka和Levenston指出,词汇简化是指用更少的词来表达思想的过程及产物(1983:119 [16])。Mona Baker (1996: 181 [15])将简化定义为“在翻译中简化语言的倾向”,“包括让读者更容易理解事物”。有一些语言表征可以用来描述简化趋势,Mona Baker (1996 [15])认为,句子的平均长度和标点改变都可以作为简化的体现。Baker (1996: 176 [15])认为简化是“译者下意识地简化语言或信息或两者都有”。因此,这一趋势在目的语文本中表现为相对于源语和原语,用词减少,常用词语重复,实词减少,虚词增多,语言复杂性普遍降低(胡开宝,2011:101 [14])胡显耀(2007 [17])在针对汉语翻译小说词语特征进行研究时,通过词语的变化性以及词表常用词描述了翻译简化趋势。
庞双子和胡开宝(2019: 63 [18])指出,“显化”概念最早是由Vinay和Darbelnet在1958年提出的,表示“对原语中暗含的,但可以从上下文中推导出的信息在译语中加以明示”(Vinay & Darbelnet, 1958: 8 [19];转引自胡显耀、曾佳,2011:57 [20])。其后,Blum-Kulka (1986 [21])在研究翻译衔接措施显化时提出了显化假说,指出,“显化是一种整体趋势,即在翻译中把事情解释清楚,而不是把它们隐含起来。”Mona Baker (1996:180 [15])认为,显化趋势的表现包括文本长度,“译文通常比原文要长”。此外,“在词汇上,翻译中明确事物的倾向可以通过解释性词汇和连词的使用或过度使用来表达”(Baker, 1996: 181 [15])。
本研究将结合语料库检索工具,立足于翻译共性理论中的简化趋势与显化趋势,具体从高频词比例、词语变化性、平均句长以及词类分布四个角度,通过单语类比和双语平行比较两个途径来描写政府工作报告译文的语言特征,并未后续政府工作报告翻译提供一定的参考,以期进一步提高政府文书外译质量,服务于向世界传播好中国声音,塑造好中国形象。
3. 研究设计
政府工作报告是中国的一种重要公文形式,其内容主要分为两部分:一是回顾并总结前一年或者前五年的政府工作情况,二是汇报新一年中国政府的工作计划、目标及举措。历年的国务院政府工作报告是中国社会以及政府政策发展变化的缩影,同时也是国外了解中国的重要参考,以及中国向世界传播中国声音,让世界人民进一步了解中国的重要渠道。
本研究所采用的2020年中国国务院政府工作报告中文语料来自于中华人民共和国中央人民政府官方网站(www.gov.cn/),以下简称为RWGC,共11331字,5667词。英语译文来自于中国日报网站对新华网的转载(www.language.chinadaily.com.cn/),其标题为Report on the Work of the Government,以下简称为RWGE,共9660词。英语原创文本选择了体裁比较接近的美国2020年国情咨文Remarks by President Trump in State of the Union Address,来自于美国白宫官方网站(https://www.whitehouse.gov/),以下简称SUA,共6314词。
本研究对三个文本分别进行清理建库,使用中国科学院计算所软件室研发的ICTCLAS Version 1.0 对中文文本进行词汇切分及标注,德国斯图加特大学Helmut Schmid开发的TreeTagger3对英语文本进行词类标注,英国语料库专家Mike Scott教授设计的Wordsmith6进行单语检索以及EditPad Pro进行文本编辑文档内容筛选。借助上述语料库工具,本文通过单语类比和双语平行比较两个途径,即政府报告英译文和美国国情咨文进行比较,政府报告英译文和政府报告中文文本进行比较,从高频词比例、词语变化性、平均句长以及词类分布四个角度来考察政府报告英译文的语言特征。
4. 研究结果与分析
4.1. 高频词比例
Olohan (2004: 77 [22])指出,“词表是语料库中出现的所有单词的列表,附带单词出现的频数”。高频词表是指词表中出现频率较高的单词的列表,根据研究文本的大小和高频词的一般选择标准,本研究通过Wordsmith6生成了三个子语料库的词表,将词表中单词按频次高低排序,选取了前20的单词制成了高频词表,如表1所示。

Table 1. The high-frequency word list of three corpora
表1. 子语料库的高频词表
观察表1可以发现,相比政府工作报告中文语料库(RWGC),政府工作报告英译文语料库(RWGE)虚词较多,而相比美国国情咨文语料库(SUA),RWGE受中文原文影响而带有更多的实词。借鉴胡显耀(2007 [17])通过计算高频词使用频率占各语料库总词频的比例来争鸣翻译小说词语操作的简化趋势,本文也以此方法计算了各子语料库的高频词比例,即高频词次数之和与总词数之比。
高频词比例高说明文本中较少常用词语的重复使用次数较多,以此可以体现文本的简化趋势,即高频词比例越高,简化趋势越明显。通过比较三个子语料库的高频词比例,发现英译文本的高频词比例(34.68%)高于英语原创文本(29.74%),也高于中文原创文本(14.79%),具有明显的简化趋势,如上述图1所示。

Figure 1. The proportion of high-frequency words in three corpora
图1. 子语料库的高频词比例
4.2. 词语变化性
“词语的变化性是指相同长度的语料中不同的词语数量,可通过语料库的类符形符比(TTR)来衡量。”(胡显耀,2007:215 [17])类符形符比即语料库中类符(type)与形符(token)的比率,类符是指不同的词语,形符是指所有的词形。于红(2016: 80 [23])指出,“TTR的数值越高,表明文本的词汇丰富度较高,文本的阅读难度较大;反之,词汇丰富度越低,文本的阅读难度越小。”本研究的三个子语料库存在语料大小差异,因而采用标准类符形符比(Standardised TTR,简称STTR)进行分析,即应用Wordsmith6进行标准化处理,计算各个1000词的平均TTR。

Table 2. The STTR of three corpora
表2. 子语料库的标准类符形符比
根据表2,英译文本(RWGE)的STTR(43.71)略低于英语原创文本(SUA)的STTR(45.83),也低于中文原创文本(RWGC)的STTR(56.66),词汇丰富度较低,文本的阅读难度较小,具有明显的简化趋势。
4.3. 平均句长
Mona Baker (1996:180 [15])指出:“译文通常比原文长。”句子越长,其中包含的信息就越多,因而可以以此描述显化趋势。平均句长是指平均每个句子中包含词数,Wordsmith6的Wordlist功能可以直接计算出语料库的平均句长,结果如表3所示。

Table 3. The average sentence length of three corpora
表3. 子语料库的平均句长
观察表3,我们可以发现,英译文本(RWGE)的平均句长(19.12)大幅高于英语原创文本(SUA)的平均句长(10.05),也高于中文原创文本(RWGC)的平均句长(15.08),具有明显的显化趋势。译者会将原文中隐含的意思明确地表达出来,从而产生一定程度的冗余。结合政府工作报告的平行语料库观察发现,译文中确实存在冗余现象,例如,将原文中“我们一定要努力改进工作,切实履行职责,尽心竭力不辜负人民的期待”译为“We must strive to improve our work and fulfill our responsibilities and make every effort to live up to the people’s expectations”实际上,原文所讲的只是政府会尽职负责这一层意思,而英译文对原文进行了亦步亦趋的翻译,造成了武光军(2010 [8])提到的迁移性冗余问题,他还进一步指出,“翻译中的迁移性冗余指的是,并不按照译文语言的内在组合规律,而是将原文中的语言组合形式直接迁移到译文中,从而造成译文的冗余性表达,并影响译文的交流效果的现象”(武光军,2010:64 [8])。因此平均句长所体现的翻译显化趋势告诫我们在进行外宣翻译时,不能逐字逐句地机械转换,而是要考虑到汉英语言思维模式的差异,根据国外受众的思维习惯对原文进行适当加工,从而提高翻译质量。
4.4. 词类分布
Maeve Olohan (2004: 81 [22])指出,词汇密度“是指语料库中内容词与功能词的比例”。还指出,“词汇密度是通过计算内容此词占总词数的百分比得到的”。词汇密度越低,语料库中内容词的数量越少,所占比例越低,信息量和难度也就越低。本研究认为,译文中词汇密度越高,说明倾向越明显。

Table 4. The POS of three corpora
表4. 子语料库的词类分布
表4显示,英译文本的词汇密度(60.73%)稍低于英语原创文本(61.80%),也低于中文原创文本(81.77%),显化趋势并不明显。然而英译文本的名词使用情况(12.30%)高于英语原创文本(9.33%)也高于中文原创文本(8.93)存在超用现象。显化趋势体现在解释性词汇和连词的使用或过度使用层面(Baker, 1996: 181)。名词存在超用情况之外,观察表1高频词表可以发现,“和”与“and”都出现在了高频词表的前列,进一步计算分析发现,英译文本中的“and”的使用频率(6.56%)高于英语原创文本(3.50%),也大幅高于中文原创文本(1.76%),同样存在超用现象。
5. 结语
本研究以中国2020年政府工作报告英译文为研究对象,基于翻译共性理论,主要从简化趋势和显化趋势两个层面出发,结合与政府工作报告中文原文以及美国2020年国情咨文进行对比,对政府工作报告的英译文进行了描写与分析。结合语料库检索工具,本文从高频词比例、词语变化性、平均句长以及词类分布四个角度细致分析了政府工作报告英译文的语言特征。
本文研究发现,中国2020年政府工作报告英译文和美国国情咨文原文以及中文源语文本相比,英译文高频词比例较高,词汇变化性较低,词汇丰富度较低,具有明显的简化趋势。此外,政府工作报告英译文平均句长较长,虽然词汇密度较低,但是存在名词和连词“and”的超用现象,有所体现显化趋势。进一步深入文本分析发现,2020年政府工作报告英译文本存在迁移性冗余问题,连词“and”的大幅超用也体现出了翻译文本存在衔接僵硬问题。望以此为戒,政府文书翻译是我国外宣工作的重要组成部分之一,其翻译质量不仅关乎中国声音的对外传播,也关乎中国国际形象的塑造,只有逐步打破刻板僵化的文书翻译模式,深入考虑英汉语言模式的差异,考虑到国外受众的思维模式以及目标语的相应文本表达习惯,从而可以进一步提高我国政府文书的翻译质量。本文主要结合语料库检索工具对翻译文本进行了多角度描写分析,有所发现存在的翻译问题,关于报告中具体的翻译问题有待于进一步深入文本分析并提出更具针对行的改进建议,相关研究有待于进一步深入。