语料库语言学视角下的《蜀道难》英译研究
A C-E Translation Study of The Shu Way Is Hard from the Perspective of Corpus Linguistics
DOI: 10.12677/ML.2022.106180, PDF, HTML, XML, 下载: 399  浏览: 834 
作者: 石红燕:浙江工商大学,浙江 杭州
关键词: 李白诗歌《蜀道难》英译语料库语言学Li Bai’s Poems English Translation of The Shu Way Is Hard Corpus Linguistics
摘要: 李白是中国知名度最高、地位最高的诗人之一,其诗歌是唐诗艺术高峰的代表,也是中国文化在海外被接受的典范。因此,本研究选取孙大雨和许渊冲《蜀道难》英译自建研究语料库,借助Stanford Parser分词软件、Wordless和UAM Corpus Tool这两个语料库分析软件,从词汇、句法和语篇这三个层面对《蜀道难》两种英译进行分析。研究发现:在词汇层面,许译的类符形符比、词汇密度大于孙译,许译的词汇丰富程度更高,承载的信息更加丰富,两译本中虚词的数量均大于实词。在句子层面,平均句长、标准差、方差这三个维度均表明许译句长更平稳;两译本中并列结构均使用较多,均使用了指称衔接的手段。在语篇层面,孙译的阅读难度大于许译。基于上述研究,作者给出三点建议:重视诗歌翻译、研究目标受众特点、拓展传播渠道。因此,本研究通过梳理《蜀道难》英译的词汇、句法和语篇三个方面的特征,以期让海外读者更好地感受中国文学的魅力,增进对中华文化的了解,也为研究其他诗歌提供范式,有利于推动中国古典诗歌进入另一个巅峰。
Abstract: Li Bai is one of the most well-known and highest-ranking Chinese poets, and his poetry is a representative of the artistic peak of Tang poetry, as well as a model of Chinese culture being accepted overseas. Therefore, this study selects a self-built research corpus of English translations of The Shu Way Is Hard which is translated by Sun Dayu and Xu Yuanchong, and analyzes the two English translations of the poem at three levels: lexical, syntactic, and discourse. With the help of three softwares, Stanford Parser and Wordless and UAM Corpus Tool, the study found that the type/token ratio and the lexical density of Xu’s translation were greater than those of Sun’s translation at the lexical level; the lexical richness was higher in Xu’s translation, and the number of function words in both translations was larger than that of content words. At the sentence level, the three dimensions of average sentence length, standard deviation and variance show that the sentence length of Xu’ translation is more balanced; parallel structures and the referential cohesion are used in both translations. At the level of discourse, Sun’s translation is more difficult to understand than Xu’s. Based on the above analysis, three suggestions are given: placing emphasis on poetry translation, studying the characteristics of the target audience, and expanding dissemination channels. Therefore, this study aims to provide foreign readers with a better understanding of the charm of Chinese literature and Chinese culture, as well as to provide a model for the study of other poems, thus promoting Chinese classical poetry to the world.
文章引用:石红燕. 语料库语言学视角下的《蜀道难》英译研究[J]. 现代语言学, 2022, 10(6): 1347-1355. https://doi.org/10.12677/ML.2022.106180

1. 引言

李白被后人誉为“诗仙”,其诗歌艺术成就极高,是中国诗歌文化的桂冠和明珠,并为后世广为流传。其中,《蜀道难》是李白歌行的代表作,也是世界诗歌中的瑰宝,而且被广泛译介,成为世界文学的一部分。这首诗描述了山川之险、蜀道之难,给人以排山倒海、一泻千里的感觉,充分展现了诗仙李白的浪漫主义情怀。唐人殷璠在他于天宝十二年编成的《河岳英灵集》中对《蜀道难》进行了评述,他说李白为文章“率皆纵逸”。在殷璠之前,贺知章是首位评价《蜀道难》的人,并称他为“谪仙”。从20世纪至今,理雅各(James J. Legge)、罗伯特·道格拉斯(Robert Douglas)、埃兹拉·庞德(Ezra Pound)、威特·宾纳(Witter Bynner)、阿瑟·威利(Arthur Waley)和小畑薰良等外国学者和翁显良、许渊冲、孙大雨等国内翻译家曾将李白诗歌翻译成英文,为西方读者了解中国古典诗歌做出了巨大的贡献。

语料库语言学是一门交叉学科,集语言学、计算机科学、认知与研学和应用语言学于一体。Mona Baker是第一个倡导把语料库应用于探究翻译现象的学者,在其文章(1993)中详细阐述了语料库在译学研究中的理论价值、实际意义及其具体路径 [1],为后续研究提供了范式思考与借鉴。此后,语料库翻译学异军突起,语料库语言研究集中于译学研究语料库的建设 [2] [3] [4] [5]、翻译语言特征 [6] [7] [8] [9]、译者风格 [10] [11] [12] [13]、翻译规范 [14] [15] [16]、翻译教学 [17] [18] [19] 和口译 [20] [21] [22] [23] 等研究领域。国内语料库与翻译学结合的发端滥觞于1993年杨惠中教授发表的《语料库语言学与机器翻译》一文 [24],后来学者相继采用语料库方法,以不同的研究视角,对诗歌中的翻译语言特征展开较为深入的研究 [25] [26] [27] [28] [29]。而对于李白诗歌英译的研究集中在不同译本对比研究 [30] [31] [32] [33]。

综上所述,目前结合语料库研究李白诗歌英译的文献并不多,不足以表征当前语料特征。鉴于此,本研究以孙大雨和许渊冲的英译为例,借助语料库软件,对类符形符比、词汇密度、高频词三个方面的词汇特征、句长分布、指称衔接两个方面的句法特征和译本可读性与难度的语篇层面进行比较和分析,旨在推动中华文化海外传播。

2. 研究设计

2.1. 研究问题

1) 两种译本词汇特征如何?具体体现在哪些方面?

2) 句法层面有何特征?具体体现在哪些方面?

3) 语篇层面有何特征?

4) 对于传播中华文化有何启示?

2.2. 研究方法和工具

本研究运用定量和定性相结合的研究方法,利用分词软件Stanford Parser和语料库分析软件Wordless、UAM Corpus Tool对自建的语料库进行分析。首先,选取孙大雨的《古诗文英译集》 [34] (2003年)、许渊冲的《唐诗三百首》(汉英对照) [35] (2012年),以下简称为孙译和许译。其次,对文本进行清洁,保存为txt文本。再利用Stanford Parser进行分词,将分词结果导出,并运用UAM Corpus Tool软件统计,最后利用Wordless软件进行检索、分析,试图回答上述四个问题。

3. 结果与讨论

3.1. 词汇层面

3.1.1. 类符形符比

类符(Type)指语料库中出现的所有不同的词语,形符(Token)指出现的所有词形,类符形符比(Type/Token Ratio, TTR)在一定程度上反映了词汇的变化性和多样性,即TTR值越大,文本蕴含的词汇量越丰富。将整理好的txt文件导入到Wordless软件,通过Wordless的检索功能,可以检索出两个译本的类符和形符数。两种译本的类符形符比结果如表1所示。

Table 1. Type/Token Ratio of two translations

表1. 两种译本类符形符比

表1可以发现,许渊冲译文虽然最为简短,形符数小于孙大雨译文,但是类符形符比高于孙译,所以其词汇丰富程度更高。因此,可以得知孙大雨翻译时更加保守,对于原文更加忠实,而许渊冲则运用了改写的策略,所以用词更加丰富。

3.1.2. 词汇密度

词汇密度(lexical density)是指文本中实词在总词数中所占的比例,这一指标可以用来判断文本可读性。根据胡壮麟 [36] 对词的分类,英语中的实词(content words)包括名词、动词、形容词、副词,而虚词(function words)主要包括代词、介词、冠词和连词。本研究依据Ure提出的词汇密度 [37],计算公式为实词数 ÷ 总词数 × 100%。将txt文本分别导入到Stanford Parser中进行分词,再将处理好的文本放进UAM Corpus Tool软件中,统计出两译本中的词汇分布情况。

Table 2. Lexical density of two translations

表2. 两种译文词汇密度结果

表2可知,许译的词汇密度略大于孙译,而名词和动词运用的数量相差较大,但副词和连词的数量相当。由于词汇密度直接反映了译文中的信息承载量 [38],故可以得知许译承载的信息相对更多,表达的内容略微丰富。

3.1.3. 高频词

通过词汇出现的频次可以判断该文本的中心内容,而高频词可以扮演这种角色,其中实词是传达信息最准确的词类。通过Wordless的Keyword功能,不使用停用虚词表,并将所有词形还原,检索两种译本的频次排名前20的高频词,得到表3

Table 3. Top 20 high frequency words of two translations

表3. 两种译本中高频词前20位排序

表3中数据可知,前20位高频词中,两译文虚词的占比均大于实词(均为75%)。the、and、to、be均位列高频词前五,符合预期。其中,and均使用较多,说明译文中并列机构较多,符合英语形合的特点,需要连词将隐藏的逻辑关系显现出来。

剔除所有虚词,仅保留频次前五十的实词,生成词云图,分别得到图1图2

Figure 1. Word cloud map of Sun’s translation

图1. 孙译词云图

Figure 2. Word cloud map of Xu’s translation

图2. 许译词云图

由上图可知,孙译和许译的高频实词使用情况差异较大。在孙译中,排名靠前的实词是sky (4次)、turn (4次)、way (4次)、ascend (3次)、blue (3次)、difficult (3次)、flight (3次)、high (3次)、peak (3次)、round (3次)等。而在许译中,排名靠前的则是climb (5次)、mountain (5次)、path (4次)、sky (4次)、bird (3次)、fly(3次)、hear (3次)、high (3次)、pass (3次)、sigh (3次)、turn (3次)、way (3次)、westward (3次)等。这种差异源自译者对这首诗的理解、个人的翻译风格。上述所列的频次前几的词汇也表征了这些词汇是该译本中的主题词。许译中climb和mountain均出现5次,读者可以直观地了解到该诗与爬山有关,而在孙译中,sky、turn和way不能直观地传达这种含义,需要读者进一步阅读才能知晓。

3.2. 句子层面

3.2.1. 句长分布

这首诗歌中涉及的句末标点为句号、问号和感叹号,符合《中华人民共和国国家标准GB/T15834-2011标点符号用法》规范,因此将句号、问号和感叹号结尾的纳入本研究句子范畴。但是由于诗歌体裁的特殊性,以诗歌短句为一句不合适,故以诗行为研究的长度单位。平均句长指每行诗歌中所包含的单词个数,而句子个数是研究句法特征的一个重要指标。句子长度在一定程度上反映了句子复杂程度 [39]。利用Wordless进行句长统计,并计算出标准差和方差,结果如表4所示。

Table 4. Distribution of sentence length of two translations

表4. 两译本句长分布情况表

已有学者通过考察英汉双语平行语料库中不同译本的词语数目变化,发现无论英汉还是汉英,译文字数都比原文多 [40]。本研究利用Wordless得出两个译本的平均句长,从表4可以看出,孙译句长明显高于许译。许译的标准差低于孙译,说明句子长度比较平均,无两极情况出现,既不存在特长句,也不存在特短句。此外,许译的方差明显低于孙译,说明许译句子长度波动情况不大。平均句长、标准差、方差这三个维度均体现了许译的句子结构更易为读者接受。

3.2.2. 指称衔接

非文学类文本的衔接方式主要有指称衔接(referential cohesion)、逻辑衔接(logical cohesion)和词汇衔接(lexical cohesion)三种 [41]。代词是指称衔接中一种重要的方式,是促使语义连贯的保证。利用Wordless的检索功能,可以得到所有人称代词的使用情况继而可以计算出代词密度,将其汇总,得到表5

Table 5. Distribution of pronouns of two translations

表5. 两译本中代词分布情况

表5可知,两位译者在翻译时对人称代词的偏好不同。孙译中更偏向使用第三人称代词(4.26%),而许译中第二人称代词使用的更多(1.72%)。

例(1) It had been separated from the Qin terrain.

例(2) In the west, it connected Noble White Alp with a bird’s

例(3) When will you come back from this journey to the west?

例(4) How can you climb up dangerous path and mountain crest?

例(1)~例(2)选自孙译,两处“it”均指代“蜀道”,译者并没有连续使用path、road这类词,避免了译文中词汇的重复,符合英语的表达习惯。例(3)~例(4)选自许译,原文说话对象暗含在文中,而许渊冲通过增补“you”将其显现出来,目的语读者能够对此有更清楚的轮廓,也拉近了诗歌与读者之间的距离。但值得一提的是,即使两位译者对于人称代词的使用数目有差异,但是两位译者均实现了语义衔接。

3.3. 语篇层面

研究者较多采用的文本可读性计算方法有Automated Readability Index、Coleman-Liau Index、Flesch Reading Ease、Devereaux Readability Index、Flesch-Kincaid Grade Level、FORCAST Grade Level、Gunning Fog Index、SMOG Grade、Spache Grade Level等。这些方法均可用来检测文本的阅读简易度以及需要的教育水平高低。这些计算结果与阅读难度、需要的教育水平成反比例关系,即阅读简易度越高,阅读难度越低,需要的教育水平度就越低。本研究利用Wordless得出两个译本的上述多种文本可读性结果,见表6

Table 6. Several readability indexes of two translations

表6. 两译本可读性结果

表6中的数据不难看出,无论是自动化可读性指数(Automated Readability Index)、弗莱什阅读难度指数(Flesch Reading Ease)还是科尔曼·廖指数(Coleman-Liau Index)等,都足以体现孙译的阅读难度大于许译,因此受众在阅读孙译时,需要更高的教育背景。因此,在对外传播中华文化时,译者需要充分考虑目的语受众的语言水平。

4. 结论

本研究以孙大雨和许渊冲的英译为例,借助分词软件Sanford Parser,语料库软件UAM Corpus Tool和Wordless,对类符形符比、词汇密度、高频词三个方面的词汇特征、句长分布、指称衔接两个方面的句法特征和译本可读性与难度的语篇层面进行比较和分析,研究发现:1) 在词汇层面,许译的类符形符比、词汇密度大于孙译,许译词汇丰富程度更高,承载的信息更加丰富,两译本中虚词的数量均大于实词。2) 在句子层面,平均句长、标准差、方差这三个维度均表明许译句长比较平均;两译本中并列结构也较多使用,均使用了指称衔接的手段。3) 在语篇层面,孙译的阅读难度大于许译。4) 重视诗歌翻译、研究目标受众特点、拓展传播渠道,凸显中国文化的博大精深与现实价值。因此,诗歌必将成为传播中华文化、塑造国家形象的窗口。

5. 启示

诗歌由于受到内容、受众、传播渠道等方面的限制,要比其他文学类作品出海难度更大,基于上述分析与讨论,在对外传播中国诗歌时,可以参考以下几点启示。

1) 高度重视诗歌翻译。对外传播中国古典诗歌,实质上对外传播的是诗歌的译文。好的译文,是国外读者准确理解、把握诗歌内容的关键。译者只有消除诗歌中的文化屏障,才能促使中华文化海外传播扎根。

2) 研究目标受众特点。通过对比孙译和许译,不难看出许译不论从词汇密度还是阅读难度都更适合国外读者。因此,译者在翻译这些作品时,需要站在目标受众的角度思考,使海外受众能够加深对中国文化的了解。

3) 拓展传播渠道。随着数字化深入人心,仅凭纸质书籍译本传播中华文化远远不够,因此需要利用多种渠道,如当地学会与中国相关学会合作举办作品展、将文学与其他形式结合起来,使中华文化出海行稳致远。

参考文献

[1] Baker, M. (1993) Corpus Linguistics and Translation Studies: Implications and Applications. In: Baker, M., et al., Eds., Text and Technology: In Honour of John Sinclair, John Benjamins, Amsterdam & Philadelphia, 233.
https://doi.org/10.1075/z.64.15bak
[2] Maia, B. (2003) Some Languages Are More Equal than Others: Training Translators in Terminology and Information Retrieval Using Comparable and Parallel Corpora. St. Jerome, Manchester, 43-53.
[3] Zanettin, F. (2009) Designing an English Italian Translational Corpus. World Publishing Corporation, Beijing, 329-343.
[4] 梁茂成, 许家金. 双语语料库建设中元信息的添加和段落与句子的两极对齐[J]. 中国外语, 2012, 9(6): 37-42.
[5] 李文, 杨炳钧. 现代医学英语书面语语料库建设及其意义[J]. 外语教学, 2018, 39(5): 26-30.
[6] Olohan, M. (2004) Introducing Corpora in Translation Studies. Routledge, Abingdon.
https://doi.org/10.4324/9780203640005
[7] Marais, J. and Naude, J.A. (2007) Collocations in Popular Religious Literature: An Analysis in Corpus-Based Translation Studies. Southern African Linguistics and Applied Language Studies, 25, 153-167.
https://doi.org/10.2989/16073610709486454
[8] 朱慧芬, 黎昌抱. 基于语料库的旅游景点解说牌示英译语言特征研究[J]. 当代外语研究, 2018(2): 74-78+110.
[9] 庞双子. 翻译文本的语体特征——多维度语料库考察[J]. 上海翻译, 2020(6): 29-34.
[10] Baker, M. (2000) Towards a Methodology for Investigating the Style of a Literary Translator. Target, 12, 241-266.
https://doi.org/10.1075/target.12.2.04bak
[11] Bosseaux, C. (2006) Who’s Afraid of Virginia Woolf? A Cor-pus-Based Study of the French Translations of the Waves. Meta, 51, 599-610.
https://doi.org/10.7202/013565ar
[12] 刘爱军. 基于语料库的译者风格比较研究——以朱自清散文英译为例[J]. 外语电化教学, 2020(4): 101-105+16.
[13] 张继东, 朱亚菲. 胡塞尼小说译者风格对比——平行语料库视角[J]. 外国语(上海外国语大学学报), 2021, 44(5): 102-114.
[14] Puurintinen, T. (2004) Exolicitation of Clausal Relations: A Corpus-Based Analysis of Clause Connectives in Translated and Noun-Translated Finnish Children’s Literature. John Benjamins, Amsterdam, 165-176.
https://doi.org/10.1075/btl.48.13puu
[15] Munday, J. (2012) Evaluation in Translation: A Study of Critical Points in Translator Decision-Making. Routledge, London.
[16] 张继光, 张政. 基于语料库的当代英语散文汉译规范研究[J]. 外语教学理论与实践, 2014(4): 83-91+95.
[17] 黄立鹤, 吴贇. 基于贴真体验与建模的多模态口译教学语料库构建及应用[J]. 外语教学理论与实践, 2021(4): 127-136.
[18] 赵政廷, 柴明颎. 技术时代面向语言服务市场的语料库笔译教学模式研究——基于“译学家”语料库翻译教学平台的教学案例分析[J]. 外语电化教学, 2021(5): 88-95+13.
[19] 刘秉栋, 曹灵美. 基于语料库的本科生翻译课程教学模式建构研究[J]. 外语电化教学, 2021(5): 68-73+10.
[20] Gumul, E. (2006) Explicitation in Simultaneous Interpreting: A Strategy or a Byproduct of Language Mediation. Across Languages and Cultures, 7, 171-190.
https://doi.org/10.1556/Acr.7.2006.2.2
[21] Douflou, V. (2007) Norm Research in Conference Interpreting: How Can the Study of Documentary Sources Contribute to a Better Understanding of Norms. Proceedings of the Marie Curie Euroconferences MuTra: LSP Translation Scenarios, Vienna, 30 April-4 May 2007, 41-54.
[22] 符荣波, 王克非. 基于跨模式类比语料库的汉英口译词汇特征研究[J]. 外语教学与研究, 2021, 53(6): 912-923+961.
[23] 徐翠, 李德超. 同传专业译员预制语块使用特征: 基于语料库的对比研究[J]. 外语教学与研究, 2021, 53(4): 582-593+640.
[24] 杨惠中. 语料库语言学与机器翻译[J]. 上海交通大学学报(社会科学版), 1993(1): 98-111.
[25] 刘海涛, 方昱. 忠实原则与诗歌翻译的风格变异: 以《飞鸟集》三个译本为例[J]. 浙江大学学报(人文社会科学版), 2017, 47(4): 89-103.
[26] 高博. 仓央嘉措诗歌两个英译本的译者风格对比研究——基于语料库的分析[J]. 民族翻译, 2018(4): 5-13.
[27] 张嘉伟, 刘越莲. 基于可比语料库的“悲伤”情绪隐/转喻对比研究——以歌德和李白诗歌为例[J]. 外语教学, 2018, 39(4): 46-51.
[28] 谢建文, 傅舒婷. 基于语料库的王家新与策兰诗歌语言研究[J]. 外语电化教学, 2020(5): 37-44+6.
[29] 张广法, 文军. 汉语古诗英译策略体系之动态性研究——以理雅各译《诗经》为例[J]. 外国语文, 2021, 37(1): 95-104.
[30] 马会娟, 王越. 国家机构赞助下的艾黎英译李白诗歌研究[J]. 北京第二外国语学院学报, 2018, 40(5): 54-69.
[31] 张淑静. 李白诗歌英译信息适合度的文本比较研究[J]. 河南师范大学学报(哲学社会科学版), 2019, 46(6): 134-138.
[32] 廖志勤. 小畑译《李白诗集》深度翻译的“多元因果”论视角解读[J]. 外语学刊, 2021(2): 107-111.
[33] 余霞, 王维民. 诗歌翻译中意象的语义场视角阐释——兼析李白《月下独酌》四种英文译本[J]. 西南交通大学学报(社会科学版), 2021, 22(3): 66-73.
[34] 孙大雨. 古诗文英译集[M]. 上海: 上海外语教育出版社, 2003.
[35] 许渊冲. 唐诗三百首(汉英对照) [M]. 北京: 五洲传播出版社, 2012.
[36] 胡壮麟. 语言学教程(修订版中译本) [M]. 北京: 北京大学出版社, 2002.
[37] Ure, J. (1971) Lexical Density and Register Differentiation. Cambridge University Press, Cam-bridge.
[38] Baker, M. (1995) Corpora in Translation Studies: An Overview and Some Suggestions for Future Re-search. Target, 7, 223-243.
https://doi.org/10.1075/target.7.2.03bak
[39] 杨惠中. 语料库语言学导论[M]. 上海: 上海外语教育出版社, 2002.
[40] 秦洪武, 王克非. 基于对应语料库的英译汉语言特征分析[J]. 外语教学与研究, 2009, 41(2): 131-136+161.
[41] 陈宏薇. 高级汉英翻译[M]. 北京: 外语教学与研究出版社, 2009: 183.