1. 引言
《瓦尔登湖》(Walden)是美国著名作家和哲学家,超验主义代表人物亨利·戴维·梭罗(Henry David Thoreau)所著的一本著名散文集,在美国文学中被公认为是最受读者欢迎的非虚构作品。本书出版于1854年,首次出版时题为《瓦尔登,或林中生活》(Walden; or, Life in the Woods),书中详细描述了梭罗在美国马萨诸塞州康科德镇瓦尔登湖畔一片再生林中度过两年又两个月零两天的独处生活,以及在此期间的种种思考。该湖位于康科德镇东部,距离梭罗的家不远。梭罗将这段经历称为对简朴隐居生活的一次尝试。《瓦尔登湖》由18篇散文组成,围绕四季变换的自然景象,深刻描绘了梭罗内心的渴望、矛盾、失落与自我调适的过程。在经历了不断地调整与反思后,作者的内心逐渐产生复杂的情感波动,并在这种反复的心路历程中,逐步接近自己的目标。这一持续不断地循环不仅体现了梭罗对个人极限,乃至人类界限的挑战,也展现了他在面对困境时的恢复与重生的力量。这种挑战不仅是对实现个人理想的追求,更是对自我与生命力量的深刻探索。
2. 文献综述
现有的《瓦尔登湖》译本研究体系主要分为两大类:一是针对单个译本的语言风格进行研究,主要从修辞,语篇的衔接与连贯以及相关翻译理论的角度对汉译本进行分析;二是多译本间的对照研究,主要以基于语料库的译者风格研究为主,研究者通过语料库平台,从类符–形符比、四字词语使用率及平均句长等指标对不同译本进行分析,从而探讨不同译者在翻译过程中的不同取向。
胡亮(2017)从修辞的角度,对《瓦尔登湖》英文原作和徐迟译本的语言风格进行了研究,探讨了如何使译本与原作在语言、意象、结构等方面高度契合从而全面再现原作的独特风格[1]。张雨(2018)基于语料库,通过定量与定性相结合的研究方法,选取“一 + 量词”的结构和“被”字句作为研究指标,对《瓦尔登湖》徐迟译本的欧化现象进行了分析[2]。
宋立英(2019)以奈达的功能对等理论为基础,通过对《瓦尔登湖》的两个中文译本进行比较研究,从修辞风格层面的对等对两个译本进行了对比分析,探讨了翻译文本如何在平衡中传达原文的意义和风格[3]。
何英、雷佳娣(2020)从语篇衔接与连贯的视角对《瓦尔登湖》两个中译本进行了对比分析,探讨了译者在翻译过程中如何平衡原文语篇意向和内部逻辑关系,从而使译文在行文结构上通顺连贯[4]。姚树君(2020)借助语料库软件Wordsmith和Paraconc对《瓦尔登湖》的三个中译本进行了客观的分析,主要考察了三个译本的类符–形符比、四字词语使用率、平均句长等指标,分析出三种中文译本所呈现出的不同的译者风格与它们不同的出版时间和背景环境有着密切关系[5]。
郑一菲(2021)通过使用R语言中的quanteda包对《瓦尔登湖》四个中文译本的词汇丰富度、主题词、译本相似度进行了对比分析,进而探讨了四个译本间的相似之处及存在的差异性[6]。
尽管目前已有一些基于语料库的《瓦尔登湖》译本对比研究,但这些研究往往是分别对不同译本提取一些传统的语料库指标后再进行对比。这样的研究方法对于揭示译本复杂的语言特征及探究不同译本间的风格差异而言都很有限,少有研究全面采用语料库翻译学的相关指标,如词汇丰富度R1指标,标准化类符形符比等从词法和句法层面系统地分析不同译本间的风格差异。而通过计量方法统计不同译本的词汇频率分布、词汇多样性和句子结构以及相关数据的显著性水平,就可以对不同译本的语言结构和语言变化作较为全面的分析,从而全面反映不同译者的风格特征及译本之间的语言风格差异。
3. 研究准备
3.1. 译本选择
《瓦尔登湖》在中国最早的译本由著名诗人、散文家与翻译家徐迟翻译并于1949年出版,徐迟先生在初版33年后的1982年重新进行校译并交付上海译文出版社出版。20世纪90年代成为该书翻译出版的复苏期。1996年生活·读书·新知三联书店出版的《梭罗集》中包含许崇信、林木椿的合译本。21世纪以来《瓦尔登湖》在中国的翻译出版达到高峰,译本多达26种,背后的译者包括潘庆舲、林志豪、许崇信、苏福忠、戴欢等资深翻译家。
本研究选定了四个译本(表1),分别为2010年上海译文出版社出版的潘庆舲译本(潘译本)、2013年天津人民出版社出版的李继宏译本(李译本)、2018年人民文学出版社出版的徐迟译本(徐译本)、2019年中信出版集团出版的王家新译本(王译本)。译本选择的理由是:徐译本是《瓦尔登湖》最早的中文译本,也是最受读者欢迎和市场认可的译本之一。剩下三个译本的翻译时间都为21世纪以后,可以进行较好的参照。潘译本和徐译本都被不同的出版社多次出版,拥有良好的口碑。从读者评价来看,李继宏译本文笔优美,和原作风格较匹配,而王家新译本则为近年来销量和口碑都不错的一个译本。综上所述,在考虑了译文质量和译者水准等多方面因素后选择这四个译本。
Table 1. Publication information of translations
表1. 译本出版信息
译者 |
出版年份 |
出版社 |
潘庆舲 |
2010 |
上海译本出版社 |
李继宏 |
2013 |
天津人民出版社 |
徐迟 |
2018 |
人民文学出版社 |
王家新 |
2019 |
中信出版集团 |
3.2. 研究方法
一些学者认为,传统语料库软件的统计结果更能反映翻译文本中的共性。与传统的语料库分析方法相比,本研究采用了一种计算文体学的方法,这种方法建立在传统语料库软件(如Wordsmith、AntConc)的基础上,提供了对文本词汇、句式、语法和话语等方面更详细的描述。换句话说,计算文体学比传统的语料库分析更加灵活和精确,允许研究者根据特定的研究需要进行分析和计算。
本文对《瓦尔登湖》的四种中文翻译进行了词语分割和词性标注处理,从处理后的文本中创建了一个小语料库。然后,它对词汇出现频率进行排名,计算词汇丰富度。使用Python计算不同中文翻译中的总句数、平均句长、每句词数以及句子分布情况。
本文基于潘庆舲、李继宏、徐迟和王家新的《瓦尔登湖》翻译,采用语料库方法从词汇丰富度、句子分布、文本活跃度、文本相似度和词云等方面对四个中文译本进行了比较研究。
3.3. 研究工具
本研究利用Python中的NLTK (自然语言工具包)和PyNLPIR包进行语料库分析。NLTK是Python解释器环境中用于自然语言处理的非常流行的工具包。它为50多种语料库和词汇资源(如WordNet)提供了易于使用的接口,以及一套用于分类、分词、词干提取、词性标注、解析和语义推理的文本处理库,另外还包括工业级NLP库的封装器。对于NLTK的用户来说,它就像是一名极其高效的语言学家,能够快速地对自然语言文本进行深入处理和分析。
PyNLPIR是NLPIR/ICTCLAS中文分词软件的Python封装器。NLPIR中文分词系统(也称为ICTCLAS2013)主要包括中文分词、词性标注、命名实体识别和用户词典功能等特点。NLPIR分词系统的前身是2000年发布的ICTCLAS词汇分析系统。从2009年开始,为了与之前的工作有明显的区别并推广NLPIR自然语言处理和信息检索共享平台,将其更名为NLPIR分词系统。
英文语料库的处理使用Python中的自然语言工具包(NLTK),而中文语料库则使用中国科学院的NLPIR中文分词系统的Python封装器PyNLPIR进行处理。然后,使用AntConc软件计算原文、翻译文本和每个子语料库中每个词性的出现次数。
4. 研究过程
4.1. 词汇丰富度对比
在文学作品中,词汇丰富度指的是作者或译者使用的词汇的多样性和丰富性。文本中词汇重复率越低,作者所作的词汇选择范围就越广。相反,词汇丰富度值越低,说明文本中的词汇重复性越高,单调乏味。
研究词汇丰富度有几种方法,例如标准化类符形符比(STTR)、h点、熵和文本Lambda值。本文采用标准化类符形符比和h点作为指标,来检验文本的词汇丰富度。
h点是文本中词汇在秩频分布中的临界点。h点之前的词汇主要是功能词,而之后的词汇主要是实词。因此,h点值越低,文本的词汇丰富度越高。其计算公式为:
类符、形符和类符形符比是分析译者风格的重要指标。一个类符指的是文本中唯一形符的数量,意味着在同一文本中多次出现的形符只计算为一个类型。因此,类符形符比是检查文本词汇丰富程度最直观的方法。
简单来说,一个类符指的是文本中独特词汇的数量,而一个形符指的是文本中的总词数,包括重复的词汇。类符形符比是衡量文本词汇多样性的指标,较高的比率表示词汇更丰富。在翻译研究中,这尤为重要,因为它可以揭示译者在选择词汇时的倾向和风格。
类符形符比(TTR)用于衡量文本词汇的复杂性。它是通过将文本中唯一词汇的数量除以文本中的总词数来计算的。其公式如下:
为了使TTR值具有可比性,使计算结果更加标准,引入了标准化类符形符比(STTR)的概念。STTR (Standard Type-Token Ratio)是对TTR的计算进行标准化。方法是先计算每n个词的TTR值之后,再对得到的所有TTR取平均值,最终得到的结果就是该文本的STTR值,计算公式如下,其中j是文本根据n个词为一组进行分割得到的组数。
使用Python和QUITA软件对《瓦尔登湖》的四个中译本进行分析,得出每个译本的类符、形符、句子总数和h点,结果如表2所示。
Table 2. Lexical richness of the original text and four Chinese translations
表2. 原文及四个中译本词汇丰富度
|
类符 |
形符 |
句子数 |
STTR |
h-Point |
原文 |
11,368 |
117,316 |
4001 |
0.455 |
11.7 |
潘译本 |
20,274 |
22,965 |
4381 |
0.883 |
20 |
李译本 |
24,495 |
28,438 |
5387 |
0.861 |
17 |
徐译本 |
18,559 |
19,978 |
4105 |
0.929 |
12.5 |
王译本 |
18,420 |
19,912 |
4490 |
0.925 |
12 |
根据表2所示的词汇丰富度数据分析,首先可以通过对类符(词汇类型)和形符(词形出现的次数)的统计进行对比,来反映不同译本的词汇多样性和重复使用情况。通过对每个译本的句子数量(即文章结构复杂性)进行比较,可以进一步探讨每个译本的句子结构特征,以及其对词汇使用的影响。
在数据分析的过程中,首先注意到潘庆舲和李继宏的译本在类符数和形符数上明显高于其他译本。这反映出他们译本中包含了更多的词汇元素,表明这些译本具有较高的语言丰富性。然而,李译本的标准化类符形符比(STTR)相对较低(0.861),这表明尽管它包含了大量的词汇,词汇的变异性较小,重复使用的词汇较多,导致了相对较低的词汇多样性。
徐译本在类符和形符的数量上并不突出,但其标准化类符形符比(0.929)最高,表明其词汇在使用上具有较高的多样性。结合其句子数量的较少,这进一步支持了徐译本较长的平均句长和词汇使用的变异性较大。从这点来看,徐译本较为精简,且更倾向于使用不同的表达方式,使其在保持语义准确性的同时,避免了原文的重复性。
在王译本方面,类符数和形符数接近于徐译本,但它的标准化类符形符比为0.925,紧随其后,显示出较好的词汇多样性。
综上所述,徐迟和王家新的译本相较于潘庆舲和李继宏译本更具词汇多样性,使用了更多不同的词汇,并且较少依赖重复的词汇。翻译的策略可能受到原文语言风格的制约,但同时也表明译者在传达原文信息的基础上,保持了对读者的较好阅读体验。
此外,通过计算h点,即《瓦尔登湖》四个中译本中词汇在秩频分布中的临界点,从表2中可以观察到,潘庆舲和李继宏译本具有相对较高的h点,而徐迟和王家新的译本则具有较低的h点。这表明徐迟和王家新译本的词汇更丰富,使用重复词汇较少。翻译受限于原文的语言和风格,因此译者在保持自己的创作空间的同时,不能过度偏离原文。从词汇的角度看,徐迟和王家新的翻译与其他两种翻译相比使用了更多样化的词汇,为读者提供了更好的阅读体验。
4.2. R1指标
本研究还选取计量语言学中的
指标来衡量各个译本的词汇丰富度。在中文中,实词包括名词、动词、形容词和数词,这些是具有稳定含义的词类。实词的累积概率分布代表了词汇丰富度,被称为
指标。首先建立原文和四种中文译本的秩频分布表。让
表示频率排名,
表示一个词的出现频率。点
是在秩频分布中的临界点,在此之前的词大多是功能词,而在此之后的词主要是实词。从频序1到
的词所累积的概率,表示为
,用于计算功能词在文本中总词数中的比例。然而,由于主题的变化,实词也可能出现在点
之前。因此,需要进行校正,校正后公式如下(其中
是文本中形式符号的总数):
因此,较大的R1值表示翻译中实词的使用更为丰富。
Table 3. R1 index and lexical richness of the original text and four Chinese translations
表3. 原文及四个中译本R1指标及词汇丰富度
|
原文 |
潘译本 |
李译本 |
徐译本 |
王译本 |
h-Point |
11.7 |
20 |
17 |
12.5 |
12 |
R1 |
0.502 |
0.976 |
0.981 |
0.914 |
0.991 |
从表3可以推断,与原文相比,四个中文译本的词汇丰富度R1指标存在差异。潘译本的R1指标为0.976,李译本为0.981,徐译本为0.914,王译本为0.991。这表明王译本相比其他三个译本使用了更加多样化的实词,而徐译本具有最低的R1值,表明其使用的实词种类较少。原文的R1指标为0.502。由于日耳曼语系和汉藏语系之间的基本差异,汉语在功能词和实词方面与英语不同,导致四个译本的R1指标均显著高于英文原文。然而,徐译本在词汇丰富度上最接近原文,这意味着徐译本在尽量保留原文语言结构的同时,实词的使用较为适中,没有过多的增加或减少,显示出其翻译策略在词汇丰富度上更加贴近原文。
4.3. 句子离散度
句子离散度的高低可以反映出文本的节奏、韵律感的强弱。句子离散度
的计算公式如下,其中
为总句子数,
为平均句长,
为文本中每个单独句子的句长。
句子离散度指的是文本中句子与平均句子长度的偏离程度,文本句子离散程度小,则文本阅读时更平缓、更加有韵律感;相反,文本中句子离散程度大时,阅读文本的感受便会更加有高低起伏之感。
Table 4. Sentence discreteness of the four chinese translations
表4. 四个中译本句子离散度
|
潘译本 |
李译本 |
徐译本 |
王译本 |
D |
28.73 |
28.88 |
29.31 |
23.56 |
从表4中可以看出,徐译本的句子离散度最高,达到了29.31,显示出其在句子长度上的差异性最大。可以推测,徐译本使用了更多长短句交替的句式,使得文章的节奏感更为丰富和多变。这种设计使得文本在叙事过程中更加充满张力和节奏感,能够有效吸引读者的注意力,并提升文本的表现力。
潘译本与李译本的句子离散度相差较小,分别为28.73和28.88,表明这两个译本在句子长度上的变异性较为相似。尽管它们的句子长度差异略小于徐译本,但仍然具有较强的节奏感。相比之下,王译本的句子离散度仅为23.56,远低于其他三个译本。这意味着王译本的句子长度较为均衡,句子之间的差异较小,文章的节奏显得较为平稳,缺少较强的起伏感。此类设计可能给人一种较为平缓、流畅的阅读体验,但缺少一定的戏剧性和紧张感。徐译本、潘译本和李译本相较于王译本文本更加有节奏感,使用的句子长度区分度较大。这样的文本通常叙事更加有激情,容易调动读者的阅读兴趣,阅读时更有抑扬顿挫之感。王译本的句子相对较短,文章节奏平流缓进,阅读起来更加有韵律感。
综上所述,表4的数据分析显示,不同的句子离散度反映了译者在句子结构安排上的不同策略。徐译本通过更高的句子离散度制造了更强的节奏感和情感起伏,而王译本则采用了较为平稳的句子结构,带来更为舒缓的阅读体验。潘译本和李译本则在句子设计上介于两者之间,呈现出一定的节奏感,但没有达到徐译本的高度变异性。每种设计都可能为读者提供不同的阅读体验和情感效果,进一步体现出译者在翻译过程中对语言节奏的不同处理方式。
4.4. 文本活动度
文本活动度早期主要被应用于心理学和语言学中,用来研究文本特征、文体风格及人物特征,而且能描述文本中两种力量之间的互动情况,每种文体都有其独特的写作方式和侧重点。例如,新闻报道以事实记录为主,小说则侧重故事情节的讲述。通常来看,动词主要反映文本的活动度,形容词反映文本的描写度。文本的活动度为该文本中动词的形符数与动词和形容词型符总和之比。文本的活动度(Q值)介于0~1之间,若Q值大于0.5,则表示文本为活跃性文本(active),注重对动作的记叙和故事情节的叙述;反之,则表示文本为描述性文本(descriptive),注重对情节的描写。
从公式中可以看出,文本中描写动作的场景和情节叙述越多,文本活动度越高;而对事物和状态进行描写的场景越多,文本活跃度更低。文本活跃度用公式表示如下:
Table 5. Text activity of the original text and four Chinese translations
表5. 原文及四个中译本文本活动度
|
原文 |
潘译本 |
李译本 |
徐译本 |
王译本 |
Q |
0.6724 |
0.8562 |
0.8578 |
0.8449 |
0.8370 |
V (动词) |
18,786 |
24,338 |
28,838 |
22,398 |
21,902 |
A (形容词) |
9153 |
4087 |
4782 |
4112 |
4266 |
总词数 |
132,466 |
147,240 |
180,006 |
138,279 |
133,380 |
如表5所示,四个中文译本的活动度均超过了0.6,由此可见都为活跃性文本。其中潘译本和李译本的活动度相对较高,分别达到0.8562和0.8578,均高于0.85,说明这两个译本在动词和形容词的使用上较为突出,强调了动作和描写的活跃性,可能表现在对场景的细致描写以及较多的动作描写上。其次,徐译本的活动度达到0.8449,仍然较高,但略低于潘译本和李译本,这表明徐译本虽然注重动作场景的呈现,但在描写性方面可能稍逊一筹。王译本的活动度最低,为0.8370,表明其译文在动作和情节推进方面的活跃性较为平衡,但略显平淡。
与之对比,《瓦尔登湖》原文的文本活动度只有0.6724,明显低于所有译本,这一差距反映了原文在语言表达上更侧重于描述性内容,尤其是静态场景的描写。梭罗的写作风格本身较为细腻且富有哲理,注重对自然景观和内心世界的刻画,这导致其文本的动词和形容词使用较少,活动度较低。原文的低活动度可能与英语语言本身的静态性以及梭罗的文学风格有关,英语在表达静态情境时往往不如汉语那样依赖于动词。
结合表中的动词(V)和形容词(A)使用数量,可以进一步得出结论。四个译本中,李译本使用的动词数量最多(28,838),且其活动度最高,可能说明李译本更注重动态场景的刻画,倾向于使用更多动词以推动情节。潘译本和徐译本的动词使用也较为丰富,动词数量分别为24,338和22,398,说明它们在动词的使用上也有较高的活跃度。王译本虽然动词数量为21,902,相对较少,但其仍保持较高的活动度,表明其在翻译时可能更加注重情节与描述的平衡。
综上所述,从文本活动度的角度来看,四个中文译本相较于原文更注重情节发展和动态场景的呈现,在翻译时对动词和形容词的使用更加频繁。潘译本和李译本在活动度上表现较高,可能更加侧重于动作性和情节推进,而徐译本和王译本则在平衡描述性和动作性上略有不同,王译本的活动度最低,可能呈现出更多的平稳叙事。
4.5. 文本相似度
本研究使用Python对四种中译本之间的整体相似性进行了统计分析。结果如表6所示。
Table 6. Comparison of overall similarity of the translations
表6. 译本总体相似度对比
|
潘译本 |
李译本 |
徐译本 |
王译本 |
潘译本 |
1 |
|
|
|
李译本 |
0.908 |
1 |
|
|
徐译本 |
0.928 |
0.849 |
1 |
|
王译本 |
0.960 |
0.901 |
0.941 |
1 |
如表6所示,首先,李译本与徐译本和王译本相比,显示出较大的差异,其相似度分别为0.849和0.901,这表明李译本在语言使用、词汇选择和句子结构等方面相对独特。李译本与潘译本的相似度为0.908,相对较高,这表明潘译本与李译本在某些方面保持了一定的一致性,但仍有明显的区别。
另一方面,王译本与徐译本和潘译本的相似度较高,分别为0.941和0.960,这表明王译本与这两者在语言风格和词汇使用上的相似性较强。特别是王译本与潘译本之间的相似度最高,达到0.960,显示出这两种译本之间保持了高度一致的翻译策略和表达方式。这种相似度反映了两位译者在语言运用和翻译风格上的共性。
综合来看,可以得出以下结论:在这四种译本中,潘庆舲和王家新的译本相似度最高,表明这两者的翻译风格和语言使用较为一致,体现出较为接近的翻译策略。相对而言,徐迟和李继宏的译本显示出较高的独特性,尤其是与潘庆舲和王家新的译本相比,差异更加明显。这些结论与表3中的R1指标分析一致,进一步验证了徐迟和李继宏译本在词汇使用和语言风格上的独特性,以及潘庆舲和王家新译本在整体翻译风格上的相似性。
4.6. 词云对比
词云是一种直观且清晰的可用于展示关键词频次的分析方法,从内向外分别代表关键词出现频次由高频至低频。根据词云的展示,我们可以直观地观察到原文与四个译本中核心词汇的频率分布。词云通过将出现频率较高的关键词以较大的字体展示,而低频词汇则以较小的字体出现,因此能够有效地展示
Figure 1. Word cloud of the original text
图1. 原文词云
Figure 2. Word cloud of pan’s translation
图2. 潘庆舲译本词云
Figure 3. Word cloud of li’s translation
图3. 李继宏译本词云
Figure 4. Word cloud of xu’s translation
图4. 徐迟译本词云
Figure 5. Word cloud of wang’s translation
图5. 王家新译本词云
出文本中最具代表性的词汇及其频次。以上图1~5为原文及四个译本的词云展示:
从原文的词云中,我们可以看到核心词汇如“man”,“house”,“wood”出现频繁,表明这些词汇在原文中占据了较高的频次,并且是构建主旨内容的关键词。相对来说,功能词的频率较低,突出了实词的作用。
潘译本的词云显示出较为均衡的词汇分布,实词和功能词的比重较为接近。这表明潘译本在忠实于原文的同时,保留了一定的译者创意,使用了较为丰富的词汇来表达原文的思想。李译本的词云表现出一些显著的词汇偏向,某些实词的出现频率较高,如“说”,“人”,“里”等,这表明李译本可能使用了更多简洁直白的语言表达方式,减少了原文中的重复性,并且注重传达原文的核心思想。
徐译本的词云呈现出与李译本相似的趋势,功能词较为突出,表现出一定的简化趋势。词汇的分布较为平衡,表明徐译本在翻译过程中较为保守,尽量保持原文的词汇结构和内容。王译本的词云则展示了更多的核心实词,并且表现出较高的词汇多样性,这与其高R1值相符,表明王家新在翻译时注重扩展词汇的使用,可能采用了更多多样化的表达方式。
总体来看,虽然每种译本在词汇的使用上有所差异,但它们与原文的核心思想和主旨保持了较好的对齐。不同译本之间的词汇使用差异反映了各译者在翻译策略上的不同选择。潘庆舲和王家新译本较为接近,呈现出较高的词汇多样性;而李继宏和徐迟译本则相对较为简洁、简化,保持了与原文在某些方面的一致性。词云的展示进一步验证了表格中词汇丰富度的分析结果,为我们提供了对译本间差异更直观的理解。
5. 结论
本研究基于潘庆舲、李继宏、徐迟、王家新四位译者的《瓦尔登湖》译本,采用语料库方法,从词汇丰富性、句子离散度、文本相似度、文本活跃度、词云五个维度对于四位译者的《瓦尔登湖》译本进行了对比研究。由以上四个维度,可以得出以下推断。
徐译本在词汇丰富度方面表现最佳,平均句长较其他三个译本更长,词汇多样性较其他三种翻译更为丰富,王译本在词汇多样性方面紧随其后,潘译本和李译本的词汇丰富度稍逊于前两者。总的来说,徐迟和王家新的译本相比较潘庆舲和李继宏使用了更多样化的词汇。而徐迟译本的句子离散度最高,表明徐迟译本的句子变化比较大,文章结构富于变化,长短句错落。相比之下,王家新译本的句子离散度最低,表明此译本中句长较短,译者在翻译时多将英文长句进行断句,以控制文章节奏。在文本活动度方面,四个译本中潘庆舲译本和李继宏译本相对较高,而徐迟译本和王家新译本的活动度相对较低,但四个中文译本的文本活动度都明显高于英文原文,这也符合英文是静态的语言多用名词结构而汉语是动态的语言多用动词这一特点。从文本相似度分析结果来看,在这四种译本中,王家新和潘庆舲的译本最相似,表明这两个译本保持了良好的一致性。相比之下,徐迟和李继宏的译本显示出相对较高的独特性。另外在词云维度上,四个译本的差别不大,都较好地还原了原文的主题。这些发现表明,译者在平衡保持原文叙事动态与丰富描述性元素之间,采取了不同的策略。
本次研究通过客观数据对于《瓦尔登湖》进行了多译本研究,为以主观分析为主流的译本对比研究增添了新角度,有利于其他学者继续以语料库的角度进行译本对比研究。未来的翻译学研究可以在本研究的基础上,进一步探讨不同翻译策略对翻译语言特征的影响。研究者可以研究不同翻译方法对忠实度的处理,如字面翻译与更具适应性的翻译策略,如何影响翻译文本的词汇丰富性、句子结构以及整体流畅性。此外,未来的研究可以纳入更多样化的翻译语料库,涵盖不同语言和翻译传统,以揭示跨语言的共性与差异。
另一个潜在的研究方向是结合计算语言学方法与定性分析,以便更深入地探讨翻译中的主观细微差别。这可以通过访谈翻译者或分析他们的翻译笔记,来了解他们的决策过程。最后,将研究范围扩展至更多近期版本的《瓦尔登湖》翻译,有助于我们更好地理解当代语言趋势和翻译理论如何影响经典文学作品的呈现。此类纵向研究将帮助学者洞察翻译实践随时间推移的演变,以及社会文化变迁对翻译决策的影响。