查尔斯·穆勒儒学英译风格研究——基于多维度语言特征的相似度分析
A Study of Charles Muller’s English Translation Style of Confucian Classics—A Multi-Dimensional Similarity Analysis Based on Linguistic Features
摘要: 查尔斯·穆勒是当代儒学与佛教经典英译领域的重要学者,其“四书”译本在英语学术界影响广泛。目前,学界对其译本研究多聚焦于哲学概念的转译,缺乏对整体语言风格的量化考察。随着数字人文的发展,计算语言学为翻译风格研究提供了新路径。本研究以其《论语》《中庸》《大学》《孟子》四部译本为对象,采用描述性统计与相似度计算方法对多维语言特征进行比较分析。结果表明,《论语》《中庸》《孟子》三者语言风格高度相似,而《大学》则在多项指标上呈现显著差异,与其他译本相似度偏低。本研究从计算语言学视角验证了穆勒译本内部的风格结构,为儒学经典英译研究提供了数据支持与方法参考。
Abstract: Charles Muller stands as a prominent figure in the field of English translation for contemporary Confucian and Buddhist classics. His translations of the “Four Books” have exerted substantial influence within the English-speaking academic community. Existing studies on his translations have predominantly focused on the rendering of philosophical concepts, while quantitative investigations into his overall linguistic style remain limited. With the development of digital humanities, computational linguistics has provided new methodological pathways for translation style research. This study takes Charles Muller’s English translations of “The Analects”, “The Doctrine of the Mean”, “The Great Learning”, and “Mencius” as its corpus, and employs descriptive statistics and similarity-calculation methods to conduct a comparative analysis of multiple linguistic features. The results show that “The Analects”, “The Doctrine of the Mean”, and “Mencius” exhibit highly similar stylistic patterns, whereas “The Great Learning” displays significant divergences across several indicators and demonstrates lower similarity with the other texts. From a computational-linguistic perspective, this study reveals the internal stylistic structure of Muller’s translations and provides data-driven evidence and methodological reference for future research on the English translation of Confucian classics.
文章引用:田铭萱. 查尔斯·穆勒儒学英译风格研究——基于多维度语言特征的相似度分析[J]. 现代语言学, 2026, 14(3): 127-135. https://doi.org/10.12677/ml.2026.143205

1. 引言

随着数字人文与语料库翻译学的兴起,基于量化语言特征的译者风格研究已成为重要学术路径。相较于传统的定性分析,计算语言学方法能够通过可度量的指标,客观揭示译本的整体风格结构与内部差异。

查尔斯·穆勒(Charles Muller)作为当代儒学与佛教经典研究领域的重要学者,其翻译的《论语》《中庸》《大学》《孟子》等儒学典籍,以术语一致、语言简洁著称,在英语世界被广泛采用。现有研究多集中于其对“仁”、“礼”等核心概念的诠释策略,而从整体语言风格层面对其译本进行的系统性量化分析尚显不足。

鉴于此,本研究依托计算语言学方法,对穆勒的四部儒学英译本进行多维度考察。通过描述性统计与相似度计算,旨在探究以下问题:1) 穆勒“四书”译本之间在语言风格上存在哪些差异?2) 哪些译本在整体风格上更为接近,其相似性体现在哪些具体维度?本研究试图通过量化分析,揭示穆勒儒学英译的风格特征,为经典翻译研究提供实证案例。

2. 文献综述

2.1. 儒学经典英译研究的总体脉络

儒学经典的英译历史悠久,自十九世纪理雅各(James Legge)首译“四书”以来,西方学者对儒家典籍的理解与转译不断演进。早期英译研究中,部分译者倾向于从宗教化或伦理规范的视角理解儒家经典,语言上偏向维多利亚式书面语;二十世纪后,随着文化翻译理论的发展,相关研究逐渐关注译文在语义表达与文化语境呈现之间的协调关系。Ames与Rosemont (1998)在《论语》译本中强调从概念与思想层面对文本进行解释[1],而刘殿爵(Lau, 1979)则注重忠实与语言自然度的平衡[2]

近年来,学者开始借助语料库方法对儒学经典的英译本进行定量研究。例如,刘榕(2024)通过构建《论语》汉–英平行语料库,对“仁(ren)”的英译策略与认知重构过程进行了系统分析,为儒家核心术语的量化研究提供了新的视角[3];吕鹏飞与陈道胜(2021)则基于小型语料库,从词汇、句法与语篇层面对辜鸿铭和亚瑟·威利两种《论语》译本的译者风格进行了细致比较[4]。尽管已有研究在术语译法与译者风格等维度取得了进展,但针对穆勒译本整体语言风格的系统性语料库分析仍然不足,这也为本文的研究提供了切入点。

2.2. 查尔斯·穆勒译本研究

查尔斯·穆勒自1990年代起在东京大学从事东亚思想研究,并创办“Digital Dictionary of Buddhism (DDB)”与“Chinese Text Project”等大型在线资源,在汉学界具有较高影响力。他在“四书”翻译中强调术语使用的一致性与文本结构的清晰性,其译本因语言简洁、可读性强而被广泛用于西方高校的儒学课程。

现有研究多围绕穆勒译本的思想诠释、术语处理或局部段落的翻译策略展开,总体仍以定性分析为主,对其译文整体语言风格缺乏系统性的量化研究。例如,应熙瑞、王凯(2024)在综述《论语》英译研究的发展时,虽提及穆勒译本与理雅各译本的局部对比,但相关讨论仍局限于思想诠释与术语选择层面[5]。针对这一研究空缺,本文引入计算语言学方法,对穆勒“四书”译本进行多维语言特征的提取与聚类分析,以期为其译本风格的整体性研究提供可量化的证据。

2.3. 计算语言学方法在翻译风格研究中的应用

随着数字人文的发展,计算语言学(Computational Linguistics)逐渐成为翻译风格研究的重要工具。Baker (2000)提出译者风格可通过可度量的语言特征加以揭示,包括词汇密度、功能词分布、句法复杂度与搭配模式等,为译者风格的量化研究提供了方法论基础[6]。此后,Mahlberg (2013)的研究承接了这一范式,她通过分析文本中反复出现的“词丛”及其功能,建立了一套识别与比较作者特征性语言模式的方法,进一步证实了计算语言学在风格研究中的实用价值[7]

在中文语境下,学者们也已广泛采用语料库语言学与计算语言学工具,对经典译本的风格特征进行量化分析。一个颇具代表性的研究是范敏(2016)的《〈论语〉五译本译者风格研究——基于语料库的统计与分析》[8]。该研究通过构建《论语》五个英译本的双语平行语料库,在文化特色词、句子结构等多个维度进行了系统的定量分析,清晰地揭示了不同译者在处理儒家核心概念(如“仁”、“礼”)时所采取的个性化策略,以及由此形成的整体风格差异,为儒家经典英译的译者风格研究提供了扎实的实证范本。

本研究采用语料库翻译研究的基本步骤,对穆勒“四书”译本进行语言特征分析。首先将四部译本文本整理为可处理的电子语料,并在Python环境中通过自动化方式提取多项具有区分度的语言指标。通过对这些特征的综合考察,本文旨在在文本整体层面揭示穆勒译本的风格结构,为儒学英译研究提供可量化的证据。

3. 数据分析与结果

3.1. 语料来源与数据处理

本研究语料为查尔斯·穆勒(Charles Muller)翻译的《论语》(Analects)、《中庸》(Doctrine of the Mean)、《大学》(Great Learning)与《孟子》(Mencius)四部英文译本,文本均来源于其官方网站,原始格式为中英对照。在正式分析前,对原始文件进行了基础清理,仅保留英文译文部分,以确保后续语言特征统计严格基于目标语(英语)文本;清理后的四部译本分别保存为独立纯文本文件,用于自动化处理。在具体指标分析前,有必要对语料规模与基本语言面貌进行整体刻画。图1汇总了7项关键宏观统计量,为后续差异分析提供基础参照。

Figure 1. Macro-feature statistics of the four-muller-translation corpus

1. 四部穆勒译本语料库宏观特征统计

3.2. 语言特征指标

选取变异度较高的7项指标:第一人称比率(34.2%)、词汇丰富度(29.5%)、情态动词密度(12.3%)、连接词密度(10.1%)、重复词型比率(11.7%)、低频词比例(6.8%)、人称代词密度(7.8%) (图2)。

Figure 2. Comparison chart of coefficient of variation for core linguistic feature indicators across multiple texts

2. 多文本核心语言特征指标变异系数对比图

3.3. 语言风格差异的描述性分析

图3所示,四部译本在核心语言特征上呈现出显著的分化趋势。《大学》在多个指标上表现出简化倾向:其实词密度最低(46.88%,低于《论语》的55.61%),平均词长最短(4.18个字母,低于其他三部),反映出用词更基础、抽象程度更低;同时,其情态动词密度(2.74%)和连接词密度(6.98%)虽非绝对最低,但整体处于较低水平,尤其连接词使用显著少于《中庸》(8.06%)。整体而言,《大学》的语言风格更趋简约和程式化。

Figure 3. Comparison table of core linguistic features among the four confucian translations

3. 四部儒学译本核心语言特征对比表

例1:原文:欲修其身者,先正其心;欲正其心者,先诚其意;欲诚其意者,先致其知。

译文:Wishing to cultivate themselves, they first corrected their minds. Wishing to correct their minds, they first made their thoughts sincere. Wishing to make their thoughts sincere, they first extended their knowledge.

该译段由三个结构高度一致的分句构成,穆勒在三个分句中统一采用“Wishing to + V, they first + V-ed”的非限定性动词结构,而未使用英语中更为自然的替代表达方式(如In order to…, To achieve…, one must…等),显示出其在译文中有意维持句法形式的稳定性。这种对特定句式的反复使用,可以从语料库翻译学的角度加以阐释。Mona Baker (1993)提出的“范型化”概念认为,译者常会依赖于目标语中某些典型或简化的句式模式来处理文本,从而形成一种规律性的语言特征[9]

穆勒的这种处理方式,一方面与《大学》原文的纲目体、递进式结构相呼应,另一方面也反映出他在翻译此类文本时,倾向于通过保持句法结构的一致性与词汇选择的稳定性,使译文在形式上更贴近原文。这种风格选择在统计层面表现为词汇更新率偏低、句法模式重复度较高,从而在相似度分析中形成明显的离群特征。

相比之下,《论语》展现出更强的互动性与词汇丰富性。其实词密度最高(55.61%),平均词长最长(4.59),反映了更复杂的词汇选择与信息密度。

例2:原文:子曰:“由!诲女知之乎?知之为知之,不知为不知,是知也。”

译文:The Master said, “You! Should I instruct you in what knowledge is? To know what you know and to know what you do not know—that is true knowledge.”

在此例中,穆勒通过“You!”建立直接呼告,进一步以“Should I…”引出反问结构,显著增强了句子的互动性。破折号的使用加强语义解释,而knowledge、instruct等相对较长、抽象的词汇提升了整体语言复杂度。

从话语功能角度看,译文通过呼告、反问与破折号解释结构,将原文的格言性表达转化为具有对话性与解释性的互动话语。同时,抽象词汇提高了词汇复杂度与信息密度,使该段在统计上表现为较高的实词密度与词汇长度。

《孟子》的整体语言风格更偏向论辩性。其实词密度为48.35%,略低于《论语》,但情态动词密度(2.59%)和连接词密度(7.44%)均处于较高水平,显示出其译文更依赖因果标记、条件结构与抽象名词来推进论证。这构成典型的论辩型特征,与《论语》的对话型风格相比更加侧重推理结构与逻辑展开,而与《大学》的程式化指令风格则差异更加显著。

例3:原文:故曰:求则得之,舍则失之……

译文:Therefore it is said: If you seek it, you will attain it; if you abandon it, you will lose it…—this is simply because he has not fully developed his capacities.

在该例中,穆勒通过明确的逻辑词来加强句子间的语义关系。译文中的Therefore it is said对应原文“故曰”,其中therefore使原本隐含的因果关系更加清晰。在翻译“求则得之,舍则失之”时,译者采用If you seek it…;if you abandon it…的条件句结构,既呼应了原文的对仗句式,又通过第二人称“you”的运用,将一般性论述转化为具有劝诫意味的表达。

此外,译者在句末补充了“this is simply because he has not fully developed his capacities”这一解释性语句,使原文未直接说明的因果逻辑更加清晰。该处理方式既体现了原文格言体的结构特点,也体现出穆勒在译文中倾向于通过使用逻辑词和解释性表达,使论述关系更加清晰的语言特点。

3.4. 相似度分析

图4所示,基于词汇集合的Jaccard相似度结果显示,《大学》与其余三部译本之间的相似度均低于0.14,其中与《中庸》的相似度最低,仅为0.026,呈现出明显的离群特性。相比之下,《论语》与《孟子》的相似度高达0.876,说明两部译本在词汇使用上具有高度一致性。

Figure 4. Jaccard similarity heatmap

4. Jaccard相似度热力图

这一结果在层次聚类分析(图5)中得到了进一步验证:在最小聚类距离处,《大学》首先被单独分离;随后《中庸》独立成类;《论语》与《孟子》则在更高的相似阈值下合并。总体而言,这表明穆勒“四书”译本内部存在显著的风格层级分化。

Figure 5. Hierarchical clustering tree

5. 层次聚类树状图

导致《大学》处于离群位置的关键原因,在于其英文译文呈现高度程式化的“指令式”结构。其语篇主要依赖固定句型反复推进,词汇更新率极低。例如:

  • 原文:古之欲明明德于天下者,先治其国;欲治其国者,先齐其家;欲齐其家者,先修其身。

  • 译文:In ancient times, those who wished to manifest their bright virtue throughout the world first governed their states. Wishing to govern their states, they first regulated their families. Wishing to regulate their families, they first cultivated themselves.

从第二句开始,译文持续采用“Wishing to…,they first…”的分词结构,仅替换核心名词(states, families, themselves),而句法形式、主语结构与语序基本保持不变。穆勒并未通过同义替换(如seek to、aim to)或句式变换来增加表达多样性,而是反复保留wish与first的固定搭配,使语篇在节奏与结构上呈现出明显的一致性。同时,该段译文几乎不使用情态动词(如should,must),也缺乏显性的逻辑连接词(如therefore,thus),语义推进主要依赖结构递进而非逻辑标记。这种句法稳定与词汇保守的组合,使文本的词汇更新率与句法变异度均明显降低,从统计上拉大了《大学》与其他译本之间的语言距离。

与此形成鲜明对比的是,《论语》和《孟子》虽在文体上有所差异,但在功能语言层面展现出高度一致性。两者共同采用第二人称(you)构建互动语境,使用情态动词(should, can)表达规范判断,并以连接词(therefore, if… then…)组织推理结构。例如:

例5. 原文:子曰:“由!诲女知之乎?知之为知之,不知为不知,是知也。”

译文:The Master said, “You! Should I instruct you in what knowledge is? To know what you know and to know what you do not know—that is true knowledge.”

例6. 原文:故曰:求则得之,舍则失之。或相倍蓰而无算者,不能尽其才者也。

译文:Therefore it is said: If you seek it, you will attain it; if you abandon it, you will lose it. There are cases where one person’s attainment is many times greater than another’s—this is simply because he has not fully developed his capacities.

两段译文均呈现出强烈的互动性与论辩性。《论语》以呼告(You!)和反问句营造对话语境,而《孟子》则通过因果标记therefore与条件句式if you… you will…构建推理过程。这些高频共现的功能性词汇(如you,should,therefore,seek,attain)在两部译本中形成稳定的语言模式,从而显著提高其Jaccard相似度。

综上,相似度分析不仅量化了译本之间的语言风格距离,也揭示了穆勒“四书”译本内部的风格结构:《大学》呈现高度程式化的指令型语言风格;《论语》《中庸》《孟子》则因共享互动性与论述性特征而呈现较高相似性,其中《论语》与《孟子》最为接近。这一差异在词汇更新率、人称使用、情态动词分布和句法构式等多个维度上协同体现,构成了穆勒儒学译本内部风格分化的坚实语言基础。

上述特征既受源语文体影响,也反映了译者个人的风格倾向。《论语》原文为语录体,对话性强,因此第二人称与反问结构在译文中的出现具有明显的源语诱发性;《孟子》原文以论辩见长,译文中的逻辑连接与条件句式也与原文的论证结构相呼应。然而,穆勒在两部性质不同的文本中持续使用should,therefore,if… then…等功能词,并频繁采用解释性补充,这种跨文本重复出现的语言模式,体现出译者一定的个人习惯,并非完全由原文决定。

正是这些在不同文本中反复出现的功能性词汇与句法模式,在词汇集合层面形成了稳定的共现关系,从而提高了《论语》与《孟子》的风格相似度,也体现出穆勒译本在互动性与论述性表达方面的相对一致性。

4. 结论

本研究基于计算语言学方法,对穆勒“四书”英译本的语言风格进行了量化考察。通过多维度特征提取、描述性统计和文本相似度计算,揭示了各译本在风格上的内在结构。研究发现,《论语》《中庸》《孟子》在词汇密度、句法组织、人称使用和功能词分布等方面呈现高度趋同,形成较为一致的互动–论述型风格;而《大学》则因大量采用程式化句式、词汇重复率较高、功能词使用有限,在多项指标上与其他译本明显分离,呈现出独特的指令式结构。

在对四部译本进行多维语言特征比较的基础上,可以进一步从风格归因角度区分源语文体影响与译者个人语言习惯。整体来看,穆勒译本的语言差异很大程度上受到原文文体结构的制约。《大学》原文呈纲目式递进结构,句式高度重复、语义推进呈程序化展开,穆勒在译文中较为忠实地保留了这种结构特征,因此形成以固定句式循环、词汇更新率较低为主要表现的程式化语言风格。相比之下,《论语》以语录体为主,原文具有明显的对话性,这在译文中表现为较高频率的第二人称指向与教学式反问结构;《孟子》原文重在论辩与推理,其译文相应呈现出较为密集的逻辑连接与条件句式。这些差异表明,不同译本之间的语言分化首先具有明显的源语诱发性。

然而,在源语差异之外,穆勒在四部文本中仍表现出若干相对稳定的语言选择。具体而言,其译文普遍倾向于使用显性逻辑标记(如therefore,thus,if… then…)来强化语义关系,通过情态动词(should, can)表达规范性或推论性判断,并在关键论述位置采用解释性扩展结构(如this is because…)以提高语义清晰度。此外,穆勒在句法组织上偏好结构工整,较少使用倒装或复杂嵌套句式,这种句法上的稳定性在不同文本中均有所体现。

本研究从计算语言学视角验证了穆勒译本内部的风格分化,并为儒学英译的风格研究提供了可量化的实证支持。当然,本文仅以“四书”为语料,样本规模有限,结论的普遍性仍需在未来通过扩展文本范围加以检验。然而,研究结果也表明,即便在语料规模较小的条件下,只要选取具有区分度的语言特征并采用适宜的统计方法,仍能够有效识别译本间的系统性差异,为小规模语料条件下的译者风格研究提供了可操作的量化分析路径。

参考文献

[1] Ames, R.T. and Rosemont Jr., H. (1998) The Analects of Confucius: A Philosophical Translation. Ballantine Books.
[2] Lau, D.C. (1979) Confucius: The Analects. Penguin Classics.
[3] 刘榕. 基于平行语料库的《论语》“仁”英译研究[J]. 外语电化教学, 2024(1): 45-53.
[4] 吕鹏飞, 陈道胜. 基于小型语料库的《论语》两译本译者风格对比研究[J]. 外语与翻译, 2021(3): 67-75.
[5] 应熙瑞, 王凯. 数字人文视域下《论语》英译研究[J]. 现代语言学, 2024, 12(1): 9-14.
[6] Baker, M. (2000) Linguistic Perspectives on Translation Style. Target, 12, 241-266.
[7] Mahlberg, M. (2013) Corpus Stylistics and Dickens’s Fiction. Routledge. [Google Scholar] [CrossRef
[8] 范敏. 《论语》五译本译者风格研究——基于语料库的统计与分析[J]. 北京航空航天大学学报(社会科学版), 2016, 29(6): 81-88.
[9] Baker, M. (1993) Corpus Linguistics and Translation Studies: Implications and Applications. In: Baker, M., Francis, G., Tognini-Bonelli, E., Eds., Text and technology: In Honour of John Sinclair, John Benjamins, 233-250. [Google Scholar] [CrossRef