1. 引言
翻译语言,既不同于源语言,也不同于目标语言,在翻译学中被视为一种独立的语言体系或语言变体。学者们对其提出了多种定义,如“中介语”(Toury, 1979) [1]、“第三语码”(Frawley, 1984) [2]、“杂合语言”(Trosborg, 1997) [3]和“受限语言”(Kruger & Rooy, 2016) [4]等。翻译语言研究的相关研究多基于语料库,主要从词汇层面(如类符形符比)和句法层面(如平均句长)的特征展开分析。然而,这些研究多局限于翻译文本的表层语言形式分析,缺乏对深层语言特点的探讨(范璐、蒋跃,2024) [5],而后者的相关研究有助于深入理解影响翻译过程的认知因素。而基于Tesnière (2015) [6]提出的依存语法理论可以对文本进行深层句法分析,从而揭示翻译文本的一些深层句法特征。“依存语法”是一种句法分析方法,它描述的是词和词之间非对等的依存关系。其中,依存距离和依存方向是依存语法中的两个重要的概念,也是研究者重点关注的两个指标。近年来,随着机器翻译质量的提升,尤其是大语言模型ChatGPT在翻译中的应用,已有研究从不同层面的语言特征比较了人工翻译与机器翻译的翻译语言差异。其中,不少研究已将依存距离、依存方向等指标广泛应用于机器翻译质量评估(Bizzoni et al., 2020; Peng et al., 2021) [7] [8]和翻译语言特征研究(Fan & Jiang, 2019;蒋跃等,2021) [9] [10]。然而,既有研究在比较人工翻译与机器翻译语言差异时,忽视了大语言模型ChatGPT在翻译中的应用。由于ChatGPT提供的翻译服务质量超越了传统机器翻译,其在翻译质量方面的表现应成为翻译学研究的新课题(耿芳、胡健,2023) [11]。
基于上述背景,本文尝试从依存语法视角比较人工翻译与机器翻译的句法特征,探究生成式人工智能模型ChatGPT在学术翻译领域是否能够提升机器翻译质量。本研究不仅有助于深化对普通机器翻译文本和生成式人工智能模型翻译文本句法特征的对比研究,更能丰富学术文本翻译的相关研究。
2. 研究背景
描述句法结构的句法分析方法主要有两种:短语结构语法(成分分析)和依存语法(依存分析)。短语结构语法由乔姆斯基(Chomsky, 1957) [12]提出,其核心是描述“词汇如何组合成更大的结构,进而与其他结构形成嵌套关系”(Imrényi & Mazziotta, 2020, pp.1-2) [13]。依存语法则不以短语为分析单位,而是以词汇本身为基本单元,其核心是描述两个词语间的支配与被支配关系,分别为“支配词”和“从属词”,既反映句法结构,也揭示深层的语义关联。依存关系通常以依存树形图呈现,通过带方向的箭头连接词对:箭头指向从属词,起始点为支配词。例如,句子“The woman held the flowers”的依存结构如图1所示。动词“held”是句子的根节点,主语“woman”和宾语“flowers”均受其支配。前后两个冠词“the”分别依附于“woman”和“flowers”。
Figure 1. Dependency structure of sample sentence: The woman held the flowers
图1. 例句“The woman held the flowers”的依存结构
基于依存语法的基本概念,近年来关于依存语法发展的研究日益增多,而大多研究主要讨论了依存距离和依存方向这两项指标。
1) 依存距离
依存距离表示的是支配词与从属词之间的线性距离,可以通过两个词在句子中前后位置的序号之差计算(刘海涛,2022) [14]。通过计算平均依存距离,可量化文本的句法复杂度(Temperley, 2007; Liu, 2008) [15] [16]。Zhang & Liu (2019) [17]基于依存距离分析了英语变体的句法特征,验证了句子长度、依存距离与句法复杂度的关联,从而影响读者的认知负荷。句子中某一词汇对短期记忆产生的认知负荷,仅当该词与其支配词之间形成依存关系时才能被消除(Hudson, 2010) [18]。因此,依存距离越大,句法结构分析的难度就越高(Gibson, 1998) [19]。根据Liu (2008) [16]的研究,人类语言普遍存在依存距离最小化的倾向。近年来,部分研究还将依存距离这一指标应用到了口译认知相关研究。Liang et al. (2017) [20]发现,不同口译产出的依存距离存在差异,其中交替传译文本的依存距离最小,表明译者在交替传译中需要承受的认知负荷比在同声传译更小;Jiang & Jiang (2020) [21]探究了源语文本依存距离对口译中非流利现象的影响,发现依存距离较长的句子会导致译员非流利现象显著增加,且依存距离可作为评判口译任务难度的有效指标;Shen et al. (2023) [22]基于自建语料库,通过探究句法复杂度对译员在交替传译中流利表达的影响,发现译员在口译过程中会通过重构输入内容以降低平均依存距离,从而调节其认知负荷。
2) 依存方向
依存方向指的是支配词和从属词的相对位置,可分为支配词居前和支配词居后这两种依存方向。Liu (2010) [23]提出了一种基于依存树库的语言类型学研究方法,也被称为“刘–有向性”指标。他发现,某些语言和其他语言相比更倾向于呈现支配词居前或支配词居后的依存关系,如汉语支配词居前的依存关系比例约为31%,而英语的约为49%。沈梦菲、黄伟(2024) [24]基于自建语料库对比了人工翻译与神经机器翻译的句法特征,发现机翻译文的支配词居后的依存关系占比高于人工译文,这与机翻译文中状中关系的使用频率较低,而右附加、介宾关系使用频率较高有关。
3. 研究设计
3.1. 研究问题
本研究旨在探讨以下问题:
(1) 机器翻译文本与人工翻译文本在依存距离和依存方向上是否存在差异?
(2) 相较于神经机器翻译,将大语言模型ChatGPT应用于翻译中能否有效提高翻译质量?
3.2. 研究语料
本研究分别从五个外语类核心期刊(《外语电化教学》《外语界》《外语与外语教学》《中国外语》《中国翻译》)中选取了4篇,共20篇期刊论文,并提取了每篇论文的中文摘要作为源语文本,对应的英文摘要视为人工翻译文本,同时分别通过谷歌翻译和ChatGPT-4o在线获取机器翻译文本。根据Jiao et al. (2023) [25]的研究,“Please provide the [TGT] translation for these sentences”的指令可获得最佳翻译效果,故本研究采用该提示语生成ChatGPT-4o译文。
3.3. 研究方法
为获取人工翻译与机器翻译的句法数据,本研究采用依存语法分析框架进行句法标注,获取各翻译文本的依存树库。具体步骤为:通过Python调用斯坦福大学开发的自然语言处理工具Stanford CoreNLP (3.9.2版)对文本进行自动解析,将解析结果转换至Excel表格后进行人工校对。基于校对数据,通过Excel分别计算各树库的依存距离、平均依存距离(MDD)以及支配词居后的依存关系占比。
一个含有n个词的句子的MDD为:
(1)
在公式(1)中,“n”代表句子长度,“DDi”表示句子中第i个句法关系的依存距离。每个句子中仅有一个词汇无支配词,即根动词,该词的依存距离视作零。因此,图1中句子的平均依存距离可计算为(1 + 1 + 2 + 1)/4 = 1.25。
如果是整个树库,其MDD的计算公式为:
(2)
计算支配词居后依存关系的占比见公式(3):
(3)
例如,图1中的例句包含3组支配词居后的依存关系,因此可计算出该句的支配词居后的依存关系占比为75%。
为确认三类翻译文本在上述指标上的差异是否具有统计学意义,本研究采用单因素方差分析对MDD及支配词居后的依存关系占比进行检验。若P值小于0.05,则表明三类翻译文本之间存在显著差异。
4. 结果和讨论
4.1. 平均依存距离对比
为探究人工译本与机翻译本的差异,本研究首先对三类文本的MDD进行对比。如图2所示,20篇论文摘要按1~20编号,其中编号1~4来自《外语电化教学》,5~8来自《外语界》,9~12来自《外语与外语教学》,13~16来自《中国外语》,17~20来自《中国翻译》。
Figure 2. The comparison of MDD of the three types of translations
图2. 三类翻译文本的MDD对比
从图2可见,谷歌翻译文本的MDD普遍高于其他两类翻译文本。此外,三类翻译文本的MDD平均值与标准差如表1所示。表1显示,谷歌译本的MDD最长,甚至人工译本的MDD也长于ChatGPT-4o译本。为验证三类文本间差异的统计学意义,本研究采用SPSS对MDD进行单因素方差分析,结果显示F = 7.539,p = 0.001 < 0.05,表明三类翻译文本存在显著差异。通过事后检验发现,在LSD检验中,仅ChatGPT-4o译本与人工译本对比时p = 0.418 > 0.05,说明两者无显著差异;而ChatGPT-4o译本与谷歌译本、人工译本与谷歌译本之间均存在显著差异。结果证明,ChatGPT-4o译本的MDD与人工译本相近,而谷歌译本的MDD显著高于二者。
Table 1. The average and the standard deviation of the three types of translations
表1. 三类翻译文本的MDD平均值与标准差
|
ChatGPT-4o |
谷歌 |
人工 |
平均值 |
3.102 |
3.543 |
3.199 |
标准差 |
0.326 |
0.406 |
0.397 |
此外,鉴于句子长度会影响句子的MDD (Jiang & Liu, 2015) [26],本研究进一步计算了不同句子长度(小于55词)下的MDD,结果见图3。图3验证了相关研究结论(同上):句子越长,MDD越高,这一趋势在三类翻译文本中均成立(部分极端值可能由采样不足导致)。此外,图3还表明,在控制句子长度后,ChatGPT-4o译本与谷歌译本的MDD在多数情况下仍高于人工翻译文本,且谷歌译本的MDD显著高于另外两类翻译文本。
具体而言,当句子长度小于40词时,三类翻译文本的MDD差异较小;但当句子超过40词时,两类机翻译本的MDD均显著高于人工译本,部分机翻译文的MDD甚至超过4,而人工译文的MDD始终低于4,这一结果与沈梦菲、黄伟(2024) [24]的研究结果一致。由此可见,机器翻译的表现受原文句长的影响较大:在短句翻译上表现接近人工水平,但在长句翻译上的表现不佳,译本的句法复杂度较高,不易理解。不过,对比谷歌译本与ChatGPT-4o译本的MDD分布可发现,整体上ChatGPT-4o的MDD更低,证明ChatGPT-4o译本的句法复杂度更低,更易理解。
Figure 3. MDD of sentences with different length
图3. 不同句长的MDD
4.2. 依存方向对比
通过计算三类译本的支配词居后的依存关系的占比,研究发现人工译本、ChatGPT-4o译本、谷歌译本的支配词居后的依存关系占比分别为63.65%、63.97%和63.91%。人工译本的支配词居后依存关系占比低于另外两类机翻译本。根据Liu (2010) [23]的研究,汉语是典型的支配词居后依存关系主导型语言,其占比超过60%,而英语中支配词居前与支配词居后的依存关系占比基本均衡。但为何三类英译文本的支配词居后依存关系占比均超过了60%?这可能是因为翻译同时受到源语和目标语两种语言系统的影响所导致的。其一,英语遵循尾重原则,长而复杂的句法成分常置于核心成分之后,且文本为学术摘要,其特点为多长句、复杂句,导致三类译本的支配词居后依存关系占比高于英语整体水平;其二,源语为汉语,受“原语透过效应”影响,汉语支配词居后依存关系占比较大的特点也“渗透”到了英语译本中。人工译本的支配词居后依存关系占比低于机翻译本,表明机翻译本更易受源语干扰。这一观点与沈梦菲、黄伟(2024) [24]的研究结果吻合。他们对比了神经机器翻译译本与人工译本的支配词居后依存关系占比,发现机器翻译在词汇与句法模式上更偏离目标语特征,导致译文可读性降低。
考虑到依存方向同样受句长影响(Jiang & Liu, 2015) [26],本研究进一步计算了不同句长下句子支配词居后的依存关系占比,结果如图4所示。图4显示,当句长增加时,支配词居后的依存关系占比降低,这一特点在三类翻译文本中均成立(部分极端值可能由采样不足导致)。
此外,文本对读者所造成的认知负荷也随依存方向变化。当依存方向为支配词居后时,读者需要在记忆中暂存前面读到的所有信息直至支配词出现,故支配词居后的依存关系所造成的认知负荷更高(Yngve, 1960; Niu & Liu, 2022) [27] [28]。图4显示,当句长为17~35词时,ChatGPT-4o译本的支配词居后的依存关系占比低于谷歌译本,表明ChatGPT-4o在处理中长句子时倾向于减少支配词居后的依存关系,产生的译文对读者造成的认知负荷更小,译文更易懂。
Figure 4. The percentage of head-final frequencies of sentences with different length
图4. 不同句长的支配词居后依存关系占比
5. 结论
本研究基于依存语法框架下的依存距离与依存方向两个句法指标,对比分析了ChatGPT-4o、谷歌翻译及人工翻译三类译本的句法特征差异。单因素方差分析表明,ChatGPT-4o译本与人工译本的平均依存距离无统计学显著差异,而ChatGPT-4o翻译译本与谷歌翻译译本、人工翻译译本与谷歌翻译译本之间均存在显著差异。为排除句长对平均依存距离的影响,本研究进一步计算了不同句长下的平均依存距离,发现谷歌翻译文本在不同句长下的平均依存距离普遍高于另外两类文本。该结果表明将ChatGPT-4o应用于翻译中,其在句法复杂度方面的表现优于谷歌翻译,在一定程度上提高了译文质量、降低了读者的认知负荷。在支配词居后的依存关系占比方面,人工译本的占比低于两类机翻译本,表明机翻译文更易受源语(汉语)影响。此外,通过比较不同句长下的依存方向分布,在处理中长句时,ChatGPT-4o译本的支配词居后的依存关系占比低于谷歌译本,说明ChatGPT-4o能通过调整依存方向占比来降低译文难度,从而减少读者认知负荷。
综合依存距离与依存方向的结果可知:在句法特征层面,机器翻译与人工翻译相比仍存在差距,如机翻译文的平均句长更长、更易受源语干扰且在灵活处理词语关系方面不及人工翻译,导致译文更复杂,给读者造成的认知负荷更大。然而,ChatGPT-4o在翻译中的应用可通过降低句子的平均依存距离、优化句子中词汇的依存关系方向的分布,从而在一定程度上缩小这一差距。本研究还存在一些不足之处,如样本量较小,未来将采取更大规模的语料对本研究结论进行验证。