1. 引言
作为一款人工智能语言模型,ChatGPT自2022年11月问世以来对翻译领域产生了巨大冲击,引发了学界的广泛讨论。目前,关于ChatGPT在翻译领域的讨论主要集中在以下几个方面:1) 对教学的机遇、挑战及其应用[1]-[3];2) 引发的伦理风险[4]-[6];3) 对其翻译质量以及能否替代人类译者的讨论等[7]-[9]。
就大语言模型在翻译中的应用而言,部分研究指出经大规模语料库训练的ChatGPT可产出高质量、接近母语水平的自然语言[10],可在中译外时修改并润色译文、调整句法结构、增强篇章连贯以及调整译文语域[11]。那么,大语言模型在翻译质量上表现如何?
目前关于大语言模型翻译质量的研究较少。大部分研究采用对比的方法,通过自动评测、人工评测或两者结合的方式来评测其翻译质量。例如张文煜、赵璧[12]结合机器自动评价与人工评价对比了大语言模型和神经网络机器对于两个语对方向的6种体裁文本翻译的相似和差异性。研究发现:相似性方面,GPT仍未颠覆NMT技术,两者的翻译质量非常接近而且都更擅长汉译英。差异性方面,GPT于科普文本表现最佳,其术语翻译的准确性优于NMT;就文学文本汉英翻译而言,GPT在语境理解、文本可读性方面有一定优势。王和私、马柯昕[13]以生物医学文本为研究对象,从词汇层面对比了ChatGPT、有道、百度、谷歌4款机器的翻译质量,发现ChatGPT对于医学专业知识的处理略占优势,它的实时交互式对话功能可帮助译者更好地完成翻译工作。文旭、田亚灵[14]聚焦政治文本,结合定量和定性分析评估了ChatGPT、Google、有道和DeepL的翻译质量。通过对比BLEU、TER值,研究发现ChatGPT与其他机器翻译工具相当,甚至略有优势。结合人工评阅可发现ChatGPT在隐转喻识别、句子结构、文化敏感度和词语准确度方面有一定优势。研究最后指出大语言模型在意识形态、文化差异、准确性方面仍面临风险和挑战。就大语言模型的局限性而言,其他研究也有所涉及:王克非[9]分析了ChatGPT于文学文本翻译的不足之处,即文采不足、呆板拖沓、缺乏个性等,指出人工译者在文学翻译领域仍大有可为。赵雪等[15]结合评测指标ROUGE和MAUVE指出ChatGPT在术语知识储备方面存在不足。
目前研究已经肯定了ChatGPT在翻译中的辅助作用,但同时指出其局限性。因此,人工干预对于翻译质量的保证不可或缺。那么,如何去保证机器的翻译质量,使其发挥更高的效能呢?这还需进一步的研究。目前学界对于人工干预的认识过于片面,大多聚焦于译后编辑。已有研究表明可从词汇、句法、语篇等层面对译文进行译后编辑,例如修改专有名词、调整句序、消歧词义、避免文化冲突、重组主谓结构、明晰逻辑关系等[16] [17]。然而,机器翻译加译后编辑的方式未必省时省力,编辑者有时需要费时费力地大规模调整译文。对于机器在篇章衔接、词汇理解、句法关系等方面频繁出现的问题,译前阶段便可予以规避。译前编辑不仅在保证机器翻译质量方面发挥着重要作用,而且可以减少译后编辑时间、避免重复劳动。
2. 译前编辑
译前编辑是指在机器翻译之前对需要翻译的文本进行针对性地修改编辑以提高机器翻译质量,有效的译前编辑可以在很大程度上减少译后编辑者的工作量[18]。本文主要基于汉译英方向的有关研究展开论述。
目前仅有少量研究涉及到大语言模型的译前编辑,但提出的编辑方法尚不全面而且未进行有效性的评估。例如Wang [19]以广交会文本为研究对象,提出在译前删减原文本冗余之处、修正标点符号、划分句群。除此之外,部分研究聚焦大语言模型的译前提示。例如王俊超[20]提出人工智能时代的翻译编辑PAIP模式,以语言景观外译为例,译者可在译前将对源语文本的语义、语用的理解加入到翻译指令或将译文术语、固定表达、句法构式加入到提示语中。除上述研究外,现有研究大多基于神经网络机器翻译提出译前编辑方法。例如黄越悦[21]依照简化、明晰化、标准化原则,提出在译前调整句法结构、增补主语、删减重复成分、提前翻译术语、补充标点符号。仇全菊[22]针对不同层面的机器错误提出相应的译前编辑策略。词汇层面:词义消歧、解释熟词僻义、统一全文表述;句子层面:增补主语、充分表达紧缩句意、合并短句、修改主谓搭配、明晰逻辑关系;其他层面:改写隐喻、俗语、习语、修改原文。仲文明[23]聚焦汉语科技文本的模糊特质提出译前编辑方法,包括词义消歧、释义隐喻、逻辑明晰、省略重复、突出和转换主题词等。与以上研究不同的是,李国兵、张敬[24]对译前编辑的效益进行了评估。结合实验数据和半结构化访谈结果,研究发现译前编辑可提高机器翻译质量并肯定了显化逻辑关系这一编辑策略的作用。但是,译前编辑的效果并不显著,而且会增加整体翻译耗时。
综上所述,目前尚缺少研究基于大语言模型全面系统地提出译前编辑方法并评估其效果。除此之外,就文本类型而言,已有研究大部分针对应用型文本,例如科技、法律、产品手册、新闻等,但这些文本的编辑方法不一定适用于文学文本。因此,本研究以大语言模型的散文文本翻译为例,从微观到宏观即词汇、句法、语篇和文化层面提出译前编辑方法并从5个维度(准确性、可读性、创造性、风格和文化接受度)评估编辑的有效性,以期更好地和大语言模型协作,服务于中华文化的海外传播。研究问题如下:1) 译前编辑的方法有哪些?2) 译前编辑的效果如何?是否可以显著提高产出的译文质量?
3. 研究设计
数据收集:
研究所用数据来自《英译中国现代散文选》(张培基)。考虑到人工打分和人工观察的劳动强度,研究按照随机抽样选取了10个汉语片段作为源语文本。
研究思路:
将10个所选片段放入ChatGPT3.5,输入提示语“translate into English”,得到10个译文(第一组)并进行人工打分。其后,对原文进行译前编辑,以同样提示语让ChatGPT3.5再次翻译,得到第二组10个译文并进行人工打分。最后,通过SPSS软件对比分析两组得分,通过非参数检验观察二者在5个变量上的表现以衡量译前编辑效果。如图1所示:
Figure 1. Research procedure
图1. 研究思路
译前编辑效果的评估方式有自动评测和人工评测,大部分研究采用人工评测或两者结合的方式[25] (pp. 36-43) [26] (pp. 64-72)。由于自动评测存在诸多缺陷,本研究采用人工评测,选取5位高校资深翻译教师评定译文质量。研究参考翻译多维质量标准(MQM)制定评估量表,其适合评定任何文本类型及翻译方式的文本(机译或人译) [27] (p. 456),最终确定的量表分为5个维度(准确性、可读性、创造性、风格、文化接受度),如表1所示。人工评测采用错误计分法,从5个维度对机器译文进行扣分。扣分范围为1~5分:大错扣5分,例如因误译、漏译而对原文意思的传达造成严重影响;译入语读者不能理解源语文化或感到被冒犯等。小错扣1分,例如不严重影响读者理解、违背原文语义等。
Table 1. Translation quality assessment form
表1. 译文质量评估量表
错误类型 |
准确性(Accuracy) |
增译 |
错译 |
漏译 |
可读性(Readability) |
词汇搭配不自然 |
句子衔接不紧密、不通顺 |
语义不清 |
出现语法错误 |
创造性(Creativity) |
译文呆板僵滞,拘泥原文,不加变通 |
风格(Style) |
与原文风格不一致(语气、文体) |
文化接受度(Cultural Adaptation) |
译入语读者对译文中包含的源语文化感到难以理解或被冒犯 |
4. 案例分析
4.1. 词汇层面
大语言模型是一种使用自注意力机制的神经网络深度学习基础模型,该机制使其在翻译中具有特殊优势,能捕捉到更丰富的上下文信息,生成自然、连贯的文本[28]。虽然大语言模型的上下文理解能力相较于传统的机器翻译有了显著提升,但其仍存在局限性[29],面临无法理解感情的挑战[30]。例如有些词语蕴含人物情感,并不是字面意义的简单相加,大语言模型的字对字直译无法传达情感意义。鉴于此,译者可结合语境阐释此类词语,凸显隐含的情感。
除了情感再现之外,其还面临处理社会文化知识的挑战[29],例如因缺乏相应的知识储备而误译文化负载词。鉴于此,使用其进行翻译时,译者需将自己的主体性和创造价值反映于译作中[31],例如在译前释义文化词。除文化方面外,因缺乏专业领域相关知识[32],大语言模型常常误译术语及专有名词,因此译者可提前翻译此类名词或在译后加以修正。
1. 结合语境阐释词义
ST:他踌躇了一会,终于决定还是自己送我去。我两三回劝他不必去。他只说,“不要紧,他们去不好!” |
PE-ST:他踌躇了一会,终于决定还是自己送我去。我两三回劝他不必去。他只说,“不要紧,我信不过其他人!” |
MT: He hesitated for a while and finally decided to
personally see me off. I tried to persuade him not to go, but he only said, “It’s okay, it’s not good for them to go!” |
PE-MT: After hesitating for a while, he finally decided to see me off personally. I tried to persuade him not to go, but he simply said, “It’s alright, I don’t trust anyone else to send you off.” |
HT: After some wavering, he finally decided that he himself would accompany me to the station. I repeatedly tried to talk him out of it, but he only said, “Never mind! It won’t do to trust guys like those hotel boys!” |
结合语境,此例中“不好”并不是字面意思“好坏”层面的“不好”,而是暗含了父亲对茶房的不信任和对儿子的担忧之情。翻译时,大语言模型自注意机制下的语境嵌入对输入序列的每个词加权处理,得到每个词的语境向量后产出译文[28]。其译文准确性高,词对应强,但在人际意义的再现方面有待提高,例如将“不好”字对字译为“not good”。相比之下,人工译者将此句译为“It won’t do to trust guys like those hotel boys!”,再现了人物情感。
文学翻译强调情感的再现。考虑到机器的字对字直译,译者可在译前对不止表浅层字面意思的词语进行释义,更细腻地体现说话者的情感。此例中,将“不好”含有的深层情感凸显后,机器产出的译文既体现了原文的情感意蕴又减少了译后的劳动量。
2. 释义中国文化特色词
ST:有人问:世界上什么东西的气力最大?回答纷纭的很,有的说“象”,有的说“狮”,有人开玩笑似的说:是“金刚”,金刚有多少气力,当然大家全不知道。 |
PE-ST:有人问:世界上什么东西的气力最大?回答纷纭的很,有的说“象”,有的说“狮”,有人开玩笑似的说:是“怒目勇猛的佛法守护神”,它有多少气力,当然大家全不知道。 |
MT: Someone asked: “What is the most powerful thing in the world?” There were various answers. Some said
“elephant,” some said “lion,” and someone jokingly said, “diamond.” Of course, no one knew how much power a diamond had. |
PE-MT: Someone asked, “What is the most powerful thing in the world?” There were various answers. Some said “elephant,” some said “lion,” and someone jokingly said, “the fierce-eyed guardian deity of Buddhism.” Of course, no one knew how much power it possessed. |
HT: Someone asked, “What has the greatest strength on earth?” The answers varied. Some said, “The elephant.” Some said, “The lion.” Some said jokingly, the fierce-browed guardian gods to Buddha. But nobody of course tell how strong the
guardian gods were. |
语言编码特定的社会意义和文化意义,且为某一语言社团共享[33]。在汉语中,某些文化要素不言自明,可以缺省,但在西方文化中却不具备缺省性。例如此例的“金刚”为佛教术语,指“金刚力士”(佛法的守护神),作者无需言明其具体所指即可被中文读者理解。但大语言模型在社会文化知识储备方面存在局限性,例如将“金刚”理解为“金刚石”,译为“diamond”。除此之外,其会将“叶公好龙”译为“Duke Ye loves dragons”;“三个代表”译为“three represents”;“九牛一毛”译为“nine cows and one strand of cow hair”。翻译是跨文化交际,等量信息传达的效果不一定相等,直译虽可以保留原文意象,但可能会造成目标读者的意义真空。
鉴于此,译者可在译前对中国文化特有概念进行释义,例如将此例中“金刚”释义为“怒目勇猛的佛法守护神”。相比译后的人工翻译,译前编辑汉语的效率相对更高,而且ChatGPT生成的文本地道,减少了译后工作量。
3. 专有名词提前翻译
ST:历来走川江的人都坐木船。 |
PE-ST:历来走Sichuan section of the Yangtse River的人都坐木船。 |
MT: People who traveled along the Sichuan River have all traveled by wooden boats. |
PE-MT: People who traveled along the Sichuan section of the Yangtse River have all traveled by wooden boats. |
HT: People used to travel by wooden boat up and down the Sichuan section of the Yangtse River. |
此例中“川江”指“四川境内的长江”,而机器误译为“Sichuan River”。大语言模型在术语、专有名词的翻译上仍存在局限性,鉴于此,译者可提前翻译此类名词或在译后加以修正。
4.2. 句子层面
英语有严谨的主谓结构,主语不可或缺。而汉语的主语可以省略或隐含[34] (pp. 29-36)。对于主语省略的句子,汉译英时,大语言模型会采取添加逻辑主语、名词短语做主语、动宾结构做主语等策略,生成合乎语法规范的译文。但其在上下文理解方面仍存在局限性[29],有时不能准确识别省略的主语。鉴于此,译者可在译前明晰省略的逻辑主语。
除此之外,汉语重主题,英语重主语。大语言模型对于主谓谓语句(例如大主语前暗含介词“对于”;大主语是受事、小主语是施事句)的翻译有待提高。例如存在介词识别和语序调整等方面的问题。鉴于此,译者可在译前增补介词、调整句序。
1. 增补省略/隐含之处
例1
ST:父亲也就更变了样①,偶然打碎了一只杯子②,他就要骂到使人发抖的程度③。 |
PE-ST:父亲也就更变了样①。有人偶然打碎了一只杯子②,他就要骂到使人发抖的程度③。 |
MT: The father then changed even more, sometimes
smashing a cup, and he would curse to a bone-chilling
degree. |
PE-MT: The father then changed even more. Whenever
someone accidentally broke a cup, he would curse to a
bone-chilling degree. |
HT: From then on father went from bad to horse. Even a mere cup accidentally broken by someone would send him into such a violent rage that we all shivered with fear. |
汉语是意合语言,主语常常被省略和隐含。而英语是形合语言,一般是主谓结构并且在形式上衔合紧密,主语不可或缺。ChatGPT虽然能够灵活处理省略主语的句子,生成符合语法的译文,但其在原文理解方面仍存在局限性,会出现主语判断错误的情况。此例中,结合语境可推断句②省略的主语为“我们或家里的人”,但机器将句②主语误判断为与前后句相同,译为“父亲”。
考虑到机器在主语识别方面存在的问题,译者可在译前增补省略的逻辑主语。否则,机器可能生成有悖原文逻辑语义的译文,译后需要大规模修改。
例2
ST:两匹马①,咱们是算不了什么的②,穷人③,这匹马就是命根④。 |
PE-ST:两匹马①,对咱们是算不了什么的②,对于穷人③,这匹马就是命根④。 |
MT: Two horses, that’s nothing to us, we’re poor, those horses were their lifeline. |
PE-MT: The two horses are nothing to us, but to the poor, that horse is their lifeline, |
HT: The two horses mean nothing to us, but everything to the poor. |
此例中,①②和③④句之间存在转折关系。③和④相当于大主语前暗含介词的主谓谓语句(主谓短语充当谓语的句子) [35] (p. 89):“穷人”前暗含介词“对于”,句④主谓宾完整。对于此类句式,大语言模型有时不能增补出相应介词。例如此例中,ChatGPT将③译为主系表结构,误增补主语“We”。
考虑到机器可能出现的问题,对于“大主语前暗含介词,后面句子主谓宾齐全”的主谓谓语句,译者可在译前增补相应介词,避免机器生成有悖原文语义的译文。有效的译前编辑可节省译后时间,此例译前添加介词“对于”后,译者只需在译后修改不当用词、删减冗余成分等。翻译效率得以提升。
2. 调整语序
ST:他镇日地笑微微①,能找到的东西②,总忙着给她找来③。 |
PE-ST:他镇日地笑微微①,总忙着给她找来能找到的东西②。 |
MT: He smiled lightly all day long, and whatever he could find, he always hurried to bring it to her. |
PE-MT: He smiled lightly all day long, and he always hurried to bring her whatever he could find. |
HT: He kept smiling all day and gave her whatever was available. |
此例中,句③的宾语“能找到的东西”前置为句②。汉英中都存在宾语前置的句子,但汉语宾语前置的情况较英语普遍[36],这和汉语是主题突出型语言(topic-prominent) [37]有关。例如主谓谓语句中“大主语是受事,小主语是施事”[35] (p. 89)这一句式存在宾语前置现象,其语义关系为“受事–施事–动作”,比如“像这样的话,她耳闻到不止一次了”。有研究指出,机器翻译的普遍现象是按照叙述顺序依次翻译原文各个小句而不做调整[38]。大语言模型存在类似问题,会将此类句式译为英语中的宾语前置句,例如“He smiled lightly all day long, and whatever he could find, he always hurried to bring it to her.”。由于英语中存在词序颠倒现象[39] (pp. 54-58),例如动词宾语前置、介词宾语前置、主语补语前置、宾语补语前置、状语前置以及谓语动词前置等,因此机器译文合乎语法规范。但是词序颠倒有时会造成译文在连贯性上的欠缺,例如此例中,句①和③的主语都为“他”,句②插入语从句“and whatever he could find”显得突兀。
考虑到机器可能会按照原文语句顺序翻译,对于汉语中此类主谓谓语句,译者可在译前将前置的宾语调整至谓语后。但是,若前置宾语可起到强调或加强语篇连贯与照应的作用,译者则无需进行此类编辑。
4.3. 语篇层面
英语注重显性接应,连接手段和形式运用频繁,而汉语注重隐形连贯,以神统形,常常不用或少用连接手段[34] (pp. 48-63)。翻译时应把握汉英这一最本质的区别,添加连接词以明晰汉语中的隐含关系。大语言模型虽具备思维和推断能力[28],但其在隐形逻辑的重构方面仍存在不足[40]。已有研究表明,人类译者倾向于增译逻辑连词,构建因果和意图衔接,而神经网络机器译文多为逐词翻译,缺乏深层衔接[41]。ChatGPT产出的译文存在相似问题,因此,译者可发挥人类在逻辑推理方面的优势,在译前明晰原文隐含的逻辑语义关系,减少译后的不确定性和劳动量。
1. 明晰句子间隐含的逻辑语义关系
ST:他们有的年龄大过了我①,有的小我几岁②,都是中年以上的人了③,平日各人所走的方向不同④。思想趣味境遇也都不免互异⑤,大家晤谈起来⑥,也常会遇到说不出的隔膜的情形⑦。 |
PE-ST:他们有的年龄大过了我①,有的小我几岁②,都是中年以上的人了③。因为平日各人所走的方向不同④,所以思想趣味境遇也都不免互异⑤,大家晤谈起来⑥,也常会遇到说不出的隔膜的情形⑦。 |
MT: Some of them are older than me, and some are several years younger, but they are all middle-aged or older now, and we each have different paths in our daily lives. Our thoughts, interests, and circumstances inevitably differ, and when we engage in conversation, we often encounter an indescribable sense of estrangement. |
PE-MT: Some of them are older than me, and some are
several years younger, but they are all middle-aged or older now. Because we each have different paths in our daily lives, our thoughts, interests, and circumstances inevitably differ. When we engage in conversation, we often encounter an
indescribable sense of estrangement. |
HT: Some of them are older than I am, and some a few years younger. But all of us are in late mid-life. Since we have each followed a different course in life, our ways of thinking, interests and circumstances are bound to differ, and often we lack mutual understanding somehow or other in our conversation. |
重形合和重意合是汉英语言间最重要的区别[42] (p. 224)。汉语中散句、松句居多,少用或甚至不用形式连接手段,语法意义和逻辑意义隐含在字里行间。英语重显性接应,以形显义[34] (p. 48)。翻译时,不应把一种语言的形态结构强加到另一种语言之上,而是做出调整,将源语信息用目的语独特结构表现出来[42] (p. 173)。对比人机译文,可发现机器译文比较松散,内部衔接不强。原文中,④⑤小句之间暗含因果关系,但ChatGPT将小句④和⑤断开翻译,没有译出两句间隐含的逻辑关系。相比之下,人工译者发挥主观能动性加入了“since”一词,译文句际间衔接强而且符合目标语的表达习惯。
不止此例,大语言模型在逻辑推理方面存在局限性[43],常将隐含关联词的汉语流水句译为以表意客观的连接词“and”连接的并列句,忽略言语交际意义。因此,译者可在译前明晰隐含的逻辑关系,例如在此例增添表因果关系的连接词“因为”“所以”。若不进行译前编辑,译者则需在译后梳理译文的语义逻辑后添加相应的连接词,远不如译前编辑省力。
4.4. 文化层面
大语言模型虽具有一定模拟人类语言内部结构的能力,但其模拟外在世界、社会历史背景即语言外部方面的能力十分有限[30],在处理“人文硬核”例如隐喻、古语、习语等时往往捉襟见肘。在使用ChatGPT时,译者应发挥自己的主体创造性,弥补其短板。例如在译前释义古语、习语、隐喻等;增补文化背景信息。
1. 阐释中国古语、俗语、歇后语等
ST:五十以学易,可以无大过矣。 |
PE-ST:孔子说:“让我再多活几年,到五十岁时去学习《易经》,就可以没有多大的过错了。” |
MT: It is said that learning is easier at the age of fifty, and one can avoid major mistakes. |
PE-MT: Confucius said, “If I can live a few more years and study the Book of Changes (Yi Jing) at the age of fifty, I would be free from great faults.” |
HT: Confucius says, “I shall be free from great faults if I can live long enough to begin the study of Yi at the age of 50.” |
此句话出自《论语·述而》中的“子曰,加我数年,五十以学易,可以无大过矣”,指“让我在多活几年,到五十岁时去学习《易经》,就可以没有多大的过错了”。原文中“易”指《易经》,而大语言模型因缺乏相应知识储备出现严重误译,将“易”译为“easier”。因此,考虑到ChatGPT有限的知识储备和译后繁重的工作,译者可在译前进行语内翻译,阐释古语。
2. 释义、替换隐喻、变隐喻为明喻并加注释等
ST:二十岁以后结成的友谊,大概已不免搀有各种各样的颜色分子在内。 |
PE-ST:二十岁以后结成的友谊,大概已变得多样而复杂,像有各种颜色一样。 |
MT: Friendships formed after the age of twenty probably
inevitably contain various shades of color. |
PE-MT: Friendships formed after the age of twenty have probably become more diverse and complex, like having
various colors. |
HT: Friendship among people in their 20’s, however, is more or less coloured by personal motives. |
此例中,喻体“颜色分子”比喻友谊的结成变得复杂。文学翻译强调创造性的想象以及情感再现,作者使用隐喻的目的在于唤起读者的认知联想与感觉。因此,翻译时应考虑到效果等值,不能将作者的创作意图与读者的反应隔离开来。ChatGPT将“颜色分子”字对字译为“contain various shades of color”,由于认知结构的不同,目标读者未必能将“shades of color”映射到复杂的个人利益上并产生相应联想。相比之下,人工译者发挥审美能动性以及创造性,采取再现源语隐喻加注释的方法,译为“be coloured by personal motives”,实现了翻译的认知等效。
虽然大语言模型在隐转喻识别方面优于其他的翻译工具[14],但其仍存在局限性,人工干预不可或缺。相比于译后的修改,译前编辑相对省时省力。鉴于此,译者应对中西方认知差异及接受心理有着良好的判断力。对于西方读者可能不会产生相同联想的喻体,译者可在译前采取替换喻体、释义隐喻或改为明喻并加注释等方法。
3. 增补文化背景信息
ST:采菊东篱下,在这里,确是可以悠然见南山的。 |
PE-ST:古代诗人陶渊明在其著名诗作中说:“采菊东篱下,悠然见南山。” |
MT: Plucking chrysanthemums by the eastern fence,
here, one can indeed leisurely appreciate the southern mountains. |
PE-MT: The ancient poet Tao Yuanming aptly says in one of his famous poems, “Plucking chrysanthemums under the eastern hedge, I calmly view the southern hills.” |
HT: An ancient Chinese poet by the name of Tao Yuanming says aptly in one of his famous poems, “Plucking
chrysanthemums under the eastern hedge, I calmly view the southern hills.” |
原文中“采菊东篱下,悠然见南山”出自东晋陶渊明《论酒》诗。遇到文化缺省时,其他文化读者往往无法建立理解话语所必须的语义连贯和情境连贯[44],因此翻译时需增补文化背景信息。大语言模型对于文化知识的处理尚存在不足之处,生成的译文会对目标读者造成意义真空。鉴于此,译者可发挥双文化能力[45] (p. 82),在译前增补此类信息,将ChatGPT的翻译效率与人类的能动性相结合,减少译后的非必要劳动。此例中,可增补出诗人的姓名、时代、上下句等。
5. 数据分析
Table 2. Human evaluation of translation texts with and without pre-editing
表2. 有无译前编辑译文的人工评测对比
编号 |
译前编辑前 (扣分平均值) |
译前编辑后 (扣分平均值) |
准确性 |
可读性 |
创造性 |
风格 |
文化适应度 |
准确性 |
可读性 |
创造性 |
风格 |
文化适应度 |
1 |
0.8 |
0.6 |
1 |
0 |
0 |
0.6 |
0.2 |
0.8 |
0 |
0 |
2 |
1.2 |
1 |
0.4 |
0 |
0 |
0.4 |
0 |
0.6 |
0 |
0 |
3 |
1.2 |
1.2 |
0.8 |
0 |
0 |
0.2 |
0.2 |
0.4 |
0 |
0 |
4 |
1.4 |
1 |
0.8 |
0 |
0 |
1.2 |
0 |
0.4 |
0 |
0 |
5 |
0 |
0.8 |
1.6 |
0 |
0 |
0 |
0.4 |
0.8 |
0 |
0 |
6 |
2 |
0.8 |
0.4 |
0 |
1 |
0.4 |
0 |
0.2 |
0 |
0 |
7 |
4.6 |
0 |
0 |
0 |
1.6 |
0.4 |
0 |
0.2 |
0 |
0 |
8 |
1.8 |
0.2 |
0.8 |
0 |
0 |
0.6 |
0.4 |
1.6 |
0 |
0 |
9 |
2 |
0.4 |
0.8 |
0 |
2 |
0 |
0.4 |
0.4 |
0 |
0 |
10 |
2.4 |
0 |
0.6 |
0 |
1.4 |
0 |
0 |
0.4 |
0 |
0.4 |
通过对译文扣分情况进行分析,如表2所示,发现:
1) 机器译文的扣分主要集中于准确性和可读性方面,进一步分析文本发现其常见错误为:因不能彻底理解原文、识别句法信息等导致的误译、难以再现原文情感等;因隐形逻辑重构方面的局限造成的译文松散;因隐喻识别、文化储备以及专业领域知识方面的局限性造成的误译等。
2) 研究首先通过SPSS软件对数据进行正态分布检验,发现其不符合正态分布,无法进行相关性分析。随后进行非参数检验,通过观察两组数据在5个维度上的表现,发现译前编辑具有一定的效果,编辑后的译文在准确性和可读性上均有显著提升:准确性方面p = 0.008 < 0.05、可读性方面p = 0.027 < 0.05。
3) 创造性方面p = 0.241 > 0.05;文化适应度方面p = 0.066 > 0.05。编辑后的译文在创造性和文化适应度方面没有显著提升。除此之外,ChatGPT生成的译文风格接近于原文散文文体,译文在风格方面并未扣分。
6. 讨论
在词汇层面,早期研究大多基于受控语言提出编辑策略。受控语言指对源语进行限制,通过减少词汇和语法等方面的歧义和复杂度来提高可识别度和可译性[46] (p. 91) [47] (pp. 158-159),例如针对多义词进行词义消歧[16];添加“把、被、了、过、将、正”等字以表明动词时态以及添加助词“的、得、地”表明词性等[48]。但是,词义消歧主要针对英语原文中的一词多义现象而言,不适用于汉译英。而且表明时态和词性这两种编辑方法主要针对传统机器翻译提出,不适用于大语言模型。后来,有研究提出可以解释熟词偏义、统一替换对于同一事或人的不同表述、去除重复用词、提前翻译术语等[21]-[23]。这些编辑方法虽然可取,但是尚不全面。目前虽有研究关注到机器对文学文本中情感传递的欠缺之处[49],但尚未提出有效的解决方法。因此,考虑到大语言模型生成的译文词对应强但难以传达情感这一特点,本研究提出对不只表示浅层字面意思的词语进行译前处理,更细腻地体现说话者情感。除此之外,本研究还关注到了文化负载词的翻译,提出可在译前对其释义,以往鲜有研究关注到这一点。
在句法层面,本研究提出增补省略/隐含之处和调整句序。关于增补省略/隐含之处,以往研究关注到了伪主语这一现象,即汉语主语不能充当相应英语句子的主语,因此编辑者可在译前增加主语[22]。除此之外,仲文明指出居于主位的主语可能不与述位中的动词构成施动者与动作的关系,提出在译前采取补足重构的策略。本研究虽与先前研究提出的编辑方法类似,但针对的情况不同。本研究针对汉语中的主语省略句和主谓谓语句中大主语前暗含介词的句子提出编辑方法,即在译前增补逻辑主语和介词。除此之外,关于语序调整,现有研究大多聚焦于译后阶段,调整之处包括从句、状语、同位语、部分插入语、评述词、报道小句等。少数研究聚焦译前阶段,但都是就英译汉而言,例如冯全功、李嘉伟[16]提出在译前将英语中时间状语单独提取出来、将英语中时间的后先顺序调整为先后顺序,以增强机器译文的可读性。李洋[50]等基于英汉思维的不同提出将英语原文的原因、行为等前置,结果后置。但上述针对英译汉的译前编辑方法未必省时省力。对于汉语母语者来说,译后调整汉语语序要比译前调整英语省力,因此译前编辑更适用于汉译英。对于汉英翻译,本研究聚焦汉语主谓谓语句中宾语前置的情况。ChatGPT可能会按照原文语序翻译而不做调整,因此译者可在译前将前置的宾语调整至谓语后。目前鲜有研究关注到这一句式的机译并提出相应的译前编辑策略。
在语篇层面,本研究提出的编辑方法为明晰句间逻辑关系,这和先前研究提出的编辑方法一致,即通过增添关系连词来显化逻辑关系。在文化层面,对于古语、习语等的翻译,本研究提出可以提前进行语内翻译,否则译后相当于重写。对于目标语中缺省的文化背景信息,本研究提出可以在译前予以增补,避免因目标读者无法理解而产生的意义真空,相关的译前编辑研究鲜有关注到这一点。除此之外,目前仅有少数研究关注到隐喻的译前编辑,例如仲文明等提出“去概念框架”策略,对隐喻进行释义改写[23]。除释义外,本研究提出可以变隐喻为明喻并加注喻义,以避免隐喻形象的丢失并保留联想效果。
7. 结语
人工智能的兴起为翻译领域带来了巨大变革,虽然ChatGPT可以捕捉到更丰富的语境信息,在语义理解、语篇分析、修辞识别、逻辑推理等方面具有一定优势,但其仍无法取代人工译者,人机协作仍是大势所趋。本研究以《英译中国现代散文选》中的10个片段为例,通过对比有无译前编辑的两组机器译文在5个维度的表现来评估编辑的有效性和探索编辑方法,研究发现:1. 进行译前编辑时应对机器可能产生的错误有着良好预测,编辑方法包括:1) 词汇层面:结合语境阐释词义;释义文化负载词;提前翻译专有名词。2) 句子层面:增补省略/隐含之处;调整句序。3) 语篇层面:明晰句间隐含的逻辑关系。4) 文化层面:释义古语、习语、俗语;释义、替换隐喻、变隐喻为明喻并加注释等隐喻等;增补文化背景信息。2. 编辑后的译文在准确性、可读性方面具有显著提升,译前编辑可以提高译文质量并避免译后编辑的重复劳动。3. 译前编辑体现了人类的创意和主体性,使机器捕捉到原文的意蕴及情感,减少了译后编辑的不确定性和所需时间。4. 译前编辑并不能解决译文存在的所有问题,若想获得高质量的译文,译前编辑和译后编辑都不可或缺。
本研究还存在一定的局限性:第一,选取进行评测的语料少;第二,人工打分具有主观性;第三,评测人员数量少,而且语言背景单一。因此,未来研究中可以扩大语料数量,增加评测人员数量以及丰富评测方法,以使研究的结果更具有客观性和代表性。