1. 引言
随着生成式人工智能(AIGC, Artificial Intelligence Generated Content)的崛起,我们正迈入一个由AI驱动的新时代。AIGC强大的内容生成能力,深刻影响着翻译领域。AIGC翻译增强了语义理解和语境感知能力,准确性和流畅性显著提高,使翻译告别了对源语文本进行映射和替换的时代;除了译文质量的优化,AIGC还提高了交互性和协同性,逐步改变了人工译员和机器之间的单向关系[1]。
在这一背景下,“AIGC + PE交互翻译模式”应运而生。该模式融合了AIGC的内容生成能力和专业译员的译后编辑能力(Post Editing, PE),实现了人机协同、优势互补的翻译过程。具体而言,AIGC负责初步翻译和生成多个候选译文,而专业译员则通过AIGC译前训练、文本译前编辑、提示词工程、文本译后编辑、机译质量反馈五个环节保障译文的准确性、适应性和流畅性。在全球化日益加深的今天,跨语言沟通的需求日益增长,“AIGC + PE交互翻译模式”能够快速响应市场需求,提供高质量的翻译服务,是翻译行业向智能化转型的重要一步。
2. AIGC + PE交互翻译模式的立论基础
AIGC + PE交互翻译模式存在的依据,源于机器翻译加译后编辑(Machine Translation and Post Editing, MTPE)与纯AIGC翻译各自的局限。MTPE虽然能辅助生成优质译文,但面临人机协同效率瓶颈、工作流程整合繁琐、翻译质量难以把控等问题。纯AIGC翻译虽具潜力,但AI技术限制明显;缺乏文化敏感度;缺乏复杂情境应对能力;使人类译者的主体意识和意识形态把控受到挑战。
2.1. MTPE翻译的困境阐释
MTPE是指对翻译质量有较高要求的项目,首先经过机器翻译和机器辅助工具给出译文,然后由人工译员对译文进行调改润色。译后编辑的国际标准ISO18587将译后编辑分为“深度译后编辑”和“轻度译后编辑”。这些策略可以将翻译速度提高10%到30%。但机器翻译给出的译文也可能质量很差,整句话都得重新翻译。因此,机器翻译加译后编辑仍然面临着许多困境。
1) 人机协同的效率瓶颈
人机协同目的在于提高翻译效率,但在实际操作中有诸多不如意的地方。
首先,人工译员需要进行细致复杂的译后编辑流程,包括对机器译文输出质量的修正、一致性调整以及适应特定翻译需求。语言质量修正是由于机器翻译会出现语法、逻辑、常识等低级错误,且机器翻译缺乏对上下文深入理解的能力,译文常出现语义模糊、不准确的情况,人工编辑需根据原文和目标语言习惯进行修正。一致性调整是由于不同文本类型有不同的文体风格要求,各行业的专业知识和专业术语也大相径庭,机器翻译难以准确把握,需要人工译员根据具体行业需求进行调整和统一。文化适应性是由于机器翻译在处理涉及文化元素的文本时,常常无法准确传达原文的文化内涵,导致译文在目标文化中显得生硬突兀,尤其是跨文化差异问题需人工编辑深入处理。
其次,MTPE模式的工作流程整合繁琐。人机协同翻译涉及多个环节和工具,包括机器翻译系统、译后编辑软件、翻译项目管理平台等。这些工具和环节之间的整合程度直接影响人机协同的效率和质量。由于机器翻译系统与译后编辑软件之间的接口不兼容或数据交换不顺畅,导致翻译团队需要花费额外时间进行数据转换和格式调整,并且,在人机交互的过程中,沟通和协调也存在障碍,不仅降低了工作效率,还可能引入新的错误,影响工作的流畅性。
2) 翻译质量难以把控
由于机器翻译的输出质量参差不齐,人工编辑的水平和标准也各不相同,很难确保最终译文的质量一致性。即使制定了严格的质量控制标准,在实际执行过程中也因各种因素而无法得到有效落实。
译后编辑质量问题的一个诱导因素是:翻译机构向客户推销高质量译文的译后编辑服务,但是为了最大化自己的利润率,却尽可能压低支付给实际译后编辑人员的报酬。这种做法不仅使得译后编辑工作在经济上不可行,同时也拉低了相关人员的技能水平。另一个诱导因素是当前在神经机器翻译(NMT)或人工智能机器翻译(AIT)的基础上进行译后编辑所蕴藏的风险。第一,NMT的结果更为通顺流畅,有一定的麻痹作用,更容易掩盖机器翻译留下的“陷阱”,使得没有经验的译员,或是部分高水平译员在工作压力下,无法有效识别错误,尤其是“伪友”类错误,造成误译。第二,机器翻译的译文越流畅,初中级译者越不知道如何改,让译者满足于获得“差不多”的译文,导致译文的同质化、带有“译后编辑腔”[2]。
2.2. 纯AIGC翻译的局限性剖析
AIGC,如ChatGPT-4这样的工具能够生成看起来合理的内容,但真实性难以保证。AIGC技术生成的内容来源于网络,语料质量水平参差不齐,其中不乏文化偏见和误导性信息[3],纯粹的AIGC翻译的弊端是翻译所面临的挑战。
1) AI技术限制
JanKocon/Bang等对ChatGPT这样的AIGC在多个自然语言处理(NLP)任务上进行了技术评估,发现AIGC信息内容还包含明显的事实错误,造成事实性虚假,包括数据错误,作者作品错误,客观事实错误,编程代码错误,机器翻译错误五种类型。在不同语言的翻译转换过程中,AIGC翻译内容与原有信息可能不一致,造成翻译内容不准确,原因如下:
AIGC是基于数据预训练产生的大规模语言模型,基于概率的生成方式具有随机性,只要一个论述或声明在数据集中出现的频率越高,它作为答案被生成的概率就越高。同时,来自预训练材料的局限性和质量水平,使模型无法发展出更广泛的理论或吸收新的反事实证据以测试材料的真实性。另外,AIGC的训练数据会存在大量的人工标注数据,人工标注者会看到一个提示和一些样本回答,并被要求标注出最佳答案,目的在于提高回答的真实性、准确性和相关性,随后模型会根据这些人工标注数据进行微调。因此标注人员的各种因素,如教育背景、成长经历、社会文化环境等会影响模型给出的最佳答案[4]。
2) 缺乏文化敏感度
AIGC在翻译过程中会因为缺乏文化敏感度引起翻译失误,例如文化意象的丢失、文化习俗的误解、历史典故的忽视。原因具体可分为技术原因和语言学原因。
在技术层面,语料库是AIGC技术进行自然语言处理的基础资源,当前的语料库侧重于通用语言数据和特定领域的专业词汇,但对于跨文化的背景知识和语境信息覆盖不足,导致AIGC在翻译过程中难以理解和表达原文中的文化内涵和隐喻。
在语言学层面,语言与文化之间存在紧密的关联,语言是文化的载体,而文化则通过语言得以传承和表达。AIGC能在一定程度上理解自然语言,但无法理解自然语言背后蕴含的错综复杂的文化问题。同时不可忽视的是,在现代语言符号的发展中,能够表达当下社会中丰富多维的现实生活和精神世界的文字符号还没有同步建立数据集,导致以非实时数据集为基础资源的AIGC无法准确理解和翻译这些更具当下文化特性的内容。
3) 感知复杂情境能力不足
翻译是人类的高级智能活动,翻译活动不仅涉及语言内部的结构,还涉及语言外部的日常生活知识、社会知识、历史知识、文化背景知识等诸多复杂丰富的要素,这些非语言要素构成了翻译的“人文硬核”(humanity core)。
人类能够根据自身经验、知识和情感,并能够运用联想和推理来理解和处理这些人文硬核复杂情境,而当前AIGC缺乏主观性、经验性和推断能力,模拟外在世界以及社会历史背景的能力还十分有限,难以处理这些复杂而丰富的“人文硬核”。AI深度学习通过多模态建模虽然已经具备一定的视觉和听觉能力,但依然还不能挖掘语言数据与外部世界的复杂联系[5],因此在模拟人类认知过程时出现滞后、死板和单一的情况,无法理解、处理和回应复杂情境。
4) 使人类主体意识弱化
若人类过度依赖纯AIGC翻译,减少自身对语言、文化的深入思考和理解,那在面对翻译任务时,可能不再主动挖掘原文的深层含义和情感色彩,而是更多地参考机器生成的结果,进而导致人类的批判精神在AIGC的翻译模式中被削弱,主体意识遭到侵蚀,译者的主观能动性减退。
翻译本身就是一种语言创造性活动,是人的理性思维(观察、比较、分析、综合、抽象与概括)和非理性思维(情感、直觉、幻觉、潜意识、灵感等)相结合的体现。当人被限定在技术生产的界限内,就失去了多样性本质,进入单一意义的世界,成为单向度的人。在工具的操控下,人类丧失了否定、批判和超越的能力。译者如一直处在依赖于他者提供翻译的惰性状态,其语言能力、语言审美和敏感性都可能受到损害[6]。
5) 意识形态风险
AIGC翻译也带来了不可忽视的意识形态风险。若AIGC翻译的数据存在偏差或受到特定意识形态的影响,其翻译结果可能会传播不当的价值观念,甚至可能会让一些不符合主流意识形态的内容在不知不觉中传播,影响社会的稳定与和谐[7]。
一位国际知名的政治人物在国际会议上发表演讲,演讲内容涉及到对某一国际合作项目的看法和本国的立场。该政治人物来自非英语国家,其演讲内容被现场记者用英语记录下来后,再使用AI翻译工具进行翻译以便全球传播。这位政治人物在演讲中强调,本国对于该国际合作项目持“谨慎支持”的态度,因为需要进一步确保项目的实施能够符合本国的利益以及国际公平正义的原则。然而,AI翻译工具在翻译“谨慎支持”这个表述时,由于训练数据中可能存在对该非英语国家的一些刻板印象或理解偏差,将其翻译为了“勉强支持”。这样的翻译结果在全球媒体上传播后,引发了一系列的误解和不良影响。一些西方国家的媒体借此大做文章,认为该国对于该国际合作项目并不积极,甚至是在故意拖延,这给该国的国际形象造成了一定的损害。同时,其他国家的民众在看到这样的翻译结果后,也对该国的立场产生了误判,影响了国际社会对该国的信任和合作意愿。而实际上,该国的“谨慎支持”态度是基于对项目的认真负责和对国际合作的积极推动,与AI翻译所传达出的“勉强支持”的含义大相径庭。
3. AIGC + PE交互翻译模式理论阐述
3.1. 核心概念界定
人工智能生成内容(Artificial Intelligent Generated Content, AIGC)与人工译后编辑(Post Editing, PE)的结合是翻译领域的一种创新模式。AIGC利用先进的机器学习算法和大规模数据集,生成初步的翻译文本;而PE则是由专业的翻译人员对机器生成的译文进行修改、完善和优化。这种结合并非简单的叠加,而是一种有机的融合;也并非两个主体独立开展工作,而是相互影响、相互促进的。AIGC为翻译提供了高效的起点和丰富的语言资源,PE则凭借人类的专业知识和对语言符号及非语言因素的感知,对机器翻译的结果进行精细化处理,以达到更高的翻译质量。
在探讨AIGC + PE交互翻译模式时,有必要对一些相关术语进行辨析。首先是“机器翻译”(Machine Translation),它是完全依赖计算机程序进行的翻译,缺乏后续的人工优化,质量往往难以保证。“人工翻译”(Human Translation)则完全由人类译者独立完成,虽然质量可能较高,但效率相对较低,成本也较高。而“计算机辅助翻译”(Computer-Aided Translation, CAT)也涉及计算机技术的辅助,但与AIGC + PE模式的侧重点不同,CAT更侧重于提供翻译记忆库、术语库等工具,帮助人工译者提高效率,而AIGC + PE模式则是以AIGC翻译为基础,人工进行深度编辑。机器翻译加译后编辑(MTPE)是首先经过机器翻译和机器辅助工具给出译文,然后由人工译员对译文进行调改润色,但与AIGC + PE交互翻译模式的区别是其技术仍停留在基于统计或初级的神经机器翻译,译文常常不可直接使用,并且无法与人工译者互动。AIGC + PE交互翻译模式具有独特的内涵和特征,与其他相关翻译概念存在明显的区别。
3.2. 显著特征阐释
在翻译技术的演进历程中,AIGC + PE交互翻译模式以其独特的智能化协同、精准优化与动态适应特征,成为当下最普遍的翻译方式。智能化协同特征不仅提升了翻译流程中的人机互动效率,还促进了知识与经验的共享;精准优化特征通过精确挖掘语言与文化内涵,确保了翻译质量的飞跃;动态适应特征则能够灵活应对复杂多变的翻译需求,保持持续的创新与进步。这些特征相互交织、相互促进,共同构成了AIGC + PE模式的核心竞争力,引领翻译行业迈向更加智能化、高效化的未来。
1) 智能化协同特征
智能化协同是指AIGC与人类译者的紧密合作,AIGC擅长处理大规模数据和快速生成初稿,而人类译者则擅长理解语境、把握文化内涵和进行创造性表达,通过AIGC的初步翻译与人类译者的精细编辑相结合,实现翻译效率与质量的双重提升。同时AIGC具备实时交互功能,可以根据人类译者的反馈及时调整,实现更精准的翻译。AIGC还可以整合大量的数据和知识,将不同领域、不同风格的翻译经验汇聚在一起,人类译者通过与AIGC的交互,能够接触到更广泛的知识和经验,丰富自身的翻译能力。而且AIGC可以记录和分析人机互动中的翻译案例和解决方案,形成共享的知识库,供后期学习和借鉴。
2) 精准优化特征
精准优化是指人工译后编辑能够精准聚焦;AIGC在使用过程中能够自我学习和优化能力。AIGC + PE交互翻译模式通过机器翻译提供的基础译文,人工译者能够聚焦于关键的语言点和文化元素,能够进行精细化的修改和调整,能够准确地选择更贴切的词汇、优化句子结构,确保译文在语言表达上更加准确、自然和流畅。
与此同时,AIGC通过不断分析翻译结果和人类译者的反馈,逐渐提高翻译质量,减少错误和歧义,不断自我优化和迭代更新。一些翻译平台或机构建立了完善的翻译质量评估与反馈机制。AI会基于预设的质量评估标准对翻译结果进行初步评估,并生成评估报告。人类译者则根据评估报告和自身经验进行进一步优化和调整。同时,用户也可以对翻译结果进行反馈和评价,这些反馈数据将被用于AI模型的进一步优化,从而达到多主体精准优化译文的效果。
3) 动态适应特征
动态适应是指AIGC翻译系统和人类译员在面对不同语言、文化和领域时的灵活性和适应性。AIGC翻译系统能够根据不同的翻译需求和环境变化,自动调整翻译策略和参数设置来保证翻译结果的准确性和适应性。不同领域的翻译需求差异显著,AIGC翻译系统的领域自适应技术(Domain Adaptation)能够针对不同领域的数据进行专门的学习和训练,提高了翻译结果的准确性和适应性。而人工译者也能够根据具体情况调整翻译策略和方法或者将任务分配给较为熟悉相关领域的人工译者。这种动态适应能力使得该模式能够在不同的翻译场景中保持译文的高质和高效。
4. 工作机制解构
AIGC + PE交互翻译模式的工作机制可以分为三大环节:信息输入与预处理、机器翻译与人工干预、译文输出与质量评估。其中第二个环节又被细分为五个步骤(如图1)。
Figure 1. Working mechanism of AIGC + PE interacting translating mode
图1. AIGC + PE交互翻译模式工作机制
4.1. 信息输入与预处理环节
在AIGC + PE交互翻译模式中,信息输入是整个流程的起点。源文本被导入系统,通常包括各种格式的文档、网页内容等。在输入过程中进行初步处理,例如文本的格式转换、字符编码统一以及噪声去除等操作,以确保输入的信息清晰、规范,便于后续的处理。预处理还可能涉及对源文本的语言识别和分类,以便选择合适的机器翻译模型和工具。例如,对于中文文本和英文文本可能会调用不同的翻译引擎和算法。
4.2. 机器翻译与人工干预的交互流程
第二个环节是AIGC + PE交互翻译模式的关键。在机器翻译系统生成初步的翻译结果之前,人工译员需要早早进行交互和干预,否则译文质量就难以拔高。这种交互并非一次性的,而是一个反复循环、高度协同且精细化的过程。该过程的细分环节包括译员对AIGC进行译前训练、提示词工程、人工译前编辑、AIGC翻译、人工译后编辑。
1) AIGC译前训练
译前训练是确保AIGC模型能够准确理解并翻译特定领域文本的关键步骤。在此过程中,收集大量高质量的双语语料库,涵盖目标领域的专业术语、常见表达及语境信息,AIGC通过深度学习算法学习并内化这些语言知识,从而提升其翻译能力。例如,在医学文献翻译项目中,研究人员首先收集了包含数百万对医学术语及其翻译的医疗双语语料库,随后利用这些语料库对AIGC模型进行了译前训练。结果显示,经过训练的模型在翻译医学文献时,能够准确识别并翻译大量专业术语,显著提高了翻译的专业性和准确性。
2) 提示词工程
提示词工程是一种通过设计特定提示词来引导AI模型生成更符合预期输出的技术。其理论基础在于自然语言生成(NLG)中的控制理论,即通过调整输入参数(如提示词)来影响输出内容的特定方面。研究表明,精心设计的提示词可以显著提高AI模型的生成质量,特别是在需要特定风格或语气的场景中。例如在广告文案翻译项目中,人工译员运用提示词工程来引导AIGC模型生成更具创意和吸引力的翻译文本。他们通过添加“创意”“幽默”等提示词,成功引导模型生成了符合品牌调性的广告文案,提升了翻译文本的市场吸引力。人工译员需要学习并掌握这一技术,以便在翻译过程中为AIGC模型提供有效的指导,从而优化翻译结果。
3) 人工译前编辑
文本译前编辑是确保翻译质量的重要环节。在这一阶段,人工译员会仔细审查原文,纠正潜在的错误或不一致之处,并对原文本进行必要的格式化和规范化处理,这能减少AIGC模型在翻译过程中的误判和混淆,从而提高翻译的准确性。在翻译任务中,译前编辑相当于对原文进行了一次预处理,为AIGC模型提供了更干净、更规范的输入数据,为后续翻译结果的专业性和准确性奠定了基础。
4) AIGC翻译
在译前训练和人工译前编辑的基础上,AIGC模型开始进行翻译工作,将输入文本转换为目标语言的输出文本。AIGC模型利用其强大的自然语言处理能力和深度学习算法,实现快速而准确的翻译。
5) 人工译后编辑
由于语言的复杂性和多样性以及模型本身的局限性,翻译结果仍可能存在一定的误差和不足之处。因此,在AIGC翻译完成后,需要进行人工译后编辑工作。人工译员会对翻译结果进行仔细审查和修改,并优化语言表达的流畅性、准确性和适应性。
4.3. 译文输出与质量评估
在输出译文之前,通常会进行质量评估。质量评估可以采用多种方法,包括基于规则的评估、基于语料库的对比评估以及人工评估。基于规则的评估通过检查译文是否符合语法规则、词汇使用是否恰当等方面来判断质量;基于语料库的对比评估则将译文与已有的高质量翻译文本进行对比分析;人工评估则由专业的翻译人员对译文进行全面、细致的审查和评价。
根据评估结果,对译文进行最后的修正和完善,确保输出的译文在质量上达到预期的标准。同时,评估数据也会被用于进一步改进整个交互翻译模式,提高未来翻译任务的质量和效率。
在翻译任务结束后还会进行机译质量反馈,是AIGC翻译与人工干预交互流程中的最后一个环节。在这一阶段,人工译员会对AIGC模型的翻译质量进行评估和反馈。他们会分析翻译结果中的错误和不足之处,并提出改进意见和建议。这些反馈信息对于优化AIGC模型的性能和提高翻译质量具有重要意义。
5. 总结
AI技术令人印象深刻,但是翻译不仅仅是字面意义上的转换,它还涉及到深层的文化、社会和心理因素。人工智能目前无法深刻理解文化背景、感知复杂情境、掌握文本情感。因此,语言服务行业的挑战和机遇在于如何融合人类的智慧与机器的力量,发挥各自的长处,共同推进跨文化交流。因此我们建议翻译学习者积极拥抱这些技术变革,同时保持对翻译这一艺术的尊重,确保人与机器在翻译领域的和谐合作,充分做好三份功课:1) 足量的“从零开始”的翻译实践及质量反馈;2) 足量的AIGC + PE实践及质量反馈;3) 适应并习惯基于AIGC的译后编辑。同时注意,在进行AIGC译后编辑的时候,译员还要将“改错”的心态转变为“雇用助手”的心态,要把AIGC当作自己的帮手,而不是麻烦制造者,这样才能够拔高AIGC翻译的质量,并使人类有可能在新的领域和空间开发产能和创造力。
未来,本项研究将继续在AIGC + PE交互翻译模式的有效性方面开展深探,包括该模式下的翻译质量多维评估、翻译效率的量化分析、译文文本的功能实现程度探究,进而为翻译行业的智能化转型提供充分的理论与实践依据。
致 谢
感谢所有为我提供数据、文献和技术支持的机构和个人。他们的无私奉献为我提供了充足的素材和资源,为本文的论述提供了坚实的基础。
基金项目
重庆移通学院校级应用研究项目《智慧教育时代教师数智素养形成机制研究》。