1. 引言
随着国际化的快速发展,医学领域的国际深度合作也在如火如荼进行着。国际合作中的信息翻译的准确性尤为重要,不仅影响着医学是否能够进一步推广,还是医学合作的最重要的桥梁之一。医学翻译是科技翻译的一个分支,其翻译要求专业性,准确性,一致性,在翻译过程中要充分展现译文的可信度。当下AI的发展对于译者而言,虽然具有模仿人脑运行的机器算法学习,最终应用于自然语言处理的功能,但对于功能对等的医学文本翻译要求而言,还缺乏一定的专业性和可信度,因此只是一种重要的翻译工具和手段,并不能完全直接应用于生活实践[1]。医学翻译虽然相对于文学作品而言,不需要译者进行大量的意译和再创作,但在保证译文的质量方面仍然需要不断克服不同文化在词汇、句法、篇章上的差异,才能够更好地促进医学知识的传播与发展。
2. 医学文本的特点
医学英语是专门用途英语(ESP)的一种,主要供医务工作者使用或在特定的医疗卫生语境中使用,是医学领域的专业语言。英语医学文献中常见各种形式手段连接词、分句或从句,通过显性衔接方式使文章结构完整;汉语医学文献少用甚至不用形式连接手段,注重隐形连贯,因此多散句短句,但形散而意不散[2]。相对于汉语的医学文献来说,英语医学文献主要有三大特征:1) 频繁使用被动语态;2) 多使用名词性短语;3) 长难句数量较多。此外,医学英语词汇量大、构词复杂且专业性强,包含大量冠名术语、缩略语、两栖词汇。基于这些主要特点,译者在翻译过程中,一定要明确文本特征,采用适当的翻译技巧,比如:增译,减译,词义转换,词义的引申,合理拆分句子结构等,使译文符合目的语的表达习惯。
3. AI翻译工具和翻译文本的选择
当下比较流行的AI翻译工具是国外的ChatGPT和国内DeepSeek,Kimi,豆包等人工智能平台,能比较典型地呈现AI辅助翻译医学文献的结果。本文将尽可能多的运用不同AI平台分析医学相关材料,列举在词汇,句法和篇章三个角度所存在的翻译偏误问题。
翻译文本主要选择能够代表医学各个不同领域的原文本,包括病历,处方,药品说明书,检验报告,医学影像资料,医学文献,医学书籍等原文本,尽可能多的涵盖各个方面,使AI翻译里的医学文本的偏误分析更具代表性和说服力。
4. AI辅助下医学翻译的错误原因分析
AI翻译技术,从早期的基于规则和统计的方法到神经机器翻译(Neural Machine Translation, NMT)的广泛应用,逐步融入了神经机器翻译工具、语料库分析工具以及翻译记忆库等技术,使得翻译行业正经历深刻的变革[3]。尤其随着神经网络机器翻译的出现,标志着机器翻译进入了人工智能时代[4]。由于AI翻译平台能够深度学习,可实现人机对话模式,具备一定的自我学习能力,并且随着数据增加和模型优化,翻译质量也在不断提升。
不可否认,AI翻译技术还无法与人类的大脑相媲美,在词汇,句法,篇章的理解上,很难充分考虑到不同应用领域、不同文化背景、上下文语境等因素,翻译质量也呈现出参差不齐的现象。由于中英语言的差异,尤其是医学文本本身的独特性,AI在翻译过程中,比翻译一般普通文本来说,会出现更多的理解错误。在词汇方面:专业术语错译,两栖词汇理解错误,文化缺失等;在语法层面,句子结构过于复杂,未注意时态变形,上下文逻辑表达不符合目的语,标点符号错误等;在篇章层面,上下文语境缺乏理解,翻译内容情感表达不当等。因此,AI辅助翻译目前缺乏对于医学领域不同类型翻译材料的准确认识和辨析能力,对医学科普读物和医学文献差异的认识也不足,导致无法实现翻译结果的功能对等。
4.1. 词汇层面
4.1.1. 术语偏误
术语是指在特定学科或领域中用来表示专门概念的词或词组,具有专业性,单义性,系统性的特点,例如,医学术语“冠状动脉粥样硬化”精准概括了一种特定疾病的病理特征与发病部位,非医学专业人员很难凭日常经验理解。AI在翻译医学术语时,凭借机器学习后的语料库的生成,可以搜索到较为专业的翻译结果,但还是存在不准确或不规范的术语表达,例如:Alzheimer disease医学术语为“阿尔茨海默症”,可能会翻译为“老年痴呆症”;C-section医学术语为“剖宫产”,可能会翻译为“剖腹产”等,从而导致翻译结果不符合专业标准。
例1:Lifestyle modifications, including sodium restriction and regular physical activity, are essential components of heart failure management.
AI译文:生活方式的改变,包括限制钠盐摄入和规律的体育活动,是心脏衰竭管理的重要组成部分。
分析:AI将heart failure翻译为“心脏衰竭”,而正确的医学术语应为“心力衰竭”,由于heart在作为普通词汇时,确实可以译为“心脏”,且不影响大众对本术语的理解,但不符合医学专业术语表达规范。AI未能准确区分本词在生活领域和医学领域的不同表达,导致翻译偏误。
4.1.2. 缩略语偏误
近几百年来,由于医学的蓬勃发展,新事物,新理念的产生导致医学词汇越来越多,不胜枚举。生物医药英语中包含大量复杂冗长的医学词汇,因此,常常采用缩略词的形式[5]。例如,DNA (脱氧核糖核酸)、CT (计算机断层扫描)、ARDS (急性呼吸窘迫综合征)等缩略语在日常工作中被广泛使用,极大地方便了医学交流,提高了书写效率、方便了国际交流。这些医学术语已经深入人心,其意义显而易见。但有些医学概念共用一个缩略语的现象也很普遍,例如:缩略语BP,在医学领域至少有三组术语,分别是blood pressure (血压)、base pair (碱基对)、bipolar disorder (双相情感障碍),如果AI缺乏上下文的理解,容易将医学缩略语翻译为非原文本所表达的医学概念,导致缩略语翻译偏误。
例2:Patients with BP are at a significantly higher risk of cardiovascular disease, highlighting the need for integrated care addressing both mental and physical health.
AI译文:双相情感障碍患者患心血管疾病的风险显著更高,这凸显了需要综合治疗以同时关注其心理和身体健康。
分析:本句翻译准确。AI在进行翻译过程中,对BP这个概念进行了上下文的分析,确定为Bipolar Disorder。但如果一个单句缺少更多的文字来提供语境意,那么AI就很难确定缩略语所表达的准确含义。
4.1.3. 文化偏误
西医(现代医学),是以科学实验和证据为基础,强调解剖学、生理学、病理学等基础学科,广泛应用于全球;而中医(传统中医学),起源于中国,以阴阳五行、脏腑经络等理论为基础,注重整体观念和辨证施治。因此,不同文化背景下形成的医学体系,其理论基础和思维方式不同,导致术语的表达和内涵存在差异。例如,中医的“气”在西医中难以找到完全对应的术语;stroke在西医语境中,当翻译为“脑卒中”,而中医常表达为“中风”。中医中的很多概念,在西医中可能无法找到对应的概念,也会导致翻译失败,例如:真火:指肾阳;肝气:指肝脏的精气;败血:瘀血的一种,指溢于经脉外,积存于组织间隙的坏死血液。因此,如果不告知文化背景,把中医病例放入AI中进行翻译,将容易会出现的文化理解错误。
例3:患者表现为发热、寒战、身体疼痛,舌苔白腻。中医辨证认为其属于风寒侵袭,治疗方法为辛温解表,理气散寒。
AI译文:The patient presented with fever, chills, body pain, and a white, greasy tongue coating. According to Traditional Chinese Medicine (TCM) syndrome differentiation, the condition is attributed to wind-cold invasion. The treatment method is to release the exterior with pungent-warm herbs and regulate Qi to disperse cold.
分析:本句翻译基本考虑到了中医的语境,但“气”的概念依然没有进行有效翻译,因此非中国文化背景下的读者看到本翻译,会不明所以。AI翻译平台是还需要大量语料库的积累并进行机器学习,在缺乏相应术语积累的情况下难以实现准确翻译,因而文化理解上的翻译偏误也时有发生。
4.1.4. 两栖词汇歧义偏误
两栖词汇是指在医学语境下具有医学含义的普通词汇,可指代某个医学概念或某种医学现象,具有一词多义的特点[6]。在翻译这类词汇时往往需要节后上下文语境意和专业知识来进行综合分析,是人工翻译和机器翻译中的难点。常见的两栖词汇discharge,就可以根据不同语境衍生出六种含义,分别是:1) 排放;2) 履行职责;3) 放点;4) 出院;5)分泌物;6) 鼻涕;或者两栖词汇advanced也有两个含义,分别是:1) 先进的;高级的;2) 晚期的。在医学领域,放在某种疾病之前通常译为“晚期”,例如:advanced cancer:癌症晚期。因此,在翻译医学文本中,一定要准确翻译出这类词汇在语境中的真正含义,否则容易引发较大的医学翻译偏误。
例4:Despite advances in critical care, mortality rates in patients with refractory shock remain high, highlighting the need for novel therapeutic approaches.
AI译文:尽管重症监护技术有所进步,难治性震惊患者的死亡率仍然较高,这突显了新治疗方法的必要性。
分析:本剧中的两栖词汇shock,通用语译为“震惊”,医学含义为“休克”,不排除shock在某些医学文本语境中依然可以翻译为前者含义,医学科普文一般习惯用大众都熟悉易懂的文字提高文章的可读性。但是在本句中,refractory shock指的是一种医学疾病,理当译为“休克”。因此,两个词如果因为语义的重合而产生理解和运用的困惑,也可以通过考察它们的搭配词及其语义表达功能的差异予以消除。AI在处理两栖词汇时容易产生歧义词时,而且通常依赖于上下文语境。
4.2. 句法层面
4.2.1. 时间性偏误
汉语和英语属于两种不同的语言体系,汉语属于汉藏语系,英语属于印欧语系,不同的语言体系成就了两种语言在表达上的诸多不同,时间表达就是一个典型的例子。英语通过动词形态变化构建16种时态系统,如will have been doing精确表达将来完成进行时;汉语则依赖“已经、正在、将要”等时间副词配合语境,动词本身不产生形态变化。因此,在中英翻译中,AI若未能准确理解中文表达的时间状态,对应的英文时态则容易表达错误,导致翻译偏误。
例5:以往研究表明,早期液体复苏可改善脓毒性休克的预后。
AI译文:Previous studies show that early fluid resuscitation improves outcomes in septic shock.
分析:以往研究“Previous studies”表明该研究已经完成,结果已经存在,因此应该使用现在完成时(have shown),表示研究的结论对现在仍然适用。而AI在翻译过程中并未能准确处理好中文语境中所传递的时态问题,导致翻译结果不准确,导致时态错误。
4.2.2. 前后句意逻辑偏误
英文中英两种语言中句子重心的位置存在差异,英语重心多在前,汉语重心多在后。英文的行文结构倾向于“总分”结构,即先说重点,后说细节,这种结构使得沟通更加高效简单,例如:倒装句,it做形式主语的句型等。因此,在翻译中需要根据目标语的使用规则和表达习惯调整恰当的语序,要尽量避免“翻译腔”。
例6:This is a co-morbid presentation because PCOs are also associated with an increased level of resistance of body cells to insulin, leading to persistently high blood glucose levels, which is medically called diabetes mellitus.
AI译文:这是PCOS常见的共病表现,因其可导致机体细胞对胰岛素敏感性下降,引发血糖持续升高,即医学上所称的糖尿病(diabetes mellitus)。
分析:本句原文把结果“共病表现”放在了前面,原因解释放在后面,是符合英文的表达逻辑的。但是,中文表达逻辑更倾向于“前因后果”,因此在处理译文时,应该转换语序,做到翻译逻辑符合目标语言的表达习惯,才是好的译文。
4.2.3. 标点符号处理不当
标点符号是文字里面的有机的部分,不是外面加上去的。每一个标点符号都有一个独特的作用[7]。标点符号能够帮助人们确切地表达思想感情和理解书面语言,在不同的书面文化语境中,标点的使用也是各有差异的。AI在翻译过程中很少考虑标点符号的正确使用,往往采取跟原文一致的手段,或者符合源语言的表达风格进行标点处理,例如:摄氏度符号不转换;全角半角符号区分不清;双引号在中英文输入下的状态一致;人名或专业术语在译文中不显示其原文的英文表达等,导致翻译的质量参差不齐。
例7:Similar to the cause of hirsutism, hyperandrogenism causes the female to develop persistent acne and oily skin. Again, this is a cosmetic problem for the patient and must be investigated cautiously.
AI译文:与多毛症类似,高雄激素血症会导致女性出现顽固性痤疮和皮肤油脂分泌过盛。这同样构成患者的美容困扰,需谨慎评估其内分泌背景。
分析:本句译文,应该是表达的是同一个意群,“这同样构成……”很明显指代前文所提到的“顽固性痤疮”和“皮肤油脂分泌过盛”两种症状,在中文表达中应该使用逗号,而非与英文的表达符合一致,这样的译文犯了一个基本的翻译错误:英文重形合,中文重意合。因此,由于AI还处于不断学习阶段,翻译中的标点符号问题,需要人工校对加以审查,确保其准确性。
4.3. 篇章层面
4.3.1. 情感色彩不当
医学病例,医学科普文等相对于医学论文,医学书籍属于比较大众的文本,因此面对不同的读者对象时,要考虑读者的理解程度和接受程度,适当采用直译和意译,否则容易造成情感色彩不当。目前AI翻译能初步识别和传递“显性情感色彩”,能对大量文本中的词汇标注“情感属性”(如积极、消极、中性,或具体情绪如“愤怒、焦虑、喜悦”),翻译时可通过“情感词汇的对应替换”传递色彩。例如:(医学沟通场景):“The patient responded surprisingly well to the new treatment, and the family was relieved.”AI翻译:“患者对新疗法的反应好得出乎意料,家属感到如释重负。”surprisingly well (积极结果)和relieved (消极情绪的缓解,偏积极),对应译为“好得出乎意料”“如释重负”,准确传递了“欣慰、放松”的情感。但如果原文传递的是“隐性情感色彩”,必须依靠语境、文化背景、人际关系或潜台词,AI的翻译处理能力会显著不足,容易出现情感偏误。
例8:This herbal formula is gentle—take it slowly, and let your body adjust.
AI译文:这个草药配方很温和——慢慢吃,让身体适应。
分析:本句为AI平台豆包翻译的一个例子,gentle (温和)不仅是描述药物性质,还隐含中医“治养结合”的关怀,避免患者焦虑的情感,需译为“这个药方药性温和,你慢慢服用,让身体有个适应的过程。”,能够更好地传递“耐心、体贴”的情感)。医学翻译在严肃的文本中需要保持客观和中立,但对于医学科普读物则需要考虑受众群体,由于AI平台难以辨析隐性色彩词汇,因此可能无法恰当调整句子的情感色彩,导致翻译结果不准确。
4.3.2. 过度意译
在翻译过程中,为了达到原文和译文再让读者理解的角度上实现功能对等,是需要采取一定的翻译策略的,比如:直译,意译等。但AI在翻译过程中,很难对原文的上下文语境进行深刻理解,缺乏一定的灵活性和创造性,会出现过度意译的现象。
例9:This is primarily because, among other things, PCOS is one of the causes of infertility, and this alone is a massive cause of anxiety and frustration. This extends even further to the whole couple as well. We will take a deeper look into the how and why in the coming chapters.
AI译文:究其根本,PCOS作为导致不孕的病因之一,其本身就足以引发强烈的焦虑和挫败感,这种心理影响往往会波及整个家庭单元。我们将在后续章节深入探讨这一现象的形成机制和社会学动因。
分析:本句是主要讲述PCOS (多囊卵巢综合征)是如何给可能患有不孕不育的夫妻带来的不利影响,并在接下来文章分析其产生影响的机制和原因。译文出现了某些词汇的过度翻译,例如:the whole couple译为“整个家庭单元”,“why”译为“社会学动因”,很明显泛化了原意,没有体现医学翻译的严谨性和科学性。因此,在AI翻译的基础上,建立必要的术语库并进行人工校对,是实现医学文本翻译准确性的重要途径。
5. 针对AI翻译平台在医学文本翻译偏误的建议
在未来的十年,人工智能必然会使翻译行业出现根本层面上的变革,以人机协同的方式实现各个行业的现代化发展[8]。但针对以上医学文本翻译偏误案例,还需要从以下几个方面进行改进,以期更好地实现人机合作,提高翻译效率。
1) 优化模型架构,增强上下文语义连贯性。针对AI翻译过程中某些两栖词汇,逻辑关系或者情感色彩翻译不当的问题,可升级语言模型的上下文窗口,让模型能捕捉更长文本中的逻辑关联。
2) 加入语义角色标注(SRL)与语用推理模块,让模型识别词汇在句子中的语法角色,例如:在中文语境中“气”直译为energy并自动添加相关的文化注释,能让读者更好理解文化概念。
3) 用户分层适配。针对医学翻译中的情感色彩偏误,需要对不同用户的核心需求提供差异化翻译模式,避免一刀切的通用翻译。普通读者和专业读者对于某些术语或者缩略语的理解能力不同或者译文出现在不同的载体上,要根据需要进行恰当翻译处理。
4) 人机协同,通过用户反馈收集与人工干预机制,及时修正错误并反哺模型,形成“错误发现–改进–验证”的闭环。在AI翻译出现偏误后,若能提供翻译错误的反馈渠道或者建立人工校对团队,能加速AI翻译的自动学习能力。
6. 结语
由于医学术语对专业性和准确性要求较高,AI翻译作为机器翻译,仍然存在很多有待解决的问题。机器翻译无法完全取代译者的劳动,还有巨大的进步空间,亟待人类不断通过优化模型结构、加入语义角色标注、用户分层适配和人机反馈机制等方法来解决上述存在的问题。AI辅助翻译下的医学翻译依然存在大量需要人工审校的工作,完全依靠AI翻译进行任务交付目前还无法实现。为了实现翻译的功能对等,目前AI翻译只能以辅助人工翻译的角色出现,翻译行业未来必将实现和AI的不断融合,能够大大提高翻译工作效率、控制翻译的人工成本和时间成本。要充分发挥AI的工作技能,又要通过一系列措施不断提升AI翻译的准确性和可读性,才能应对未来不断变化的翻译工作需求。