1. 引言
民族典籍英译与传播是跨文化交流的重要桥梁,也是非物质文化遗产保护的关键手段。在“一带一路”倡议与中国文化“走出去”战略推进的背景下,民族典籍作为中华文化精髓,其精准外译是打破文化隔阂、传播中国声音的关键路径。
然而,民族典籍的英译与传播面临诸多挑战。一方面,当前少数民族典籍英译作品数量偏少,译者人才队伍远不能满足翻译需求,且其海外影响力较弱[1]。薛婷也表示少数民族典籍英译当前进展缓慢,无论从理论研究、从业者队伍建设还是译作数量的角度来看,还需付出更多努力[2]。传统人工翻译受限于资源稀缺、效率低下及人才短缺等瓶颈,难以满足民族典籍大规模、高频次外译的迫切需求。此外,NMT模型的运行依赖于平行句对,但此类句对获取不易[3]。口传史诗如《牡帕密帕》含大量文化隐喻与民俗表达,缺乏专属标注数据与平行语料,给NMT带来独特的数据挑战。另一方面,人工智能发展推动NMT成为机器翻译的主流范式[4],其强大的计算与数据处理能力为民族典籍翻译提供新可能,但NMT在通用领域的优势难以直接迁移至民族典籍复杂语境,其处理文化深层含义与特定领域知识的适用性仍需深入探讨。
鉴于此,文章以拉祜族创世史诗《牡帕密帕》汉英翻译为研究对象,对比以谷歌翻译为代表的NMT与人工翻译表现,并借助BLEU和ROUGE两种自动评估指标,系统评估NMT系统在民族典籍翻译中的应用效能,深入探讨其在处理民族文化传承与传播复杂问题上的有效性与局限性,并为此提出相应的解决策略。
2. 文献综述
随着“一带一路”倡议的推进与中国文化“走出去”战略的深化,民族典籍作为中华文化的重要载体,其外译质量关乎文化传播效能。NMT凭借高效性和泛化能力,为民族文化外译提供了新路径,也引发了有关其适用性的讨论。
2.1. 民族典籍英译现状
当前民族典籍英译,尤其是少数民族典籍英译的现状并不乐观。赵长江对1986~2013年7月国内发表的56篇民族典籍外译研究论文进行梳理,指出该领域研究虽在内容、队伍和方法上不断拓展,但相较于《论语》《道德经》等汉族经典典籍,民族典籍的译本数量明显不足,凸显出民族典籍翻译在规模上的弱势[5]。王宏印在与张媛的访谈中也明确表示,民族典籍翻译与成果丰硕的汉族典籍翻译相比,尚未形成足够规模,亟待更多研究与实践投入[6]。
为改善此现状,黄剑、薛婷从宏观层面提出加强学科建设、培养专业翻译人才、提升翻译理论水平及推动跨学科跨国界合作等策略[1] [2]。然而,这些建议主要聚焦于传统人工翻译路径的优化,鲜少涉及新兴技术在提升翻译效率和质量方面的潜力。尽管早期机器翻译在专业典籍领域的应用已有所探索,如姚振军对中医典籍机器翻译可行性的研究,但其结论普遍指出机器译文质量欠佳,仍需大量人工编辑方能达到可用标准,这反映了当时技术在处理专业领域文本时的局限性[7]。
2.2. NMT民族典籍英译研究
NMT技术虽以强大计算与数据处理能力,为民族典籍大规模外译提供新可能,但其在民族典籍英译中的具体应用及适用性,学界尚未充分实证研究。
现有NMT研究多聚焦通用语料或高资源文本翻译。例如,谷舒豪等指出,NMT模型高度依赖大规模标注数据,在语料稀缺或领域不匹配时,其翻译性能会大幅下降[8],这为NMT在《牡帕密帕》这类文化负载极高的民族典籍翻译中的应用埋下隐患。此外,关于机器翻译质量评估的研究也取得了一定进展。郭子浩等运用BLEU与ROUGE两大自动评估系统,探讨了提示词工程与大语言模型在英语口语场景的适用性[9];吴梦成等则通过BLEU与ROUGE对古籍机器翻译进行定量分析,侧重于词频、词性和依存关系等语法层面[10]。但这些研究评估维度有局限,多停留在语言结构表层,缺乏对语义内涵尤其是文化负载内容的深度剖析,难以反映民族典籍翻译中“文化传递”的核心诉求,也未考量文化传播效果与读者接受度。
综上,学界虽在典籍翻译与机器翻译领域有探索,但民族典籍与NMT交叉研究存在三重局限:一是对民族典籍翻译多关注传统人工翻译,缺乏NMT适用性实证研究;二是NMT探讨多基于通用语料,鲜少涉及高文化负载民族典籍;三是质量评估维度单一,未充分考量文化传播效果等深层因素。
3. 研究方法
3.1. 研究对象
1) 谷歌翻译
谷歌翻译是全球极具影响力的在线翻译工具,自2001年诞生后开启机器翻译领域的革新探索。其创立初期受技术所限,翻译精度欠佳,难以满足用户的高质量翻译需求[11]。2004年后依托技术研发与海量数据整合,功能与算法逐步完善,2006年在相关翻译技术比赛中几乎包揽全部项目第一名[12],标志其技术的重大突破。
据维基百科数据,截至2016年1月,谷歌翻译已支持90种语言,每日为超两亿人提供免费多语言翻译服务,彰显其全球市场地位与影响力。2016年11月,谷歌神经网络机器翻译系统(Google Neural Machine Translation, GNMT)正式被推出,堪称其发展历程中的重要里程碑。大幅提升译文质量,使其翻译更贴近自然语言,优化用户体验[13]。此前谷歌用循环神经网络翻译成效显著,冯志伟指出其汉英机器翻译错误率下降85%,而GNMT进一步优化,提升语义理解与表达精准度[14]。
如今,谷歌翻译支持超过130种语言,持续拓展小语种覆盖,功能涵盖文本、语音、图片与网页翻译等。技术上不断优化神经网络模型,依托海量多领域语料库训练,提升复杂句式、文化负载词翻译精准度及译文流畅自然度。
2) 拉祜族创世史诗《牡帕密帕》
《牡帕密帕》是拉祜族流传最广的长篇诗体创世神话,承载其厚重历史文化,是文化传承核心载体,2006年5月20日被列入第一批国家级非物质文化遗产名录,名称为拉祜语译音,意为“造天造地”。全诗共2042行、约12,000多字[15],含17个篇章(常见版本含歌头、歌尾与正文,正文分“造天造地”、“造物造人”、“生活下去”三部分,“生活下去”涵盖十个方面),生动展现拉祜族起源、发展及生活变迁。
在文化“走出去”背景下,该书海外传播受限,2020年其英译本由云南人民出版社出版,由李昌银教授团队与西方专家合作完成,旨在增强国际适应性,助力少数民族文学海外传播[16]。作为云南少数民族经典,《牡帕密帕》以史诗演绎民族起源,勾勒拉祜族哲学思想、记载迁徙与社会演进,展现生产生活与宗教信仰。英译突破语言地域壁垒,为国际学界提供权威文本,开辟全球文化对话空间,对促进文明交融、增强中华民族文化认同、提升中华文化国际影响力意义重大。
3.2. 研究设计
首先,因《牡帕密帕》篇幅庞大,为保障研究效率并减少主观干扰,本研究选取其各章节标题为对比样本,同时按比例随机抽取30个句子作为语料。样本选择无偏向性,覆盖书中不同领域内容,可避免人为偏差、确保样本均衡,真实反映书中语言多样性。
其次,在翻译环节,使用谷歌翻译专业版处理选定标题与句子,因其神经网络翻译系统成熟,具备复杂文本的处理能力。
最后,采用BLEU和ROUGE-L (Recall-Oriented Understudy for Gisting Evaluation-Longest Common Subsequence)对机器译文与李昌银英译本进行定量对比,评估结果保留小数点后四位。其中,BLEU通过计算n-gram匹配度衡量准确性,本次用四元BLEU评分(权重均为0.25),分数越接近1质量越高;ROUGE-L基于最长公共子序列衡量召回率,侧重内容覆盖度与信息完整性,分数越接近1质量越高。
然而,虽然BLEU、ROUGE、METEOR等自动评估指标能快速得出稳定评分,但其可靠性存争议[17]。二者在自然语言处理中应用广泛,但BLEU仅关注n-gram重叠,忽视语法语义等,对新颖表达打分低;ROUGE-L虽更重关键信息保留,仍基于表层文本匹配,无法评估《牡帕密帕》蕴含的民族思维、叙事结构及韵律美感。故仅靠二者难以全面揭示译文在语义内涵与文化传递上的优缺点。
3.3. 研究结果
Table 1. Result records
表1. 结果记录
项目 |
BLEU Score |
ROUGE-L Score |
标题 |
0.1131 |
0.4800 |
正文 |
0.1549 |
0.3859 |
在标题部分(见表1),BLEU得分为0.1131,表明机器翻译标题与人工参考译文的n-gram重叠度极低。由于标题通常短小精炼,其词序和词语选择对BLEU分数影响极大,谷歌翻译在处理标题时可能存在词序不一致或词语选择不够精确的问题,从而导致BLEU得分偏低。然而,ROUGE-L得分为0.4800,基于最长公共子序列(LCS)可知,虽机器翻译标题形式与参考译文有差异,但基本捕捉到标题原意与关键信息。
在正文部分,BLEU得分为0.1549,略高于标题,因正文篇幅长、词汇句式丰富,增加了n-gram匹配机会,然而得分仍低,说明机器译文与人工译文在用词、句式上差异较大;ROUGE-L得分为0.3859,低于标题,因谷歌翻译处理正文时句式安排、词语搭配与参考译文一致性不足,共同子序列偏短,未充分捕捉并合理表达原文核心信息。
综合来看,谷歌翻译在本次《牡帕密帕》汉英翻译任务中的BLEU和ROUGE-L得分均偏低,整体翻译质量为一般水平。尤其是在标题翻译方面,BLEU得分反映出的准确性不足尤为明显,反映其处理简短且对词序、选词要求高的文本存在挑战。相较而言,正文部分的翻译表现略优于标题,说明上下文丰富时谷歌翻译更易把握原文含义。但因ROUGE更注重对译文的整体把握,其在标题与正文的得分均高于BLEU。
4. 分析与讨论
4.1. 谷歌翻译在民族典籍英译中的优势
基于本研究的实践过程,谷歌翻译在民族典籍英译中呈现出三大主要优势。
首先,谷歌翻译具备显著的翻译效率优势,使其能够实现大规模文本的快速初步转化,这是传统人工翻译难以比拟的优势。
其次,谷歌翻译在译文处理上展现出良好的忠实性。在形式上,《牡帕密帕》原文采用逐行排列的形式,作者将其处理为电子文本时忠实遵循此格式。相应地,谷歌翻译的输出结果也能保持原文的逐行对应排布方式。在内容上,谷歌翻译能准确把握原文核心内容,即便在词形或句法结构与参考译文存在差异的情况下,其仍能有效传递原文的基本信息。如:
(1) 原文:打猎
谷歌翻译:Hunt
人工翻译:Hunting
在这句翻译中,谷歌翻译的“Hunt”与参考翻译“Hunting”之间存在词形差异,导致BLEU分数为0。谷歌翻译的“Hunt”是动词原形,而参考翻译采用了现在分词“Hunting”。这种词形变化可能影响翻译的语气和语法准确性。在民族典籍的翻译中,这种细微差异可能改变句子的语法结构和文学风格,尤其是在表现动作的进行时态时。但是ROUGE得分为1,表示谷歌翻译完整传达了“打猎”这一核心意义,虽然在词形上有所差异,但内容传达没有丢失。
此例表明,谷歌翻译在语法结构的处理上存在一定的局限性,但在抓住核心信息上表现较好。
再次,谷歌翻译在通用句式和常见词汇的处理上表现出较高的有效性。如:
(2) 原文:鹌鹑站在第一列,孔雀站在第二列,人们站在第三列,越跳人越多,歌儿越唱越热烈
谷歌翻译:The quail stood in the first row, the peacock stood in the second row, the people stood in the third row, the more they danced, the more people came, the song became more and more passionate.
人工翻译:The quail stood in the first row, the peacock in the second, the people in the third, the more they danced, the more people gathered, and the song became more intense.
该句BLEU评分为0.5533,ROUGE评分为0.7576,翻译质量良好。谷歌译文忠实原文核心语义,与参考译文高度契合;参考译文通过省略重复词汇更显简洁流畅,且“the more people gathered”较“the more people came”更精准传达“人群聚集”之意。尽管存在细微差异,但谷歌翻译仍准确传递原文核心信息。该案例两项评分均为本次分析最高,有力印证谷歌翻译在核心意义清晰、词汇基础的通用句式处理上的高有效性。
4.2. 谷歌翻译在民族典籍英译中的局限
谷歌翻译在处理民族典籍翻译时,准确性和流畅性有待提高。具体而言,这些不足主要表现在标题翻译、联系上下文、语法、文化语境与术语一致性几个方面,这些问题直接影响了译文的整体质量。
首先是标题翻译,谷歌翻译在标题的识别与格式处理上,表现出明显的局限性。其译文往往仅将首字母大写,后续实词未能遵循英文标题的规范进行大写,且在词性选择上亦存在偏差。如:
(3) 原文:造农具
谷歌翻译:Make farm tools
人工翻译:Making farm tools
对比可见,谷歌翻译的处理存在显著偏差。在格式规范上,它仅将句首单词首字母大写,未对后续实词“farm”、“tools”进行大写,这不符合英文标题的通用格式。这种格式上的不规范直接损害了译文的流畅性,使其显得不自然和不专业。在词性选择方面,谷歌翻译采用动词原形“Make”,而参考译文使用动名词“Making”,后者更契合英文标题以非谓语形式进行概括性表述的语言习惯。这种词性选择的偏差,导致译文准确性不足以传递标题的概括性功能,同时也在一定程度上影响了其流畅性和文体适配性,未能精准呈现原文作为标题的功能特征。
其次,谷歌翻译联系上下文能力欠缺,常因无法理解语境、关联前后文信息,导致译文断裂、语义不连贯,读者难明深层含义。如:
(4) 原文:奖励小米雀吃谷子,奖励老鼠吃白米。
谷歌翻译:Reward the millet sparrow for eating millet. Reward the mice with white rice.
人工翻译:They rewarded the sparrows with millet, and thanked the rats with rice.
该句谷歌译文与参考译文同样差异较大,BLEU分数为0.1173,ROUGE分数为0.56。谷歌翻译采用逐句直译,沿用原文并列结构导致“Reward”重复,造成表达冗余,影响译文流畅性;同时“小米雀”、“白米”字对字翻译痕迹明显,语义准确性与自然度不足。而参考译文充分结合上下文,补充主语“they”(即前文“扎迪和娜笛”),并以连词“and”连接两分句,使句子结构完整、语义连贯,大幅提升流畅性与准确性。可见,谷歌翻译虽能传递原文基本含义,但因未有效处理上下文,不仅造成词汇重复、句式僵硬,还降低译文流畅性与自然度,语义传达亦存在偏差。
再者,谷歌翻译的译文有时会出现单复数不一致、句子成分缺失等明显语法错误,这些问题直接损害了译文的语法正确性。如:
(5) 原文:金柱子,银柱子,铜柱子,铁柱子。
谷歌翻译:Golden pillar, Silver pillars, Copper pillars, Iron pillar.
人工翻译:A gold pillar, A silver pillar, A copper pillar, And an iron pillar.
此句BLEU分数为0.1073,ROUGE分数为0.6667,是所选句子中分数差异最大的。谷歌译文存在单复数混用的明显语法错误,既损害语法准确性,又导致语句不统一、不流畅,削弱表达自然性。此外,其未灵活处理上下文,翻译各元素时未考虑列举结构的整体性与流畅性,致使BLEU评分较低。尽管ROUGE评分较高,表明谷歌翻译在名词短语的语义传递上较为准确,内容大意得到了有效传递,但谷歌翻译在此类句子中虽传递基本意思,在语法准确性与整体流畅度上仍有明显改进空间。
最后,这类典籍富含承载族群历史、民俗与文化符号的表达,既需精准语言转换,也需把握深层文化内涵;同时,保持民族特色专有术语的翻译一致性,是确保译文专业、可读的关键。但谷歌翻译在民族典籍文化语境理解与核心术语翻译一致性上缺陷显著,二者在BLEU与ROUGE评估中得分均低。如:
(6) 原文:瓦瓦来搞掌
谷歌翻译:Wawa is here to do the palm work
人工翻译:Wa wa lai gao zhang
该表达为拉祜族特有,是厄莎为九族分肉时族人食肉的特定表述,承载族群习俗记忆与文化象征。人工译文采用音译,既保留文化原貌,亦传递其特有文化符号属性;谷歌翻译未洞察深层文化含义,仅作字面直译,脱离语境导致语义失准,且造成民族文化信息流失,集中体现其准确性局限。
(7) 原文:芦笙
谷歌翻译:reed、Lusheng
人工翻译:Lusheng
谷歌翻译在不同语境下分别给出“reed”和“Lusheng”两种译法。“reed”意为“芦苇”,与作为民族乐器的“芦笙”在概念上不匹配,这直接导致了翻译的准确性问题。“Lusheng”则是国际上对这一民族乐器的通用音译,更符合专有术语的翻译规范。同一术语在译文中的不一致呈现,不仅会让读者对“芦笙”这一事物的认知产生混淆,也严重削弱了译文的流畅性、专业性与严谨性,难以满足民族典籍翻译对文化信息准确传递的要求。在此例中,谷歌翻译在准确性和流畅性两方面均存在局限。
4.3. 民族典籍英译优化路径
针对前文所述谷歌翻译在民族典籍英译中的应用,可见NMT在民族典籍英译存在明显不足。因此,提升翻译质量需结合大语言模型(Large Language Model, LLM)发展趋势与典籍翻译特殊需求,探索“机器翻译 + 人工优化”的多层协同路径。
首先,应关注LLM在翻译领域的最新进展。相比传统NMT模型,LLM在上下文理解、跨句推理及文化隐喻识别方面表现出更强的语言生成与语义建构能力。提示工程(Prompt Engineering, PE)可通过设计翻译指令,引导模型保持民族术语音译、注释文化典故,提升译文文化适配性;同时可借助微调技术(Fine-tuning),用民族文化、历史类语料定向训练LLM,使其掌握典籍特有的语义结构与文化符号。
其次,高质量平行语料库构建是长远保障。现有通用语料多集中于新闻、科技等领域,民族典籍相关语料稀缺,导致模型难以捕捉其语言特征。因此,需构建小规模、高精度的平行语料库,选取代表性典籍段落及权威译文进行规范化标注与对齐,为模型训练、翻译教学及文化传播提供支撑。
最后,建立系统的译后编辑规范至关重要。针对上述翻译评估中发现的问题,需统一英文标题格式与非谓语用法;人工校对补充省略主语、调整逻辑连接词,保障语义连贯;构建民族专有名词表与译名对照表,确保术语一致;对含有民族象征意义的词语采用音译加释义或脚注,兼顾文化保真与读者理解。
5. 结语
综上所述,在对谷歌翻译《牡帕密帕》的评估中,BLEU与ROUGE评分普遍偏低,这直观反映出机器译文与《牡帕密帕》英译本还存在较大差距。这两项指标本质上依赖表层文本匹配,难以覆盖民族典籍翻译中语义逻辑、文化内涵、文体特征等深层维度,其评估存在固有局限。从谷歌翻译的表现来看,其优势在于翻译效率高,能实现大规模文本的初步转化,且对通用句式与常见词汇的处理具有一定有效性,对原文形式也保持了一定忠实性;但同时存在标题格式处理不规范、上下文语境整合能力弱、语法错误偶发、文化语境理解与术语翻译一致性不足等缺陷。由此可见,谷歌翻译在民族典籍英译中的适用性有限。
因此,NMT可作为民族典籍翻译的辅助工具,承担初步转化、减轻基础工作量的角色,但要实现民族典籍的精准传译,还需与时俱进,关注技术融合发展、语料资源建设与结合人工干预三方面协同推进。保持民族文化独特性的同时,提升译文的准确性、流畅性与传播力,为民族典籍“走出去”提供更加坚实的语言支持。