大语言模型背景下探析AI在翻译中的应用——以《走进定西》为例
Exploring the Application of AI in Translation within the Context of Large Language Models—A Case Study of Entering Dingxi
DOI: 10.12677/ml.2024.1210901, PDF, HTML, XML,   
作者: 秦莉媛:兰州交通大学外国语学院,甘肃 兰州
关键词: 大语言模型人工智能翻译Large Language Models Artificial Intelligence Translation
摘要: 随着人工智能(AI)技术的飞速发展,大语言模型在自然语言处理领域取得了显著进展。本文以《走进定西》为例,探讨大语言模型在翻译中的应用与优势。通过对比人工翻译与AI翻译的效果,分析大语言模型在翻译过程中的准确性、流畅性和文化适应性。研究结果表明,大语言模型在翻译《走进定西》时表现出较高的翻译质量和效率,显示了其在文化传播和语言交流中的潜力和应用前景。
Abstract: With the rapid development of artificial intelligence (AI) technology, large language models have made significant advancements in the field of natural language processing. This paper uses Entering Dingxi as a case study to explore the application and advantages of large language models in translation. By comparing the effectiveness of human translation and AI translation, the paper analyzes the accuracy, fluency, and cultural adaptability of large language models in the translation process. The findings indicate that large language models demonstrate high translation quality and efficiency when translating Entering Dingxi, highlighting their potential and future prospects in cultural transmission and language exchange.
文章引用:秦莉媛. 大语言模型背景下探析AI在翻译中的应用——以《走进定西》为例[J]. 现代语言学, 2024, 12(10): 360-366. https://doi.org/10.12677/ml.2024.1210901

1. 引言

近年来,随着人工智能技术的迅猛发展,特别是在自然语言处理领域的突破性进展,大语言模型如GPT-4、BERT等工具已成为翻译和语言生成任务中的重要助力。基于深度学习技术,这些模型能够通过海量语料库的训练,较为准确地理解和生成自然语言文本,从而在诸多应用场景中表现出卓越的性能。特别是在翻译、写作、对话等任务中,它们不仅提高了效率,还推动了语言处理的精度与灵活性。

在这个背景下,探索大语言模型在实际翻译任务中的应用与效果具有重要的学术和实践意义。为了更好地理解这些模型在复杂文本翻译中的表现,本文选取了地方志书《走进定西》作为研究对象,分析并探讨大语言模型在此类文本翻译中的优势与不足。

定西,位于中国甘肃省中部,是一个历史悠久、文化底蕴深厚的地区。《走进定西》作为一本系统介绍定西历史、文化和社会发展的地方志书,其内容丰富,具有浓郁的地方特色。这对翻译提出了更高的要求,传统的人工翻译不仅需要深厚的语言功底,还需要对当地文化有深入理解。然而,随着大语言模型的发展,机器翻译通过依托大量的语料库,已经具备了快速高效的翻译能力,能够在一定程度上满足复杂文本的翻译需求。

接下来,本文将通过对《走进定西》翻译实例的分析,详细探讨大语言模型在翻译过程中所展现出的优势和局限,为未来相关技术的应用和优化提供参考。

2. AI在翻译中的发展及应用

在当前社会发展过程中,ChatGPT作为预训练大语言模型应用的代表,在短短几年间实现了模型性能的飞速提升,并在2023年初火爆全球[1]。相继迎来突破的还有谷歌发布Gemini 1.5和OpenAI的文生视频大模型Sora。AI翻译水平正处在显著提升态势,虽然离为社会公众的日常工作涉及语言翻译提供便利的高质量标准还存在一定的局限,未来的AI翻译发展大有可为[2]

2.1. 研究基础

2.1.1. 基于神经网络的翻译模型

传统的基于统计方法的翻译系统,如SMT (统计机器翻译),虽然在一定程度上解决了语言转换的问题,但在处理复杂语言结构和长距离依赖时表现较弱。随着神经网络技术的引入,特别是RNN (循环神经网络)和LSTM (长短时记忆网络)模型的应用,翻译系统逐渐开始在语法结构、上下文理解等方面取得突破。

2.1.2. Transformer与自注意力机制

2017年,Transformer架构的提出标志着机器翻译技术的一个重要转折点。Transformer通过自注意力机制解决了以往模型对长文本的处理瓶颈,使得翻译模型能够更好地理解源文本的全局信息,极大提高了翻译的流畅性和准确性。这一模型奠定了大语言模型的基础,并成为GPT、BERT等模型的核心架构。

2.1.3. 预训练与微调技术

近年来,基于Transformer架构的大规模预训练模型如BERT和GPT系列,借助预训练 + 微调的技术路径,进一步提升了翻译的效果。通过在海量通用语料上进行预训练,这些模型学习了丰富的语言知识和语义信息,而后通过在特定领域或任务上的微调,使其在特定语境下的翻译表现更加精确。这一技术在跨领域、跨语言翻译中得到了广泛应用和验证。

2.2. 综述

机器翻译的广泛应用为全球化进程提供了强有力的技术支持。国际交流、跨国贸易等场景中,机器翻译系统能够实时、高效地完成多语言之间的翻译任务,减少了语言障碍带来的沟通困难。Google翻译、百度翻译、Bing翻译等服务,已被广泛应用于日常生活、商务交流和学术研究中。

机器翻译的发展经历了从基于规则的方法到基于统计学习的方法,再到基于神经网络方法的演变。

早期的机器翻译主要依赖于基于规则的翻译方法(Rule-Based Machine Translation, RBMT)。这种方法需要人工设计大量的语言规则和词汇对照表,将源语言的句法结构与目标语言相对应。然而,这种方法存在较大的局限性,主要体现在对复杂语法结构的处理能力有限,且需要大量的人工维护和更新语言规则,难以应对多样化的语言需求。

随着数据挖掘和统计学习的进展,基于统计的机器翻译方法(Statistical Machine Translation, SMT)在20世纪90年代逐渐取代了基于规则的方法。SMT不再依赖手工设计的规则,而是利用大规模的双语平行语料,通过概率模型对词语和句子进行匹配和翻译。IBM的统计翻译模型是这一阶段的代表。尽管SMT提高了翻译的自动化水平,但在处理语言歧义和长距离依赖等问题上,仍然存在较大局限。

进入21世纪,基于神经网络的机器翻译方法(Neural Machine Translation, NMT)迅速崛起,特别是随着深度学习和大数据的结合,NMT成为了机器翻译的主流方法。NMT通过构建端到端的神经网络模型,直接将源语言序列映射到目标语言序列,实现了更加精确和流畅的翻译效果[3]。相比于SMT,NMT能够更好地捕捉句子中的上下文信息,显著提升了翻译的流畅度和语义一致性。典型的NMT模型包括基于RNN (循环神经网络)和LSTM (长短时记忆网络)的方法,随后,Transformer模型的提出进一步增强了NMT的性能。Transformer通过自注意力机制,不仅有效解决了RNN中长距离依赖的问题,还极大提升了并行处理的效率。

近年来,随着数据挖掘和深度学习技术的快速发展,端到端的神经机器翻译(End-to-End Neural Machine Translation)方法成为了机器翻译研究的主流。相较于传统的翻译方法,端到端的NMT模型能够通过自适应地学习语料中的语言规律,减少人工干预,自动生成与源语言语义对等的目标语言。这种方法的优势在于其良好的扩展性,能够通过大量的数据训练不断优化模型,使得翻译系统在处理多种语言时表现更为一致和稳定。

从基于规则的翻译方法,到基于统计的翻译模型,再到如今主流的端到端神经机器翻译,机器翻译技术经历了长足的发展。随着大数据和深度学习技术的进一步提升,机器翻译的精度和效率将持续改善。然而,面对低资源语言和文化特定表达的翻译挑战,未来的研究需要继续探索更加智能化和灵活的翻译模型,以满足全球化时代日益增长的多语言沟通需求。

3. 机译与人译的区别以《走进定西》为例

3.1. 翻译准确性

GPT-4在翻译《走进定西》时,能够准确地理解和翻译大部分文本内容,特别是在专业术语和历史事件的翻译上,表现出较高的准确性。相比之下,人工翻译虽然在细节处理上更为精细,但在大量信息处理上,效率较低。

Example 1:

汉语:佛殿系仿明清风格宫殿式建筑,雕梁画栋,富丽堂皇,蔚为壮观。依次有大雄殿、藏经楼、地藏殿、弥陀殿、金刚殿,彩绘塑像法相庄严,栩栩如生。寺名由赵朴初先生题写。

人译:The temple complex consists of several halls, including the Daxiong Dian, the Cangjing Lou, the Earth Treasury Hall, the Amitabha Hall, and the Vajra Hall. Inside these halls, you’ll find exquisitely painted and sculpted Buddha statues, each portraying the solemnity and grace of the Buddhist faith, appearing remarkably lifelike.

机译:The temple complex consists of several halls, including the Grand Hall (Daxiong Dian), the Scripture Hall (Cangjing Lou), the Earth Treasury Hall (Dizang Dian), the Amitabha Hall (Mituo Dian), and the Vajra Hall (Jingang Dian). Inside these halls, you’ll find exquisitely painted and sculpted Buddha statues, each portraying the solemnity and grace of the Buddhist faith, appearing remarkably lifelike.

分析:AI在处理大部分专业术语翻译时,表现出较高的准确性。例如,它准确地翻译了“大雄殿”为“Grand Hall (Daxiong Dian)”以及“藏经楼”为“Scripture Hall (Cangjing Lou)”,并保留了汉语拼音,有助于读者理解这些术语的原始名称。AI的翻译虽然在细节上略逊于人工翻译,但在处理大量信息时效率更高,并且能够在大多数情况下保持较高的准确性。对于需要快速生成大规模文本翻译的场景,AI无疑是一个非常有效的工具。

总体而言,AI能够准确理解和翻译大部分文本内容,尤其在专业术语和历史事件的翻译上表现得很好。相比之下,人工翻译虽然处理更为细致,但在应对大量信息时的效率较低。两者各有优缺点,具体选择取决于使用场景和需求。

3.2. 翻译流畅性

通过对比发现,GPT-4的翻译文本整体上较为流畅,语言表达自然,句子结构合理。然而,人工翻译由于译者的语言习惯和表达方式,某些句子显得较为生硬,缺乏连贯性。

Example 2:

汉语:在任期间,重教兴学,架桥铺路,教化民风,体察民情,关爱百姓,百姓称为“许青天”。任上二年,适逢连年大旱,民不聊生,上疏请求赈灾减赋,遭革职罢官。罢官后,贫病潦倒,无资归里,康熙十年(1671年)病逝于安定。

机译:During his tenure, he emphasized education, constructed bridges and roads, promoted moral values, understood the needs of the people, and cared for the welfare of the citizens. The people affectionately referred to him as “Xu Qingtian.”

However, during his second year in office, there was a prolonged drought, and the people were suffering greatly. He submitted memorials requesting disaster relief and tax reductions, but instead, he was dismissed from his position. After losing his position, he fell into poverty, illness, and destitution, with no resources to return to his hometown. Xu Mi passed away due to illness in the tenth year of the Kangxi era (1671) in Anding.

人译:During his term of office, he reinvigorated education, built Bridges and paved roads, educated the people, felt the people, cared for the people, and the people were called “Xu Qingtian”. The last two years, coincides with the drought, the people are destitute, on the sparse request for relief relief, was dismissed. After his dismissal, he was poor and ill and had no money to return to, and died in Anding in the ten years of Kangxi (1671).

分析:

AI的翻译整体上更为流畅,句子结构合理,表达自然。比如,在描述“他在任期间”的事迹时,GPT-4采用了“During his tenure, he emphasized education, constructed bridges and roads, promoted moral values, understood the needs of the people, and cared for the welfare of the citizens.”这样的翻译,不仅保持了语义的完整性,也让句子结构显得更为连贯。相比之下,人工翻译虽然准确传达了原文的意思,但句子的表达较为生硬。例如,“During his term of office, he reinvigorated education, built Bridges and paved roads, educated the people, felt the people, cared for the people, and the people were called ‘Xu Qingtian’.”这个句子中“felt the people”这样的表达不太符合英语的自然用法,导致阅读时显得有些突兀。

GPT-4的翻译更符合英语的语言习惯,比如它将“适逢连年大旱”翻译为“there was a prolonged drought, and the people were suffering greatly”,不仅语法正确,语义也更加清晰。而人工翻译中的“coincides with the drought, the people are destitute”显得语言不够自然,句子之间的连贯性也有所欠缺。

总体来说,GPT-4的翻译在语言流畅性、自然性和句子结构上具有优势,更符合英语的表达习惯。人工翻译虽然在某些细节上保持了更高的忠实度,但在整体的连贯性和流畅性上有所欠缺。这表明,在处理复杂文本时,GPT-4能够提供一种更为顺畅的翻译,而人工翻译在处理具体细节时可能更为精准,但可能需要在流畅性上进行调整。

3.3. 文化适应性

机器翻译的译后编辑和译文润色需要人工翻译的介入[4]。在文化适应性方面,GPT-4仍存在一定的不足。虽然其能准确翻译大部分内容,但在涉及地方文化和习俗的表达时,仍然会出现误译或不准确的情况。人工翻译在这方面有明显优势,译者能够结合自身的文化背景知识,进行更为恰当的翻译。

Example 3:

汉语:1979年曾清理2座,墓道向西,均为券顶砖室墓,出土有绿釉陶壶灰陶罐及陶狗、陶鸡等。该地曾出土权衡、铜弩机、铜车饰和五铢钱等。另一处在距缆口村东2于米的朱家庄村,分布有封土墓葬10座,呈覆斗状,大小相似。封土底边周长约45米,残高3.5~5米。地面散布有泥质绳纹灰陶片及瓦片。

人译:In 1979, two of them were excavated, and their burial passages face west. All of them are brick-chambered tombs with a vaulted roof structure. Artifacts unearthed from these tombs include green-glazed pottery pots, gray pottery jars, as well as pottery dogs, and pottery chickens. In this area, archaeological findings have also included balance scales from the Xinmang period, bronze crossbows, bronze cart decorations, and Wuzhu coins, among others.

The other site is situated approximately 2 miles east of Lankou Village in Zhujiacun Village, consisting of ten earthen tombs. They are arranged in the shape of an inverted bucket and are of similar sizes. The base circumference of these tombs is approximately 45 meters, with remaining heights ranging from 3.5 to 5 meters. On the ground surface, there are scattered fragments of gray pottery with cord-marked patterns and pieces of pottery.

机译:In 1979, two tombs were cleared to the west, all of which were brick tombs with a roof, and green glazed pottery POTS, gray pottery POTS, pottery dogs, and pottery chickens were unearthed. There have been unearthed Xinmang weighing, copper crossbow machine, copper car decoration and Wuzhu money. The other is located in Zhujiazhuang village, 2 meters away from the east of Zhaokou Village, and there are 10 sealed tombs, which are covered with buckets and similar in size. The perimeter of the bottom of the fief is about 45 meters, and the residual height is 3.5 to 5 meters. The floor is interspersed with clay jomon gray pottery and tiles.

分析:在这段翻译中,GPT-4的机器翻译和人工翻译都有各自的特点和问题。下面是对这两种翻译的分析:

AI翻译在一些具体细节上处理得不够准确。例如,“There have been unearthed Xinmang weighing”中的“weighing”是对“新莽权衡”的不恰当翻译,容易导致误解。同时,像“clay jomon gray pottery”这种词汇的选择也显得不够精确和专业。

人在处理考古术语时表现较为准确和专业,如“bronze crossbows”和“Wuzhu coins”这些术语的翻译。然而,它在处理“封土”时,翻译为“earthen tombs”可能不完全准确,可能更应该翻译为“tumulus”或“burial mound”来更好地表达原意。

AI翻译在处理术语时有些不到位。例如“copper crossbow machine”翻译为“铜弩机”时,可以直接翻译为“bronze crossbow”,显得更为专业。此外,“sealed tombs”对“封土墓葬”的翻译也不够准确,应考虑用“burial mounds”或类似的术语。

AI虽然在某些细节上尝试保持忠实,但整体翻译较为生硬,且在术语处理表达上存在一些问题。总体来看,人工翻译更适合在需要自然、流畅表达的场合,而AI则需要更多的润色和修改,以提高其可读性和准确性。

4. 大语言模型背景下,译者的作用

从本质上来说,翻译机器与各种翻译软件的存在就是为了给译者提供助力,译者与翻译机器的关系就是主体和工具的关系,翻译机器在创造和使用的过程中由译者占主导地位[5]。从机器发明与软件开发、语料库建设、译后编辑、到文化建构人类有着不可或缺的地位。AI翻译与人工翻译并非对立的矛盾关系,而是相互补充、相辅相成。正确结合两者的优势,将是未来AI翻译发展的重要方向。

首先,翻译机器的研发离不开人的努力,指出自机器翻译诞生以来,人类需求驱动了翻译机器的发展与成熟。从基于规则的传统方法到基于统计和神经网络的现代方法,这些技术的发展背后都是人类智慧的结晶。即使是复杂的神经机器翻译,也是在人的设计和编程下实现的,未来AI翻译的发展仍然需要人的参与和推动。无论是语音翻译机的问世还是各种AI翻译程序的开发,背后都有人类的推动力。

其次,语料库建设中人为因素的重要性。语料库是AI翻译的基础,质量和规模决定了译文的质量。译者在语料收集、修订及维护中起到了至关重要的作用,决定了语料库的质量和准确性。此外,尽管机器翻译在一些领域得到了广泛应用,但仍存在质量问题,需要译者进行后期的编辑和润色。不同翻译目的对译后编辑的要求不同,专业领域尤其需要译者的经验和专业知识。机器翻译无法完全理解语言的复杂性和语境,这也是译者存在的必要性。

最后,AI翻译在文化建构中有重要的作用。在目前阶段,中国对外文化交流空前活跃,也空前迫切[6]。翻译活动旨在传播知识和文化,人的反馈直接影响AI翻译的有效性。译者的文化背景和知识水平在译后编辑中起到了关键作用,使得翻译不仅仅是语言转换,更是文化的传递和理解。现如今,AI在文化建构方面的发展也取得了巨大的进步。总的来说,智能 + 人工 = 翻译的未来[7],AI翻译的发展依然需要依赖人的智慧与创造力。

5. 总结

本文通过对《走进定西》的翻译实验,探讨了大语言模型在翻译中的应用和优势。研究表明,大语言模型在翻译准确性和流畅性方面具有显著优势,但在文化适应性方面仍需改进。未来,随着大语言模型的不断优化和改进,其在翻译领域的应用前景将更加广阔。大语言模型的快速发展,为翻译领域带来了新的机遇和挑战。未来,结合人类译者的专业知识和AI的高效处理能力,混合翻译模式可能成为主流。此外,通过不断优化模型,增强其文化理解能力,将进一步提升翻译质量,为跨文化交流和传播做出更大贡献。

参考文献

[1] 邓霞. AI时代出版编辑核心能力的重塑提升[J]. 传播与版权, 2024(S1): 39-43.
[2] 孙圣勇. AI译术应用研究: 现状与展望[J]. 环渤海经济瞭望, 2020(4): 163.
[3] 亢晓勉, 宗成庆. 基于篇章结构多任务学习的神经机器翻译[J]. 软件学报, 2022, 33(10): 3806-3818.
[4] 胡开宝, 李翼. 机器翻译特征及其与人工翻译关系的研究[J]. 中国翻译, 2016(5): 10-14.
[5] 李梦瑞, 任朝迎. 论AI翻译中人为因素的体现[J]. 汉字文化, 2020(3): 112-114.
[6] 许钧. 翻译研究之用及其可能的出路[J]. 中国翻译, 2012(1): 5-12+122.
[7] 崔启亮. 人工智能时代的语言服务行业发展趋势[J/OL]. 北京第二外国语学院学报: 1-7.
https://link.cnki.net/urlid/11.2802.H.20240809.1527.002, 2024-10-15.