1. 引言
译后编辑的发展始终与机器翻译的发展紧密相随,机器翻译的发展是译后编辑的基础[1]。关于对译后编辑的认识,崔启亮[1]、赵涛[2]等学者曾指出其概念混乱,人们对译后编辑的认识还存在模糊。译后编辑(post-editing or postediting, PE for short)指根据一定的目的对机器翻译的原始产出进行加工与修改的过程,包括更改翻译(语言)错误、提高机译产出的准确性与可读性等[3]。国外译后编辑研究起源于20世纪80年代中期,Dorothy Senez (1985)率先探讨了机器翻译的译后编辑服务在欧盟委员会的应用情况(Wikipedia) [1]。国内的译后编辑研究起始于1995年黄河燕、陈肇雄提出的智能译后编辑器的设计原理和实现算法。随后,国内译后编辑的研究发展从多角度展开。2015年冯全功、张慧玉[4]讨论了全球语言服务行业背景下译后编辑译者的培养模式。2020年朱慧芬、赵锦文、诸逸飞[5]探讨了译者在文本、所指、衔接和自然层面的译后编辑原则。2021年赵涛[2]厘清了译后编辑概念,并提出需加大译后编辑教学研究。2023年耿芳、胡健[6]基于ChatGPT的翻译实例研究证明了人工智能辅助在译后编辑上的翻译能力。研究表明,近年来译后编辑领域的关注度持续提升,且紧密契合时代发展趋势,呈现出多元化的演进方向。
综上所述,国内译后编辑领域研究多样化,但相关综述类文献较少,其中部分文献缺乏数据支撑,无法系统性、科学性地全面展示国内译后编辑领域的发展状况。有鉴于此,本研究借助CiteSpace的信息可视化技术,对1995~2024年间国内译后编辑研究文献开展系统性梳理与量化分析,旨在为学界明晰该学科的发展脉络提供可视化依据,并为后续研究的深化拓展提供学术参考。
2. 研究设计
2.1. 数据来源
本研究的数据来源于中国知网(CNKI)数据库中与译后编辑相关的文献。鉴于国内译后编辑研究最早始于1995年,故将知网检索时间范围设定为1995年1月1日至2024年12月31日,以“译后编辑”为主题词进行精确检索,共获得初始文献1419篇。为确保研究的严谨性,研究主题明确围绕译后编辑展开,包括但不限于译后编辑的概念界定、技术方法、质量评估、人才培养、应用场景等。其中,文献类型为期刊论文、学位论文、会议论文等具有学术性的研究成果。同时,内容与译后编辑核心主题关联度极低的文献以及新闻报道、书评、政策文件等非学术性文献。经严格按照上述标准人工筛选后,最终得到有效文献934篇,作为本研究的数据分析来源。
2.2. 研究工具与方法
本研究在文献计量学方法的基础上,借助陈超美教授开发的CiteSpace软件工具对国内译后编辑相关文献进行系统性分析,包括关键词共现分析、聚类分析、关键词突现分析、时间线图谱分析等,旨在全面展示国内译后编辑研究的知识图谱。CiteSpace是一款多元、分时、动态的引文可视化分析软件,能够将一个知识领域的来龙去脉和演进历程集中展现在一幅引文网络图谱上,并能把图谱上作为知识基础的引文节点文献和共引聚类所表征的研究前沿自动标识出来[7]。鉴于CiteSpace强大的研究领域分析功能,本研究根据CiteSpace生成数据制成可供使用图表,并进行深入分析。
3. 数据分析结果
3.1. 文献年度分布情况
如图1所示,从1995~2024年间国内译后编辑领域发文量的变化趋势来看,该领域研究分为三个阶段。第一阶段为1995~2011年,发文量整体处于低位,仅在个别年份有零星增长,表明这一时期国内学界对机器翻译译后编辑的关注较为有限,研究处于萌芽探索阶段。国内最早一篇关于译后编辑的相关研究是1995年黄河燕、陈肇雄发表的《一种智能译后编辑器的设计及其实现算法》,该研究并没有引起国内学者的强烈关注。第二阶段是2012~2019年,发文量呈现出快速且持续的增长态势,从2012年的28篇大幅攀升至2019年的97篇,反映出随着机器翻译技术的迅速发展,译后编辑在机器翻译的技术上对文本进行人工审核和修改编辑的重要性逐渐加强,学界在对机器翻译研究的同时,对机器翻译领域的关注点也慢慢转向由机器翻译所带来的译后编辑领域,也关注到译者在翻译中的重要性和不可或缺性,故译后编辑领域在这段时期内蓬勃发展。第三阶段为2020~2024年,整体发文量趋势势头好,虽然在2019年达到峰值后有所回落,但整体呈现稳定的发展趋势。近年来,随着机器翻译技术的持续进步,以大规模语言模型为代表的AI翻译方法也迅速兴起。本阶段的相关文献不仅聚焦传统的神经机器翻译(Neural Machine Translation, NMT),也广泛探讨了基于ChatGPT等大模型的翻译实践。这一趋势表明,国内的译后编辑研究正紧随技术前沿,学者们展现出突出的前瞻意识。
Figure 1. Diagram of the number of published paper in domestic post-editing research (1995~2024)
图1. 1995~2024年国内译后编辑研究发文量
3.2. 研究热点分析
CiteSpace关键词聚类图谱含多色聚类模块,代表关联关键词集合,上方有聚类标签,反映核心主题。通过聚类图谱可了解当前该研究领域的发展脉络以及研究热点,如图2所示。图中显示,该聚类图谱的模块化指数(modularity Q)为0.7336,聚类轮廓系数(Silhouette)达0.9151。按照评判标准,Q值高于0.3即说明聚类结构具备显著的区分度,S值超过0.7则意味着聚类结果具有较高的可信度。当前这两项指标均远超标准阈值,表明该聚类分析结果具有可靠性,可作为本次研究课题的有效参考依据。
图谱中,共有12个聚类,分别是译后编辑、翻译策略、语言服务、目的论、译前编辑、翻译方法、人工智能、翻译、翻译能力、外宣翻译、口译质量、口译教学等。译后编辑研究领域呈多元化趋势。各聚类通过连线关联,推动领域发展。从该聚类图谱中可得知,译后编辑领域研究维度多样化。该领域发展初期多数研究从机器翻译错误类型总结出人工译后编辑的重要性。翻译研究离不开对翻译方法、翻译策略以及理论基础,无论是科技类文本还是文学类题材文本,译后编辑应用研究均有广泛涉及。尤其是我国发展壮大所带来的持续性对外交流,促进了外宣翻译与译后编辑相结合研究方向。译后编辑近年快速增长,不少研究开始将研究重点转移至译后编辑能力培养、高校译后编辑课程建设、人工智能背景下译后编辑的实证研究等,故而该聚类图谱中呈现出语言服务、人工智能、翻译能力等聚类。关于译前编辑聚类,广义上而言,译前编辑也是译后编辑的有机组成部分[8],译后编辑研究与译前编辑研究都是对文本的编辑研究。总体而言,关键词聚类图谱可说明译后编辑的发展是紧跟时代脚步的,研究者有学术前瞻意识。
Figure 2. Diagram of keywords clustering in domestic post-editing research (1995~2024)
图2. 1995~2024年国内译后编辑研究关键词聚类图谱
3.3. 新兴研究热点分析
某个知识领域的热点变化可以通过CiteSpace的“突变检测计算”算出[9]。在聚类信息基础上,在控制面板处选择热点,将γ值调直0.6,然后进行view,共有14个keywords突现,得到图3。图3中,红色色块随时间轴移动,其宽窄对应研究主题存续时长。纵向看,上方色块偏左是早期主题,下方色块偏右是近年新主题,是判断新兴热点的核心依据。早期(2005~2010年左右)主要关注“翻译”“语境”“语言服务”等基础和宏观层面的内容,例如“翻译”于2005年开始突现,持续到2014年,反映了该领域早期对翻译本身的关注。中期(2010~2018年左右)逐渐深入到“翻译能力”“案例分析”“翻译方法”“目的论”等更具体的研究方向和理论应用,像“翻译方法”在2014年开始突现,是所有关键词中突现强度最高的,显示出其在2014~2019年期间是核心研究热点。近期(2018年至今)则更加注重“翻译技术”的发展以及对“错误分析”等方面的研究,“翻译技术”自2018年开始突现并持续到2024年,体现了对技术发展的关注,“错误分析”于2021年开始突现,是较新的研究方向,反映出对翻译质量提升的进一步探索,整体呈现出研究不断深入、细化且注重实际应用和技术发展的特点。从图中可得出,近几年新兴研究热点围绕着错误分析、翻译技术等方面,这与机器翻译快速发展与人工智能模型的出现息息相关。
Figure 3. Diagram of keyword burst statistics in domestic post-editing research (1995~2024)
图3. 1995~2024年国内译后编辑研究关键词突现统计
3.4. 中介中心性分析
借助CiteSpace获取关键词频表及中心度数据,按中心度大小排序后,筛选中心度 ≥ 0.1的数据,最终得到表1。该表整合呈现了高频关键词的频次统计结果与中心性指标。作为衡量学术概念重要性的核心参数,中心性以数值高低直观反映关键词在研究网络中的枢纽地位,数值越高,其枢纽作用越显著。从表中可知,“译后编辑”和“机器翻译”中心度与频次均居前,是研究核心。该表为探究领域重点与趋势提供参考。
Table 1. Keyword centrality statistics
表1. 关键词中心性统计
 
  
    | 序号 | 关键词 | 中心度 | 频次 | 
  
    | 1 | 译后编辑 | 0.28 | 206 | 
  
    | 2 | 机器翻译 | 0.28 | 201 | 
  
    | 3 | 翻译策略 | 0.2 | 69 | 
  
    | 4 | 翻译 | 0.1 | 26 | 
  
    | 5 | 翻译方法 | 0.1 | 21 | 
 3.5. 研究作者分析
借助CiteSpace软件对导入的数据展开作者分析,并筛选出排名前40的高产作者,相关情况如图4所示。从图中可以清晰地看到,崔启亮、冯全功、殷健、王湘玲等名字在图谱中较为突出,这一现象表明,他们在该领域已形成较为丰硕的研究成果,且具备较高的学术影响力。结合表2进一步分析,崔启亮的发文量达到18篇,远超其他作者,且其首发文年份为2013年,说明他对译后编辑领域研究有前瞻意识,同时发表的高质量相关论文为该领域的发展奠定了坚实的基础。冯全功发文量为8篇,首发文年份是2015年,同样在领域内有一定的研究积累和贡献。殷健虽然首发文年份较晚,为2023年,但发文量达到6篇,显示出其在近年对该领域的研究较为活跃。王湘玲发文量5篇,首发文年份2019年,也在领域内有一定的研究产出。
Figure 4. Diagram of authors in domestic post-editing research (1995~2024)
图4. 1995~2024年国内译后编辑研究作者图谱
这些高产作者的研究成果在一定程度上反映了国内机器翻译译后编辑研究的发展脉络和热点方向。他们的研究成果可能涵盖了机器翻译译后编辑的不同方面,如技术方法、应用场景、质量评估等,为后续研究者提供了重要的参考和借鉴。同时,这些作者之间可能存在一定的合作关系,通过合作开展研究,进一步推动了该领域的发展。总体而言,这些高产作者构成了国内机器翻译译后编辑研究领域的核心力量,他们的研究成果和学术活动对该领域的发展起到了重要的引领和推动作用。
Table 2. Statistics of high-producing authors in domestic post-editing research (1995~2024)
表2. 1995~2024国内译后编辑研究高产作者统计
 
  
    | 序号 | 作者 | 发文量 | 首发文年份 | 
  
    | 1 | 崔启亮 | 18 | 2013 | 
  
    | 2 | 冯全功 | 8 | 2015 | 
  
    | 3 | 殷健 | 6 | 2023 | 
  
    | 4 | 王湘玲 | 5 | 2019 | 
  
    | 5 | 仲文明 | 3 | 2020 | 
  
    | 6 | 雷鹏飞 | 3 | 2021 | 
  
    | 7 | 王华树 | 2 | 2017 | 
  
    | 8 | 王立非 | 2 | 2020 | 
  
    | 9 | 肖志清 | 2 | 2021 | 
 3.6. 研究机构分析
借助CiteSpace软件的机构分析功能,得到了国内机器翻译译后编辑研究领域的机构图谱,如图5。基于该图谱进一步整理数据并制成表3后,可对国内机器翻译译后编辑研究领域的机构参与情况进行如下分析。
Figure 5. Diagram of institutions in domestic post-editing research (1995~2024)
图5. 1995~2024年国内译后编辑研究机构图谱
整体而言,国内机器翻译译后编辑研究领域的机构参与呈现出显著特征,研究机构除聚集在外语类高校中,同时也涉及其他综合类、理工类高校,说明译后编辑研究引起了众多学者的关注。在机构分布上,上海外国语大学、广东外语外贸大学、北京外国语大学等高校表现突出,在发文量上处于领先地位,反映出这些高校在该研究领域投入较多,具备较强的研究实力与学术影响力。而从研究起步时间来看,不同机构存在明显差异,像华中师范大学首发文于2002年,浙江大学首发文于2006年,浙江理工大学则首发文于2019年,这体现出该领域研究在不同机构的开展存在时间先后,部分机构较早涉足并持续研究,部分机构近年才开始参与。总体而言,国内高校凭借丰富的学术资源和研究团队,为该领域的研究持续注入活力,有力推动了国内机器翻译译后编辑研究的发展。
Table 3. Statistics of high-producing institutions in domestic post-editing research (1995~2024)
表3. 1995~2024年国内译后编辑研究高产机构统计
 
  
    | 机构名 | 发文量 | 首发文年份 | 
  
    | 上海外国语大学 | 28 | 2013 | 
  
    | 广东外语外贸大学 | 22 | 2014 | 
  
    | 北京外国语大学 | 21 | 2013 | 
  
    | 山西大学 | 18 | 2013 | 
  
    | 华中师范大学 | 16 | 2002 | 
  
    | 对外经济贸易大学 | 11 | 2014 | 
  
    | 上海师范大学 | 11 | 2014 | 
  
    | 哈尔滨师范大学 | 10 | 2013 | 
  
    | 天津大学 | 10 | 2012 | 
  
    | 浙江大学 | 9 | 2006 | 
  
    | 浙江理工大学 | 8 | 2019 | 
  
    | 南京信息工程大学 | 8 | 2017 | 
  
    | 东华大学 | 8 | 2016 | 
  
    | 中南大学 | 8 | 2007 | 
 3.7. 发展态势分析
为梳理1995~2024年国内译后编辑研究主体的演化过程,在关键词共现分析基础上,利用CiteSpace绘制了关键词时区图谱,如图6。图谱中,每个节点对应该领域热点关键词,节点间线条的跨度与密度,直观展现研究走向及主题的时间变迁。从节点分布来看,“译后编辑”作为核心节点贯穿整个研究周期,奠定了其在该领域的基础地位。研究初期,围绕这一核心节点展开的探讨多与“机器翻译”深度关联。随着时间的推进,研究主题不断拓展并趋向多元,“翻译策略”、“语言服务”、“目的论”等节点陆续出现,标志着研究从技术层面延伸至策略选择、理论支撑及服务应用等多个领域。在研究后期,“人工智能”等节点的出现,显示译后编辑研究领域在技术驱动新方向发展,关注技术支持层面对译后编辑的影响。从节点间连线的跨度和密度来看,早期连线密集,说明当时的研究主题较为集中且关联度高。后期连线逐渐稀疏,则反映出研究分支不断增加、主题愈发细分的特点。目前,大语言智能模型的发展,无论是译后编辑领域还是其他翻译学领域,翻译学界不少学者已经受到其影响并转向对人工智能、大语言模型技术等方面的交叉领域,如耿芳、胡健[6]在ChatGPT的基础上研究了译后编辑任务中的处理能力等。未来译后编辑领域的发展将深深收到科技技术的影响,因此基于技术视角,未来译后编辑将因大语言模型优化更高效,多模态技术拓展路径。但需解决技术与译者融合、能力退化及版权伦理等问题,需学界业界共探。总体而言,该图谱完整展现了国内译后编辑研究从聚焦技术基础,到拓展理论与应用,再到关注前沿技术融合的演化脉络。
Figure 6. Diagram of time zone in domestic post-editing research (1995~2024)
图6. 1995~2024年国内译后编辑研究时区图谱
4. 问题与展望
当前译后编辑研究呈多元化和跨学科发展,但存在两方面问题。一是课程建设与人才培养不足,需加强与高校翻译硕士课程的关联。译后编辑与语言服务市场需求关联紧密,企业更需能快速上手的应用型人才。因此,高校应与企业对接,通过企业项目资源、工具实操和企业导师指导等,培养适配市场的人才,这既能提升学生就业竞争力,也能优化高校培养方案,助力语言服务市场发展。二是应用文本单一,多为非文学类。非文学文本结构规范,译后编辑易高效处理。文学文本因含文化意象等,机器翻译易偏差,译后编辑难度大。可将研究延伸至文学翻译,由机器翻译初译,人工编辑聚焦文化适配等,提升效率,如翻译外国小说时机器处理基础叙事,译员优化表达。本研究对1995至2024年间的国内译后编辑领域相关研究进行可视化分析,但2024年文献收录可能不全,尤其下半年成果或缺失,难以完整反映当年最新研究进展。
5. 结语
本研究利用CiteSpace工具,对1995~2024年国内译后编辑研究文献进行可视化分析,呈现了该领域的发文趋势研究热点及演化脉络。国内译后编辑领域研究热点与翻译策略、语言服务、翻译理论、翻译方法、人工智能、翻译能力等方向有紧密联系。其中,新兴研究热点为翻译技术与错误分析,未来译后编辑趋势会朝向翻译技术领域以及其对译后编辑影响方面。同时,本研究还指出国内译后编辑领域存在课程人才培养体系不完善、应用文本类型单一等问题。这些发现为该领域研究提供参考,后续可围绕现存问题深入探索。
基金项目
本文系2020年湖北省教育厅哲学社会科学基金项目“翻译研究生态转向多维分析”(编号20D042)的部分研究成果。
NOTES
*通讯作者。