1. 引言
随着全球化的推进,为防止国际社会在西方国家的影响下对我国法制建设产生扭曲和片面解读,构建并扩大中国特色社会主义法治体系在国际上的话语权成为重要任务。法律语言的对外翻译规范化有助于增强国际话语权,维护国家利益并彰显国家立场[1]。法律术语是法律语言的基本构成要素[2],然而其翻译面临着标准不统一、术语多义性误导等严峻挑战。尤其是不同文化背景和法律体系的差异,使得学者们在确保翻译准确性和功能等效性方面倍感困难,术语翻译的规范化和标准化亟待突破。
近年来,国际上在法律术语库建设方面取得了显著进展。以欧盟为例,EuroTermBank项目成功构建了一个面向新成员国的术语库,显著提升了法律翻译的效率;DALOS则通过应用本体技术,保证了多语种法律术语概念的一致性。联合国多语言术语库UNTERM通过六种官方语言的标准化对照,为国际条约和公约的翻译提供了权威支持。这些经验表明,构建一个系统化的术语库是促进国际法律合作、提升翻译效率的基础。国内方面虽起步较晚,但也已有了一些初步的探索,如“北大法宝”平台已实现部分术语的中英对照检索,却仍缺乏系统化集成。另有复旦大学牵头的“法律术语社区”项目尝试结合计算机辅助翻译技术,构建一个开放共享的术语库,但该项目没有产出后续数字化成果[3]。这些尝试性项目虽具启发性,但普遍存在规模小、技术应用滞后等问题,因而难以满足“一带一路”倡议下日益增长的国际法律合作需求。
因此,构建具有中国特色的法律术语库,不仅是打造一项翻译技术工具,更是在数字传播时代为中国“走出去”战略目标提供的语言基础设施[4]。法律术语库通过系统化整合术语知识,扩大传播范围,提高国际法律交流合作的便利性,有助于增强中国法律术语的国际影响力。随着人工智能技术的快速发展,法律术语库建设迎来了新的机遇,只有将先进技术与法律外宣体系深度融合,才能在国际法律话语权竞争中占得先机。
本文定位于术语库构建的预实验阶段,首先分析中国法律术语库的构建标准、原则,为术语的确定和术语库的建设提供依据,进而以2023年12月29日修订通过、2024年7月1日起施行的《中华人民共和国公司法》(以下简称“新《公司法》”)英译为例探讨术语提取的方法、术语库构建工具,提出未来可行的可应用场景,为后续的大规模建设提供理论支持和实践参考,从而推动中国特色法律术语库的规范化发展。
2. 国内外法律翻译术语库建设研究现状
在构建法律翻译术语库的过程中,国外已经积累了丰富的经验,并取得了令人瞩目的成就。这些研究成果主要聚焦于术语提取和术语审核这两个核心环节。特别是术语提取,许多国家在运用自然语言处理技术和本体论的基础上,还结合了机器学习和数据挖掘技术,以不断提升术语提取的效率和准确性。例如,欧盟通过创建基于本体技术的多语言法律术语数据库,以确保在不同法律体系中术语的概念具有一致性;在加拿大,Termium Plus的术语库采用了机器学习算法来自动识别新的术语,并通过用户反馈来优化模型[5]。除此之外,还有一些研究对其他领域的术语提取工具(例如Termolator)进行了优化和调整,使其能够适用于法律文件的术语提取[6];另有一些研究专注于方法论的创新提取,例如“定位法”、“推理法”和“受控词汇法”[7]。在对术语进行审核的过程中,国外普遍实施了“多主体协作”的策略,通过法律专家、语言学者和翻译团队的共同努力,确保了术语的精确性和统一性。联合国术语库(UNTERM)是一个很好的示例,其运营和管理由联合国文件司来负责,为了保证所有文本的绝对准确,各翻译官同秘书处内的文件编写部门以及参与文件处理和管理的所有单位需要保持密切的联系,以确保术语在不同语言体系中的精确传达[8]。
与国外相比,国内在术语库建设方面起步较晚,且较多聚焦术语翻译的策略、实践和方法[9]。尽管近年来取得了一些进展,但多关注其他领域术语库建设,法律翻译术语库依然面临诸多挑战。国内研究在术语提取上借鉴了国外基于语料库的方法,但在技术应用上进行了本土化创新,尤其是在中文文本处理方面,利用分词技术和词性标注技术预处理中文文本,提高术语提取的效率和准确性[10]。然而,在术语审核方面,国内的工作多由学术团队或机构独立完成,缺乏跨学科的协作机制。这在部分情况下导致术语译法的不一致或解释尚有不尽如人意之处,欠缺准确性和可靠性[11]。现有术语库都由各个机构自建,主要为其内部使用,外界用户无法通过互联网直接访问,且数据总量偏小,更新速度慢,使用技术落后,不便于译员群体使用[12]。
总体而言,国外在法律术语库建设领域已形成较为成熟的技术路径与协同机制,尤其在术语提取算法优化、多语言概念一致性保障以及多主体协同审核模式等方面积累了丰富经验,为全球法律翻译标准化提供了范本。反观国内研究,虽已逐步关注法律术语库构建的必要性,并对数据孤岛化、技术适配性不足、跨学科协作缺位等核心问题形成初步认知,但现有成果多聚焦局部环节分析,尚未形成覆盖术语采集、动态更新、多模态应用的全流程建设路径,更缺乏可落地的实践验证。针对这一研究断层,本文以新《公司法》英译为标准化实践场景,探索兼具动态扩展性、本土适配性与跨学科兼容性的术语库框架构建流程,以期弥补国内法律术语库在系统性建设路径与实践验证层面的不足,并通过技术工具与协作范式的创新,为强化中国法律术语的国际传播效能、提升“一带一路”法治合作中的话语权供给提供可操作的解决方案。
3. 中国法律翻译术语库构建标准和原则
在构建中国法律翻译术语库的实践过程中,核心工作包含两大维度:其一是设定术语遴选的规范框架,以保障术语资源在应用场景中的专业性特征和场景适配度;其二是搭建术语库的技术架构,以解决存储系统与检索机制的功能实现问题。我国现行标准化体系中,GB/T 10112-2019《确立术语的一般原则与方法》和GB/T 13725-2019《建立术语数据库的一般原则与方法》为此提供了基础性指导方案。这两份标准为术语库建设提供了通用的原则和方法,适用于各类领域的术语库建设。然而,尽管这两份标准为术语库的建设提供了包括基本概念的定义、信息流程的安排等在内的基础框架,但由于法律术语本身具有高度的专业性和复杂性,因此,对于法律翻译术语库构建还需进一步的细化与调整才能适应其特定需求。
3.1. 确定术语的原则
3.1.1. 构建清晰合理的概念体系
本原则的中心目标是通过系统化地梳理法律概念之间的逻辑关系,建构出与法律知识结构具有高度同构性的术语框架。在这一过程中要严格按照有关术语的工作规范,对法律领域进行深入探讨,准确地界定法律概念所属于的概念领域以及全面而深刻地剖析法律概念的内涵和外延。从内涵层面上看,需要准确把握组成法律概念的核心特征;从外延层面上看,它又应明确所覆盖的特定范畴。基于这些深入的分析,需要进一步澄清法律概念间的层次结构,并明确区分属种关系中的上层和下层概念,同时也要明确下层概念是如何继承上层概念的特性的。对整体和部分之间的关系,有必要厘清整体概念与部分概念之间的结构组成以及它们之间的联系。同时,也需要注意法律概念间的种种关联关系,如行动和参与者、理由和结果,在法律专业视野下,建构与法律知识结构匹配的概念体系才能准确体现法律概念本质特点,并为正确运用术语奠定坚实基础。
3.1.2. 严格规范术语构成
此原则聚焦术语命名的科学性,通过系统性、约束条件保障法律术语的适用性、稳定性与可扩展性。在法律术语的更新过程中,要谨慎选择不易受技术发展影响的特征,避免频繁重命名。基本标准应包括一致性、贴切性、简洁性、可派生性以及正确性。术语之间要保持一致性,新术语应与现有法律术语体系无缝衔接,确保概念体系的统一。例如,在法律程序相关术语中,表述方式和结构应保持一致;术语构成还需确保贴切性,遵循法律语言群体熟悉的表达方式,避免引起混淆的结构,尽量保持中性,避免产生不必要的贬义;在简洁性方面,术语应简明扼要,在不影响准确性的前提下提高交流效率。对于较长术语,可制定合理的简写形式,并在文档首次出现时注明完整形式;术语还应具有可派生性,便于在现有术语的基础上派生出更多相关术语,丰富法律术语体系;还要确保术语的正确性,严格遵循语言的词法与句法规则,以及法律语言的使用习惯。对于相同概念的表达,优先采用中文术语,避免盲目借用外来语,并在创立新术语前,确认已有相应术语,避免不必要的变更。标准化术语的管理也至关重要,明确确定首选术语、许用术语和不推荐使用的术语,避免使用模糊或可能引起混淆的术语,对于国际标准术语要严格按照标准使用。
3.1.3. 确保定义表述精准
该原则以逻辑严谨的表述范式排除语义歧义、增强法律术语权威性和解释力。在进行定义和描述时,应当首先采取内涵的定义方法,清晰地界定概念的上位概念和与其他相关概念的区别特点,这样才能更准确地定义概念的范围。定义要符合本国语言规范、逻辑性强、结构明确、表述简明,避免循环定义和不精确的表述,保证定义确切地覆盖概念的全部外延。应当避免否定定义的运用,并尽可能地通过对概念本质特征的肯定来进行描述,只有在需要的时候才采用否定定义。此外,对于定义的补充信息(例如注释、概念描述、实例等),应明确其辅助性作用,而非替代定义本身。补充信息要满足术语库的需求,并对用户的理解给予更加充分的支持。
3.1.4. 实现指称管理标准化
这一原则以规范符号系统和命名规则来保持法律语言专业边界和表达精确性。就指称管理而言,要清楚地区分指一般概念时的用语、指个体概念时的称谓和同时指一般概念和个体概念时的标志,准确地使用术语库。对法律实体的命名,要遵守语言的格式规范、尊重语言惯例,保证命名与语法形式一致。即使当名称从语法形态上看属于复数形式时,也应该按照单数概念来对待,例如指单个个体之名。为了避免混乱,可以按需要加上管辖标记、地点名称和其他资料。同时,在符号的运用上,应保证符号形式的简洁性和易识别性,并且在某一领域内义项单一,清晰无歧义。法律文件的符号应当有明确而统一的意义,以保证用语准确一致。
通过以上四个方面的标准化建设,可以有效提高法律翻译的精确性与专业性,为法律翻译领域提供更加规范的参考依据。
3.2. 建设术语库的标准
3.2.1. 总体建设原则和术语库类型选择
本环节聚焦标准化协同机制与术语库双重属性定位,通过国家标准对接与跨领域资源整合构建基础框架。建设术语库需契合包括GB/T 18155-2000、GB/T 17532-2005等在内的与术语工作相关的标准文件,积极与其他行业协会术语库或翻译公司自建术语库展开协作,实现信息的有效交换与资源共享。明确其作为专业领域术语库的定位,做好专业分工,精准界定范围,杜绝重复、遗漏和资源浪费的现象。在术语库类型的选择上,应兼具面向翻译和面向概念的术语库特点。一方面,要涵盖中文与多种外文的术语对应词,同时包含丰富的语言学信息,如词性、语境、用例等,以满足法律翻译的实际需求;另一方面,要确保法律概念体系合理、层次分明,概念定义严格且具备权威性。
3.2.2. 系统设计与质量把控
该部分强调用户导向的系统工程思维,通过跨学科融合与全周期维护实现技术效能与实用价值的平衡。在设计原则上,需深入调研各类用户,如法律翻译工作者、法律从业者、语言学者等的需求,以大多数用户对术语库功能和数据的期望为导向,兼顾社会效益和经济效益进行开发。运用系统工程方法,融合法律和翻译相关学科的理论与技术,保障术语库的科学性。同时,设计方案要在技术和经济层面达到平衡,系统操作要简便易用。在质量要求方面,要保证硬件和软件的高可靠性,完善系统维护机制,涵盖预防性、纠错性、适应性和完善性维护。强化系统安全,从硬件设计安装、用户权限管理、病毒防护到数据保密等多方面入手,并且确保系统具备良好的可扩展性。
3.2.3. 计算机系统要求
此要求体现技术支撑的基础性作用,通过软硬件协同优化满足法律术语的复杂表征与动态扩展需求。计算机系统作为支撑基础,要能够支持多种语言、文字、符号、公式、图形等多媒体信息,以适配法律术语多样化的呈现形式。在硬件上,选择合适的计算机,保障软硬件兼容,具备充足的存储空间、高效的数据处理能力、便捷的维修服务、可靠的安全性和强大的联网及扩展能力。软件方面,要完整配套,具备灵活性、可移植性、可扩充性、良好的人机交互性、强大的数据库管理功能、高度的安全性和保密性,并且要遵循规定的字符集标准,充分考虑多语种兼容处理。
3.2.4. 术语数据质量与信息源
本要素关注数据全生命周期管理,通过权威信源筛选与结构化建模保障术语库的专业公信力与动态适应性。术语数据的质量直接影响术语库的价值。入库的法律术语数据必须经过严格核查,确保准确无误且有效,消除因来源不同产生的不一致性,保证数据元、数据类目和数据结构的完整性。数据要独立于计算机系统及存储和存取方式,同时注重适时更新,及时反映法律领域的变化。在数据类目选择上,要全面涵盖描述术语、概念、概念体系、管理和文献的数据。此外,建立合理的数据结构模型,明确术语数据元之间的关系,妥善处理术语的多语种对应关系,并且确保数据结构具备可修改性。此外,术语信息源的选择和管理同样关键。入库的概念、定义和术语要符合GB/T 10112-1999的规定,优先从权威的法律文献中选取,并经过法律专家的严格审定。术语的选择和收录要系统有序,维护法律概念体系的完整性,避免概念和术语之间的混乱。
4. 中国法律术语库的建设路径
术语库系统的创建流程首先从术语信息源的采集开始,然后规范化处理收集到的信息并录入术语库系统。该系统对信息进行处理并存储到存储器中,以达到对数据进行便捷的访问、检索、修改、删除、更新及补充的目的。同时,术语库系统能够通过联网、交换数据载体等方式与其他术语库系统进行信息交换与共享。最后,由系统输出加工后的资料给用户。下面就以新《公司法》为例,探究术语库建设中的具体应用。选取《公司法》进行研究,主要是基于它对我国公司治理和市场经济发展所起到的重要作用。该法内容涵盖了公司设立、组织结构、股东权利以及公司治理诸多方面,专业性和复杂性很强。同时,北大法宝网站还提供该法的中英文对照版本,该网站具有较高的权威性及认可度。为此,本文将基于北大法宝网站中英双语翻译对术语库的建设进行尝试性探索。
需要注意的是,本研究仅以新《公司法》为样本,且暂且不以其他法条作为参考,同时暂不讨论概念的外延分析以及概念间的层级关系等,只关注最基本的流程以及框架搭建。
4.1. 术语的提取
在文本提取阶段,本研究对SDL PhraseFinder、Similis、Xerox TermFinder、Terminology Extractor以及Topicalizer等多款文本提取工具进行了比较分析。这些工具虽能够依据词频、语法或词义实现术语提取,然而其最高精确度仅介于70%~80%之间。即便当前流行的自然语言处理(NLP)技术,诸如BERT模型,在提取精度方面亦未能突破这一局限。故而在当前提取技术未能取得较大突破的情况下,可考虑从实际应用角度出发,强化后期的人工审核环节。
考虑到上述因素,本研究选择了具有理解能力的人工智能模型如ChatGPT和DeepSeek作为辅助术语提取的工具。这类工具不但操作简便、快捷高效,而且精确度较高。由于法律术语在经济、金融等领域有着密切的关系,目前尚无明确的法律术语范围界定。本文建设术语库的目的在于为法律工作者和译者的翻译工作提供便利,故而暂以实际使用需要来定义术语的范围,即以法律工作者日常所用的专业词汇为术语。后续的研究可以以此为基础对术语作出更精细的界定。
具体执行时,本文以ChatGPT-4o为例,首先将中文版的新《公司法》文件导入并指令其理解条款内容,而后进行术语识别与提取。为防止模型因一次性处理过多信息而影响其精度,本研究通过对ChatGPT进行逐章查询来提取各章术语,同时要求它避免对已经提取出的术语进行重复抽取。最终,经过简单编辑,共获取术语118条,并将结果导入Excel表格。
4.2. 术语库的应用
在术语编纂完成之后,术语记录表可先分别以Excel、Access或者MySQL等数据库格式保存,这是因为它们是目前最常见的文字数据存储方式,并且与国际术语交换标准一致,兼容性较好。这些形式既方便实现对术语浏览、检索、共享等较为系统化、标准化的术语管理,也方便后续单机版本或在线共享版本术语库的建设。下文将介绍两种不同的术语库应用方式。
4.2.1. 单机版本术语库
将提取的Excel术语表处理成新的Excel术语表。这个表格包括两列,一列中文、一列英文,中文的表头写上“zh_CN”,英文的表头写上“en_US”。见表1。
Table 1. Glossary of terminology under the revised Company Law
表1. 新《公司法》术语表
zh_CN |
en_US |
催缴书 |
demand for payment |
第三人 |
third party |
董事会 |
board of directors |
法定代表人 |
legal representative |
法人 |
legal person |
民事活动 |
civil activity |
民事行为能力 |
capacity for civil conduct |
民事责任 |
civil liability |
名称权 |
right of name |
挪用财产 |
misappropriation of property |
票面金额 |
par value |
破产管理人 |
trustee in bankruptcy |
破产清算 |
bankruptcy liquidation |
…… |
…… |
Excel文件编辑完成后即可采用Multiterm进行后续本地的术语管理。该软件是由SDL公司开发的专业术语管理工具,在翻译工作流程中占据关键地位。其核心功能涵盖术语的创建、编辑、管理与检索,通过确保翻译项目中术语的一致性,有效提升翻译质量与效率。Multiterm作为SDL Trados Studio的子应用程序,以2022版软件为例,用户在完成SDL Trados Studio下载后,需另行获取Multiterm安装包并进行安装,方可启用该工具的各项功能。在术语库构建方面,Multiterm为用户提供了多样化的操作方式。用户既可以新建空白术语库,随后逐一添加双语术语;也能够导入已编纂完成的术语资源,并对术语条目结构进行细化处理。术语库建立完成后,用户可在软件平台上便捷地开展术语的添加、删除及修改等后续管理工作。
Multiterm在文件格式处理上展现出良好的兼容性,能够支持CSV、TXT、XML等多种格式的术语文件处理。此外,它还具备格式转换功能,可将sdltb格式的术语库转换为xml、html、rtf、txt和tbx等格式。然而,在导入Excel术语库时,操作流程相对复杂,需要先将其转换为xml文件后再进行导入,或者直接转换为sdltb格式后打开。这一转换过程既可以借助Multiterm Convert工具实现,也可通过Glossary Converter等其他软件完成。在本研究中,选择Glossary Converter进行格式转换,原因在于其操作简便,转换过程高效快捷,能够在节省时间与人力成本的同时,实现高质量的格式转换。以下为具体操作流程阐述。
在完成Glossary Converter的下载与安装后,找到并启动该应用程序,其操作界面如图1所示。在操作界面中,用户需将转出文件格式设定为sdltb。之后,将准备好的Excel文档直接拖曳至Glossary Converter的操作界面,软件便会自动执行转换任务。转换完成后,输出文件将存储于与原始Excel文件相同的文件夹中。转换完成后,有两种方式可打开转换后的sdltb文件。其一,打开Multiterm程序,点击“打开术语库”选项,在文件存储路径中找到sdltb文件并进行导入;其二,用户可直接右键单击sdltb文件,在打开方式中选择用Multiterm打开。成功导入后,界面显示效果如图2所示。
Figure 1. Operational interface of Glossary Converter
图1. Glossary Converter操作界面
Figure 2. Terminology database interface of Multiterm
图2. Multiterm术语库界面
在Multiterm软件环境下,若用户需要添加新术语,可点击上方工具栏中的“新加”按钮;若要对已添加的术语进行编辑,直接点击相应术语进行修改,修改完成后点击输入框右侧的对号予以保存;若需删除某个不再需要的术语,在术语库列表中选中该术语,然后通过右键菜单选择删除选项即可。此外,上方工具栏还提供了搜索、克隆、合并术语等丰富的功能,以满足用户多样化的术语管理需求。
当用户使用Multiterm完成术语编辑与保存操作后,在后续运用SDL Trados Studio进行翻译工作时,可将Multiterm作为插件调用,辅助翻译流程,进而显著提升术语管理效率与翻译质量。具体操作步骤如下:打开Trados Studio软件,若新建翻译项目,需依据系统提示设置项目语言对、文档来源等参数;若处理已有项目,直接打开项目即可。在项目设置的术语库选项中,依次选择“使用–基于文件的MultiTerm术语库”,选中已构建好的术语库文件,点击“打开”并“确定”,完成术语库的关联添加。进入翻译界面后,当源文本中出现术语库所涵盖的术语时,这些术语将以红线形式标注。此时,用户可通过双击术语或右键选择“插入术语翻译”获取对应译文;也可通过右键选择“术语识别”功能插入译文。若术语库中不存在对应的术语,用户可选中该词汇,右键选择“添加新术语”,在“术语库查看器”中完成编辑并保存,将其添加至术语库。翻译项目结束后,若术语库内容有更新,可将其导出,为后续翻译项目提供参考与支持。
4.2.2. 在线版术语库
在线术语搜索平台的开发流程涉及前端和后端之间的密切配合。后端需要负责业务逻辑及数据存储等功能,而前端包括用户界面显示及交互功能。两者通过API接口实现通讯,共同搭建一个高效易用的平台。
后端开发的技术框架具有多种选择,其中Java的Spring Boot框架由于功能强大、扩展性好而闻名,适用于大型工程;Python的Flask具有轻量级和灵活性,而Django自带许多内置功能,能够迅速构建应用程序;JavaScript的Node.js基于事件驱动,善于应对高并发场景。而从数据库的角度来看,MySQL开源且应用广泛,PostgreSQL在处理复杂查询和数据完整性方面表现出色。开发者要根据项目的大小、性能需求进行取舍。为实现术语查询与管理,后端开发需实现搜索,分类查询和数据管理等业务逻辑,同时设计相关API接口,例如,术语搜索接口(GET/api/terms/search={query})、术语详细接口(GET/api/terms/{id})以及术语的添加、删除、修改接口等。在实现了后端逻辑和数据库交互后,系统需要使用容器化技术(如Docker)和云服务器(如AWS、阿里云)进行部署与运维,确保平台的稳定性和高可用性。
在前端开发方面,以React、Vue.js、Angular等为主流的前端框架同样各具特色。React灵活高效,Vue.js易于上手,Angular则适用于企业级的大型项目。利用Ant Design或Material-UI等UI组件库可以迅速地创建一个既美观又具有高度交互性的用户界面,从而提高开发的效率。前端页面设计需包含搜索框,分类筛选功能,结果展示区域和术语详情页等功能。用户以输入关键词的方式查找,前端以JavaScript从输入框内抓取内容展示到网页。若要即时显示搜索结果,则可侦听输入框中的keyup事件,触发每一次输入后搜索,并更新网页显示。前端和后端的交互由Axios或者Fetch API来完成,前端发出请求得到术语数据显示在网页中。为达到优化性能的目的,前端也可以采用懒加载和分页的方法来进行性能优化,通过分页功能,避免了一次加载大量数据造成的页面卡顿问题。同时,响应式设计在前端开发中占有重要地位,利用CSS进行媒体查询保证了该平台能适应各种设备屏幕并提供更好的用户体验。最后,使用Git进行版本控制,选择合适的前端构建工具(如Webpack、Vite)打包项目即可将前端项目部署到服务器或云平台上。
前、后台通过API接口完成数据交互实现集成,前端对后台发出请求、后台回传数据以保证平台高效工作。为了实现在线术语库这一功能,必须购买域名、在云服务器中部署后端服务、通过域名获取后端服务、同时前端页面由云平台进行托管以保证用户可以成功获取。最后通过前端和后端合作完成功能完善、反应快速、具有可扩展性的在线术语搜索平台。
在前中后端的开发各环节,人工智能均能通过自动化编程提高开发效率。比如利用OpenAI中的Codex和其他AI工具能帮助开发者自动化地编写查询功能,数据管理功能,甚至术语推荐算法。这能极大地减少开发中人工干预的现象,使开发者集中精力对系统进行整体架构设计与功能优化。
5. 结语
建设具有中国特色的法律术语库,对于促进中国法律体系的国际传播、提升国际话语权具有重要的意义。该研究正处在术语库建设的前期试验阶段,通过论述建设标准、原则、方法和应用等方面内容,为后续规模化的术语库建设提供了理论和实践支持。
本研究通过梳理国内外经验,明确了中国术语库建设的必要性,提出在搭建系统性框架时应以体系化思维整合法律概念,确保术语权威性;以动态化、本土化平衡技术与人工协同;以用户需求驱动多模态开发;强调以国家标准为依托,科学适配术语资源体系。从技术上看,本文以新《公司法》为例验证了人工智能模型协助术语抽取的可行性,并与Multiterm及其他工具相结合对术语进行了规范化管理,形成了单机版和在线版术语库的开发计划,为之后的翻译实践打下了方法论基础,同时也提供了操作性参考。
尽管如此,建立具有中国特色的法律术语库仍然面对许多挑战,例如:需要准确区分同一术语在不同法律文本中的意义差异;有些概念与目标语言之间缺少直接对应关系,需要进行文化适应性的加工;法规的动态更新需要术语库的长效更新机制等。要解决以上问题,可以从建立多层次的术语体系、引进专家审定机制以及研发智能更新系统等方面入手。未来的研究需要进一步加强跨学科的合作,并依托云服务和人工智能技术进行功能扩展,例如发展移动应用,支持API调用以提高便捷性,并借助自动化工具,对术语的推荐和动态维护进行优化等、等。尽管挑战尚存,本研究以新《公司法》为实践样本,初步验证了兼具理论深度与实践价值的术语库建设路径,为法律语言基础设施的国际化奠定了重要基础。
基金项目
东北大学秦皇岛分校大创计划项目“新时代中国特色法律术语库建设初步探索研究——以新《公司法》的英译为例”(项目编号:CX25506)。
NOTES
*通讯作者。