1. 引言
浙江传统技艺是中华优秀传统文化的重要组成部分,承载着江南地域的工艺智慧与人文精神,具有重要的历史、文化与传承价值。在全球化与数字化背景下,传统技艺的跨文化传播与译介需求日益迫切,而精准、规范的汉英翻译是实现有效传播的关键。浙江传统技艺的汉英平行语料库作为翻译研究、术语规范与教学实践的重要资源,能够为传统技艺的译介提供真实语料支撑与方法论指导。目前,针对浙江传统技艺的汉英平行语料库建设尚缺乏系统性与规模化,现有资源分散、标准不统一,难以满足翻译实践与跨文化传播的实际需求。以浙江省传统技艺为对象,构建专用汉英平行语料库,通过文本采集、双语对齐、标注规范与语料分析,探索传统技艺术语翻译与篇章表达的规律,其成果可为浙江传统技艺的跨文化传播、翻译教学与非遗数字化保护提供语料支持与实践参考,助力中华优秀传统文化走向世界,提升区域文化的国际影响力。
2. 语料库及浙江省传统技艺的汉英平行语料库的建设现状
2.1. 语料库及平行语料库
1982年,Francis最早对语料库进行了定义,他认为语料库是一个用于分析语言的文本集合,是某种语言、方言或语言某方面具有代表性的文本集合[1]。从类型上看,语料库种类丰富,依据研究用途和领域可分为通用语料库、专用语料库和学习者语料库;按语种有单语、双语和多语语料库之分;按采集单位可分为语篇、语句和短语语料库,其中双语和多语语料库还能细分为平行语料库和比较语料库。平行语料库承载着相互对应的两种语言,与语言对比有着天然的联系,是语言对比研究中的默认数据源;平行语料库中的源语言和目标语言互为对应,在翻译教学和外语学习中的用途更是不言而喻[2]。
2.2. 汉英平行语料库的建设现状
目前,浙江省在传统技艺汉英平行语料库的建设上已形成“高校主导、多点突破”的格局,尤其在非物质文化遗产数字化保护领域取得了阶段性进展。从省级布局来看,浙江工商大学、浙江理工大学等高校针对丝绸技艺、青瓷烧制等浙江特色传统技艺,开展了小规模双语语料的试点采集,绍兴大学构建的“中华文化典籍翻译与传播多语种数据库”语料规模超700万字,覆盖中、英、日、韩、俄等多语种,通过典籍翻译推动越地文化“活起来”、“走出去”。同时,省内高校也积极投身专项研究,如宁波大红鹰学院曾依托“基于语料库的浙江非遗翻译研究”项目,探索非遗文本的翻译路径;由冯俏君、顾益宇编著,浙江工商大学出版社出版的《东阳木雕文化》则具体展示了针对单项非遗技艺构建汉英语料库并研究其翻译策略的实践。此外,相关术语库建设也被纳入更宏观的研究框架,如蒋丽平负责的教育部人文社科项目“国家级非物质文化遗产汉英文本平行语料库的研制与应用研究”的成果,进一步推动了非遗术语的整理与标准化。总体而言,这些工作体现了浙江省在数字化保存与外宣翻译研究方面的积极探索,正逐步从分散的资源建设向系统化、规模化平台整合发展。
尽管浙江省在传统技艺汉英平行语料库建设上已取得初步成果,但其发展仍面临显著挑战,核心瓶颈在于“生态化不足”:一方面,省级层面尚未建立统一的语料质量审核与共享机制,高校自建资源存在格式不兼容、标注标准不一的问题,导致资源分散、难以整合,本质是未遵循生态语料库翻译理论的系统整合与多主体共建共享原则,也未按术语标准化理论建立统一的传统技艺术语标注规范;另一方面,技艺覆盖不均衡,大量特色地方技艺的双语语料仍为空白,且加工深度不足,许多语料仅停留在简单对齐层面,对专业术语和文化负载词缺乏系统标注,未能以认知术语学为指导挖掘技艺背后的工艺背景与地域文化认知内涵,限制了其学术与应用价值;此外,语料库的应用场景局限于学术研究,与文旅推广、非遗衍生品开发等产业需求的对接几乎空白,开放共享程度有限,脱离了数字人文视域下的文化转译理论,未实现语料从单纯语言转换到文化内涵可视化、互动化传递的升级,未能充分释放语料在文化传播与产业发展中的潜能。这些不足共同指向了从“有”到“优”、从“分散”到“整合”的系统性升级需求。
3. 创建浙江省传统技艺汉英平行语料库的重要性
3.1. 浙江传统技艺翻译走向海外的现状短板
浙江省非遗资源丰富,拥有国家级非遗项目257个、国家级非遗代表性传承人196位,数量均位居全国榜首,在全国非遗领域占据重要地位[3]。截至目前,有大量彰显浙江文化基因的传统技艺已被录入各级保护名录,例如蓝印花布印染技艺、越窑青瓷烧制技艺、张小泉剪刀锻制技艺等国家级非遗项目,以及绍兴腐乳制作技艺、台州食饼筒制作技艺、杭缎织造技艺、南湖画舫制作技艺等省级非遗项目。浙江传统技艺承载着世代相传的工艺智慧与文化精神,在跨文化交流中极具价值。但其外宣翻译工作却存在明显短板,未能充分发挥文化传播的桥梁作用。调查发现,不管是省内文旅部门的公开信息,还是在省市级图书馆的馆藏资源中,均无针对浙江传统技艺的完整系统性汉英对照资料,只有少量的地方性图书资料。浙江传统技艺相关译介不仅数量少,还存在术语翻译难题,例如越剧里的吴语方言、水袖这类专有术语,很难在英语中找到精准对应表达。以越剧中的“水袖”为例,翻译需要同时考虑其作为戏曲服饰术语中“水袖是戏曲传统服装之一”和戏曲程式动作中“舞动水袖的表演功法”这两层含义[4]。同时,“古越龙山”、“硖石灯彩”等专有名词的翻译存在术语不统一、释义偏差等问题。在中国知网检索关键词“浙江传统技艺”,可以发现现有研究多集中于技艺的保护传承、产业发展等层面,而专门探讨翻译如何助力传统技艺走向海外、破解跨文化传播壁垒方面的研究很少。通过搜索引擎查询,浙江主流地方文旅平台对重点传统技艺有较完整的英文介绍,可形成中英对照。但中小城市及小众技艺的英文外宣翻译仍存在短板,且统一的中英对照专区建设不足。上述情况充分说明,浙江传统技艺的翻译资源呈现零散、稀少的特点,需要加快速度完成浙江非遗翻译工作。
3.2. 语料库建设对翻译研究与跨文化传播的核心价值
搭建浙江省传统技艺汉英平行语料库,既可以为翻译研究提供真实又鲜活的双语数据支持,有利于深入研究该领域汉英词汇搭配规律、句法结构的不同与语篇表达逻辑,还能给浙江传统技艺的跨文化传播增添强劲动力,增加中国地域文化在国际上的影响力与认可水平。跨文化传播的核心目标是实现文化的有效理解与认同,避免文化误解,提升文化传播的效度。而平行语料库能够整合官方、权威平台的译法,提炼出标准化、统一化的核心术语和表达,形成专属的文化传播话语体系。例如,浙江传统技艺可通过语料库建立统一的中英对照术语表,让“古越龙山”、“硖石灯彩”等文化符号在海外传播中保持一致性,强化浙江文化的辨识度和记忆点。同时,语料库可成为翻译教学的“活教材”,让学习者接触真实的翻译场景和规范译法,而非仅依赖课本中的单一案例。例如,在师范类翻译教学、非遗推广翻译培训中,浙江传统技艺语料库能让学习者直观掌握地方特色文化的翻译技巧,提升实操能力,实现研究与教学的双向赋能。
4. 浙江省传统技艺汉英平行语料库的构建
4.1. 数据来源甄别
语料采集与甄别遵循权威优先、多元补充、地域聚焦、均衡覆盖原则,以浙江省国家级、省级传统技艺非遗项目为核心采集对象,重点补充中小城市小众技艺、地方特色工艺相关文本,弥补现有语料库的资源短板,实现技艺类型与地域分布的均衡性。
在数据源选取上,第一类为核心权威数据源,主要包括浙江省非物质文化遗产保护中心、各地市非遗保护中心官方档案与报告,浙江省文旅厅、各地市文旅局官网外宣文本,省级博物馆、非遗馆展陈解说词与双语资料,确保语料的准确性与规范性。第二类为专业文献数据源,涵盖CNKI、万方等数据库中浙江传统技艺相关中英文学术论文、专著章节,以及省内高校相关双语数据库、试点语料等经过学术论证的专业文本。第三类为优质实践数据源,包含浙江非遗企业产品说明书、外贸文案、国际展会与海外展演宣传文本,以及非遗传承人口述实录整理稿,兼顾语料的实用性与场景性。
在文本筛选环节,采用人工初审 + 主题匹配度核验相结合的方式,剔除信息冗余、表述不规范、主题相关性低的内容;优先选用官方机构、非遗传承人、专业学者编写的文本,对多源文本进行去重整合;针对小众技艺稀缺文本,联合当地非遗保护中心开展真实性核验,严格核验英文文本翻译质量,排除机器直译、语法错误与文化内涵缺失内容,从根源保障语料来源的可靠性与专业性。
4.2. 文本预处理流程
针对采集到的原始汉英文本,依托雪人翻译软件开展分层、标准化预处理,统一文本格式与表述规范,提升语料机器可读性与后续加工效率,整体遵循格式转换–清洗规范–分类标引三步法。
首先,开展数字化与格式处理,通过OCR技术将纸质典籍、手稿、展陈说明转化为电子文本,完成噪声去除、倾斜校正与文字补全;对口述录音视频材料使用语音转文字技术生成文本,统一转换为UTF-8编码的TXT、XLSX等雪人翻译软件兼容格式。其次,进行内容清洗与规范,利用自然语言处理工具完成分词、分句、标点统一,清除特殊符号、乱码、多余空格与空行;对吴语方言、工艺口语化表述进行规范转写,保留“开片”、“打坯”、“针拗结扎”等核心技艺术语,删除广告性冗余内容,保留工艺描述、历史渊源、文化内涵等核心信息。
在此基础上完成文本层级切分与分类标引,按照陶瓷烧制、雕刻工艺、纺织印染、食品制作、传统手工技艺等进行一级分类,以具体非遗项目开展二级标注,并附加技艺流程、材料介绍、传承人故事、商业推广等主题标签;同时,在雪人翻译软件中完成汉英文本语篇–段落–句子–短语/术语四级层级切分,对硖石灯彩、花雕酒等专有名词与专业术语单独切分,人工校对汉英内容一致性,修正漏译、错译、拼写与语法错误,最终形成标准化、高质量的原始语料文本库。
4.3. 双语对齐实施
本研究以雪人翻译软件为核心工具,采用机器自动对齐 + 人工精校相结合的人机协同模式,实现汉英语料从语篇到术语的全维度精准对齐,有效解决技艺术语不统一、文化负载词难处理、句式差异引发对齐偏差等问题。
操作流程遵循先段后句、先粗后精的策略,先将预处理后的标准化汉英文本导入雪人翻译软件,利用平台语义匹配算法完成语篇级与段落级自动粗对齐,由系统自动标记未匹配与低匹配度段落;再开展句子级、短语/术语级精细对齐,经软件初步自动匹配后,由具备双语能力与浙江非遗知识背景的人员逐句核验校正,对长难句、工艺流程句合理拆分,修正语义错位与语序偏差问题。
对齐过程同步开展术语统一核验,基于认知术语学理论挖掘浙江传统技艺术语内涵,建立核心术语标准化译法对照表,对多译法术语进行场景标注。最终将完成精准对齐的汉英平行语料,通过雪人翻译软件导出为TMX翻译记忆格式与XLSX格式,兼顾翻译软件兼容性与人工查阅便捷性,形成规范的句级汉英平行语料。
4.4. 元数据标注方案
遵循生态语料库翻译理论与术语标准化理论,依托雪人翻译软件语料标注模块,构建基础元数据、专业元数据、文化与翻译元数据三位一体的多维度标注体系,所有标注采用中英双标签形式,提升语料库检索效率、分类精度与跨语言应用价值。
基础元数据主要标注语料来源、采集时间、文本类型、编码格式等基础信息,实现语料可溯源、可管理。专业元数据聚焦技艺属性,标注工艺环节、核心技法、术语类型、技艺门类等专业信息,强化语料库的非遗专业指向。文化与翻译元数据重点对文化负载词、地域文化元素补充文化注释,解释历史背景与地域内涵;同时标注译文所采用的直译、意译、异化、归化等翻译策略,为非遗译介研究提供依据。
标注工作采用人工标注 + 工具辅助验证模式,由非遗研究人员与翻译专业人员组成团队,使用统一关键词表完成标注,确保信息准确统一;标注后的语料与元数据存入数据库,支持按技艺品类、翻译策略、使用场景等多维度检索与关联调用。
4.5. 语料库的后期维护与更新
为破解现有语料库生态化不足、开放共享程度低、更新滞后等问题,本研究建立共建共享、动态审核、分级开放的长效维护机制。联合浙江省内高校、文旅部门、非遗保护机构与翻译机构组建语料库共建联盟,定期采集新增非遗文本、海外传播新译法、技艺发展新内容,持续扩充语料规模与地域覆盖面。
设立语料质量审核小组,按照数据甄别、文本预处理、双语对齐、元数据标注的全流程标准,对新增语料统一加工与核验,保障语料库时效性与权威性。在安全可控的前提下逐步推动语料库开放共享,面向高校翻译教学、非遗企业海外推广、政府文旅外宣等不同对象提供分级授权服务,实现语料库建设与非遗跨文化传播的良性互动与长效发展。
5. 浙江省传统技艺汉英平行语料库的应用
5.1. 翻译实践与教学赋能
Mona Baker在1993年开创性地把语料库方法应用到翻译研究当中,使语料库翻译研究迅速发展,逐步成为描述翻译研究中的一种新范式[5]。基于语料库的研究为翻译学提供了新的方法和思路,现在学界形成的共识是利用语料库进行翻译研究是一种不可或缺且可靠的手段。语料库收录绍兴黄酒、五芳斋粽子制作技艺等非遗项目的汉英平行文本,涵盖“复式发酵工艺”、“手工针刺花纹”、“龙窑炉式”等核心术语及“古越龙山”、“硖石灯彩”等专有名词,通过大数据统计建立相应术语对照表,解决传统技艺翻译中术语不统一、释义偏差等问题。例如,针对“花雕酒”的多样译法,通过分析语料库中“Classical Hua Diao Wine”、“Huadiao Jiu”等表达的使用场景与频次,明确正式文本、商业宣传、文化交流等不同场景的优选译法,助力非遗相关文件、产品说明书、文化典籍的精准翻译。语料库内容也能转化为适合中小学的双语文化教材,通过“绍兴黄酒的历史”、“五芳斋粽子的制作”等趣味主题,让学生在学习英语的同时了解家乡传统技艺。例如,编制双语绘本,收录“乌镇水阁”的双语介绍与插图,帮助学生掌握基础英语表达的同时,增强文化认同感;设计双语实践活动,让学生通过翻译简单的技艺术语,深化对传统技艺的理解。高达亿万级容量的语料库辅以计算机筛选分析技术,可以应用于英语语法教学、词汇教学、半自动化词典编纂、学生语言错误分析等诸多方面。黄若好和何高大(2009)认为,基于语料库数据编写大型学习者词典、语法教学参考书乃至语言课程教科书是近年来的趋势[6]。因为基于语料库技术(Corpus-Based)的教材、教学,使课堂不再单纯受制于教师的个人经验、知识、技能,而是通过丰富的语料资源和应用频次分析,提升教学针对性和教学内容的代表性,为学生提供最具真实性的练习环境和最丰富的学习内容,使学生进入学习主动性更高的“语料库驱动学习”。个性化与普及化相结合是构建浙江本土传统手工技艺课程体系的另一重要原则。非遗传承需要面向不同层次、不同兴趣和不同需求的学习者。课程体系应兼顾普及教育和个性化培养,为所有学生提供了解和学习传统手工技艺的机会,同时根据学生的兴趣和特长提供个性化的指导和深度学习的途径。在普及教育方面,应设置基础课程,使学生普遍了解和掌握基本的传统技艺;在个性化培养方面,通过选修课程、专题讲座、工作坊等形式,帮助有兴趣和潜力的学生深入学习某一技艺,成为这一领域的传承者和创新者[7]。同时,为高校翻译专业提供针对性教学资源,围绕浙江省传统技艺特色设置翻译实训模块。学生可通过检索语料库中“硖石灯彩八大技法”、“龙井茶炒制工艺”等文本的双语转换案例,学习文化负载词、长难句的翻译策略;教师可提取语料中的典型错误案例(如“水阁建筑”误译为“water pavilion building”而非“water-front pavilion architecture”),开展纠错训练,同时借助语料库的真实语境,培养学生在文化传播场景下的翻译能力,推动翻译教学与地方文化传播需求深度对接。
5.2. 宣传到社会普及,公共服务能力提升
为浙江省传统技艺的国际推广提供文本支撑,分析语料库中非遗项目介绍、旅游宣传册、产品推广文案等双语文本的语体特征与传播效果。例如,针对绍兴黄酒出口日本的“金龙系列”宣传文本,总结日语市场偏好的表达风格(如简洁化表述、突出产品适配居酒屋场景的特点);针对龙井茶的国际推广,提炼“皇帝的茶”(The Tea of the Emperors)等具有文化吸引力的译法,优化官网、社交媒体、国际展会的宣传内容,增强海外受众对浙江传统技艺的理解与认同。构建传统技艺文化知识库,将语料库中的双语内容与文化背景注解相结合,为国际文化交流活动提供参考。例如,在硖石灯彩参与国际灯会时,依托语料库整理“针、拗、结、扎”等技法的双语解释及历史渊源介绍;在台州乱弹海外演出时,提供剧目名称、表演绝技的标准译法与文化内涵说明,帮助海外观众理解“耍牙”、“双骑马”等非遗元素的独特价值,推动浙江传统技艺走向世界。
语料库的打造为浙江省、各地市的政府宣传平台(官网、海外社交媒体)提供传统技艺双语内容素材,系统化传播浙江非遗文化,丰富“诗画浙江”的国际形象内涵。为图书馆、博物馆、文化馆等公共文化场馆提供双语非遗资源,开设传统技艺双语展览、线上双语讲座,让社会大众尤其是外籍人士便捷了解浙江传统技艺,提升公共文化服务的国际化水平。提取语料库中的通俗内容,制作传统技艺双语科普短视频、图文手册,通过短视频平台、海外社交平台传播,实现浙江传统技艺的大众性、国际化普及。
与国内其他省份的传统技艺语料库、非遗研究机构合作,建立全国传统技艺双语语料共享机制,互通语料资源,共同完善中国传统技艺的汉英译介标准。联合高校、文旅部门、非遗保护中心、翻译机构、传统技艺企业,组建语料库共建共享联盟,定期收集、更新语料,确保语料库的时效性、权威性与丰富性。同时也能以汉英平行语料为基础,逐步拓展日、韩、西、法等多语种语料,适配不同海外市场的语言需求,进一步提升浙江传统技艺的全球传播范围。
5.3. 非遗保护与传承数字化
图书馆作为信息资源以及文化保护中心,拥有丰富的图书、资料等文献资源。数字人文和语料库语言学都是依赖数字技术解决传统研究技术落后的新兴学科,均实现了“定性–定量”二者结合的方法转变。与其他机构合作,可以共同开展各种形式的推广活动,吸引更多公众参与和关注;还可以通过资源共享实现非遗实体资源与非遗数字资源的优势互补,从而提高推广活动的综合效益,为非遗的推广提供更好的支持和保障[8]。将浙江省传统技艺的古籍记载、匠人访谈录、工艺规程等汉英文本系统录入语料库,实现文献的数字化归档与长期保存。例如,收录《古禾杂识》中关于五芳斋粽子的最早文字记载及英译本,整理桐乡蓝印花布“丰同裕染坊”的历史文献双语资料,为非遗技艺的溯源、研究提供完整的文本依据,避免传统文献因物理损耗导致的信息流失。语料库突破单一文字记录局限,实现技艺文化多维度数据的全覆盖留存。比如永康五金工匠口述档案语料库,会同步采集工匠口述录音、技艺操作高清视频,以及器具、作品的影像资料,还挖掘行业口诀、交易暗语等文本语料。基于语料库开发非遗技艺传承数字化平台,为传承人提供双语学习资源。例如,针对年轻传承人,提供“绍兴黄酒酿制技艺”的双语视频脚本与文字说明,帮助其了解国际市场对产品的表述需求;针对跨地域传承,通过语料库的双语对照功能,让不同地区的学习者精准掌握“黄沙狮子”的表演动作术语、“仙居针刺无骨花灯”的制作流程表述,助力传统技艺的标准化、跨地域传承。在商业层面,语料库为非遗相关企业提供商业翻译与市场分析支持,企业可通过语料库查询同类产品的国际市场表述案例,优化产品包装、说明书、外贸合同的双语内容。例如,五芳斋在拓展海外市场时,可参考语料库中“糯而不烂、肥而不腻”的经典译法(Glutinous but Not Mushy, Fatty but Not Greasy),确保产品卖点准确传达;古越龙山在制定出口产品策略时,通过分析语料库中不同国家市场的文本偏好,针对性调整宣传重点与表述风格,提升产品国际竞争力。提取语料库中传统技艺的文化元素与双语表述,为文创产品开发提供灵感。例如,从“硖石灯彩”的双语图案描述中提取经典纹样元素,设计双语文创周边;结合龙井茶“栗香”、“醇厚”等双语味觉描述,开发具有文化辨识度的食品文创包装,实现传统技艺与现代商业的融合发展。
6. 结束语
浙江省传统技艺的汉英平行语料库的建设与应用,为该领域提供系统化、规模化的语料资源支持,为浙江省传统技艺的精准化、规范化英译提供了切实可行的方案,也为其他类似传统技艺的语料库建设提供了有益参考。然而,研究也存在一些局限:语料库的智能化程度有待提高,目前虽具备基本的检索功能,但在智能推荐方面仅基于简单的关键词匹配,尚未实现基于深度学习算法的个性化推荐,且与机器翻译模型的协同工作不够紧密,未能充分发挥其在辅助翻译决策和提升翻译效率方面的潜力。
未来,可以从以下几方面改进和完善。一方面,拓宽语料收集渠道,丰富语料类型,不仅涵盖更多传统技艺种类,还纳入相关的历史文化背景资料、传承人访谈记录等,以增强语料库的全面性和深度;另一方面,加强与人工智能技术的结合,引入先进的自然语言处理算法,优化智能推荐系统,使其能够根据用户的翻译习惯和特定需求提供更精准的语料推荐,同时探索与机器翻译模型的深度融合,实现“语料库-AI翻译–实际应用”的高效闭环,进一步提升浙江省汉英翻译的质量与效率,助力其在国际舞台上更好地传播与交流。
基金项目
2025年度浙江省哲学社会科学规划课题“浙江省国家级非物质文化遗产汉英平行语料库建设与应用研究”(25NDJC119YB)。