1. 引言
外语能力是国家安全和国家传播能力的重要部分。信息源语言的掌握,对第一手资料和研究素材的获得非常重要,是开展各学科各领域具体研究的基石。泰国是“一带一路”和全球文明倡议重要节点国家,中泰关系具有示范和引领作用。汉泰语言研究有利于国家外语战略和国家传播能力的建设。
词是语言的重要单位,核心词具有常用度高、分布面广、稳定性强、流通域宽、组合力强特征 [1] 。义项是词义的重要表述,最能代表事物属性和特质 [2] 。义项所指称的词义表达功能、义项数所代表的词义隐身功能、义项之间的词义认知路径、义项的语法化和词义搭配等研究等都有赖于对词汇义项的分析。核心词的义项分析,有利于我们了解各个语言基础词汇的词义分布情况,对词汇教学、词典编纂、语料库建构以及跨文化翻译与交际等都具有重要意义。
2. 核心词与义项的选取
2.1. 核心词及对应词选取
随着现代语义学进入“语义场”研究时期,同一概念在不同语言的义项分布成为语言类型学关注的对象,核心词的词义研究成为汉外对比研究的一个热点。核心词是语言中比较稳定的词语,在历史比较中有重要的学术价值 [3] 。核心词具有句法可替代性、搭配广、衍生意义多、文化中立、各行业通用、中性词等特点,具有稳固性、全民通用性、能产性 [4] 。
最早的语言通用词汇表是20世纪20年代由C.K. Ogden和I.A. Richards制定的“基本英语词汇表”。其“用尽可能简单的词表达思想”的研究方法对后来者启发甚大。40~50年代,M. Swadesh和J.H. Greenberg等学者在分析欧洲、美洲、非洲和澳洲语言的基础上提出《二百词表》和《百词表》,具有重要地位。基本上所有语言的词汇都应该包含这二百词,且只要认识这二百词就可以利用该种语言作最基本的沟通。
汉泰核心词对比研究主要以个案研究为主。如“红” [5] “虎” [6] “头” [7] “黄” [8] 等。研究表明,汉泰两国人民的基本认知体验具有普遍性,其差异性源于地域环境及文化背景的不同,但仍缺乏对核心词释义整体面貌的分析与探索。
本文以Swadesh《二百词表》207个核心词为考察对象,依据词义对应优先、通称优先、使用频率优先等原则,分别选取了汉语和泰语对应词。如“fat”,根据《二百词表》的设置理念,其表达的语义是“脂肪、油、油脂”,而不是“肥胖”。通过比较汉语对应词“脂肪”“油”“油脂”等,我们选取词义完全对应的“脂肪”一词;又如“mouth”“foot”“belly”,分别使用“嘴”“脚”“肚子”,而摒弃了书面语浓郁的“口”“足”“腹”。泰语对应词相仿,如“I”,泰语对应词有“ผม (男性自称)”“ฉัน (女性自称)”“ข้าพเจ้า (正式场合自称)”“ดิฉัน (女性礼貌自称)”“หนู (晚辈对长辈自称)”“ข้า (长辈对晚辈自称)”“กู (不礼貌的自称)”,我们选取常用词“ผม/ฉัน”,且二者义项均为1,不影响统计。
2.2. 义项的选取
词的义项指字典、词典中同一个条目内按意义分列的项目。义项的选取需要解决词典义项收录和同形词问题。我们分别选取了最通用和最具权威的《现代汉语词典》(第7版) (以下简称《现汉》) [9] 和泰国皇家研究院(Office of Royal Society)的泰语词典พจนานุกรมฉบับราชบัณฑิตยสถาน (2011版) (以下简称《现泰》) [10] 。《现汉》创于1897年,1978年第1版,多次修订,反映了现代汉语词汇的新面貌和相关学科研究的新成果。《现泰》始于1927年泰国司法部的百科全书,1950年第1版,经多次修订,是泰国最具权威的泰语词典。从词典性质来看,二者均属于语文性词典;从词典释义来看,二者均以语文性释义为主、百科性释义为辅;从词典收词来看,《现汉》约6.9万个条目,《现泰》约3.9万个条目,都是中型词典。《现汉》《现泰》为核心词义项的选取提供了可靠的资料来源。
在进行义项选取时,同形词是数据处理的难点。同形词指形同义不同的一组词,包括形同而音、义不同,或形同音同而意义上需要分别处理的一组词。针对同形词,我们采取词义优先原则。《现汉》分立条目,如“long”汉语对应词“长(cháng)”,另分立“长(zhǎng)”,我们选择“长(cháng)”义项。或分立条目并右上标标注以示区别,如“flower”汉语对应词“花”,《现汉》标注为“花1”“花2”。依据词义优先原则,我们选取“花1”义项。《现泰》一般不分立条目,依据同一词形下顺序编排,如“rain”泰语对应词“ฝน”,《现泰》列项为“ฝน๑ (๑)…(๒)…ฝน๒ (๑)…(๒)…”,经过词义考察,我们选择“ฝน๑”的两个义项。泰语共有66个同形词。如上文提到的“I”,泰语对应词选择了“ผม/ฉัน”。“ผม”有两个词,分别表示“ขนที่ขึ้นอยู่บนศีรษะ (头发)”和“คำใช้แทนตัวผู้พูดเพศชาย (男子自称)”;“ฉัน”有四个词,分别表示“คำใช้แทนตัวผู้พูด (女性自称)”“กิน (吃)”“เสมอเหมือน (与……一样)”和“มีแสงพุ่งออกไป (有亮光)”。经过考察,我们选择含“自称”义项的那个词。
3. 汉泰义项分布对比
3.1. 义项分布
在进行义项分析时,我们根据的是“语义场–词族–词”比较模式,即依据被比较语言的语义,建立一个语义场,系联同族词,再拿单个的字词进行比较。根据《二百词表》的义项分布,汉泰核心词建立了四个语义场:名物义场、动作义场、性状义场、关系义场,前三个义场是关于事物、状态、性质等概念内容的分类,关系义场是从语言系统角度进行的分类。
经过207个核心词的义项处理1,汉泰核心词义项分布见下表1。
据数据统计,汉语义项总数为955个,泰语义项总数为533个,汉语义项数近乎泰语的两倍。汉语有128个核心词的义项数多于泰语,泰语有37个多于汉语,42个汉泰语义项数相同。汉语义项数分布不均衡,差距较大,最高义项数为24个,最低1个,平均义项数4.6个。汉语抽象物、肢体动作、自然变化、形貌、性质和辅助词等语义场的平均义项在5个以上,具有较强的词义引申功能。自然物、抽象物、肢体动作、形貌、知觉、性质情状、代词、辅助词等义场的平均义项数是泰语的两倍以上,其中抽象物义场的义项数汉泰语对比显著。泰语平均义项数2.6个。泰语的动物义场义项数高于汉语,躯体器官、植物、生理心理活动、自然变化、数词等义场的义项数与汉语相近。整体看来,汉语核心词的义项比泰语更为丰富、精细。
Table 1. Distribution of core words meanings in Chinese and Thai
表1. 汉泰核心词义项分布
3.2. 名物义场
名物义场核心词共有85个,占41%。其中动物义场13个、躯体器官义场30个、植物义场10个、自然物义场25个、抽象物义场7个。
动物义场共有13个词,分属“人”与“动物”两大类,泰语的义项数比汉语多。汉语平均义项1.8个,泰语2.4个。汉语有1个核心词“人”义项数多于泰语,泰语有5个核心词“เด็ก (孩子)”“สามี (丈夫)”“พ่อ (父)”“แม่ (母)”“หนอน (虫)”义项数多于汉语。“人”类,泰语义项分布显著多于汉语;“动物”类,汉语和泰语的义项分布较为单一,多是该词的基本义。
躯体器官义场共有核心词30个,包含组织、头部、躯干、器官、动物特有类等五方面,汉语义项数和泰语义项分布相当,且高于第一类的动物义场。这表明汉泰两种语言的躯体器官核心词引申能力强于动物义场。汉语有11个核心词义项数多于泰语,如“皮、骨、眼、牙、背、胸、手、脚、翅膀、角、羽毛”。泰语有10个核心词义项数多于汉语。
植物义场共有核心词10个,包含植物总称和植物部分,汉语核心词义项数多于泰语,汉语平均义项数为4.4,泰语为2.7,汉语植物义场引申功能强于泰语。汉语有6个核心词义项高于泰语,分别为“树、花、草、种、叶、根”。泰语有4个高于汉语,分别为“ป่า (森林)、กิ่ง (枝)、ผล (果)、เปลือก (树皮)”。
自然物义场共有核心词25个,包含天体、地貌、气象、自然物质等,汉语义项数高于泰语,平均义项数为4.7,将近泰语的两倍。汉语有16个核心词的义项数高于泰语,分别为“天、河、湖、海、地、山、风、冰、水、烟、火、灰、石、沙、路、绳”。泰语有4个核心词义项数高于汉语,分别为“อาทิตย์ (太阳)、จันทร์ (月亮)、ดาว (星星)、ฝน (雨)”。
抽象物义场共有核心词7个,汉语核心词义项数显著高于泰语,平均义项数为6.1,而泰语只有1.5。这表明汉语的时间、空间核心词引申义丰富。泰语的时间词和方位词义项均表示基本义,较为单一。
3.3. 动作义场
动作义场核心词共有58个,占28%。其中肢体动作义场36个、生理心理活动义场6个、社会活动义场9个、自然变化义场7个。
肢体动作核心词共有36个,包含头部动作、上肢动作、下肢动作和全身动作等。头部和上肢的动作核心词占比较大,属于人类发出动作的主要肢体。汉语肢体核心词义项数显著高于泰语,平均义项数在6.0,是泰语的两倍。汉语有26个核心词的义项数高于泰语,泰语有6个核心词的义项数高于汉语。义项数大于10的共有7个,依次为“打、拉、来、坐、推、拿、走”。总而言之,汉语肢体动作义场义项引申比泰语显著,更具动作代表能力。
生理心理活动核心词共有6个,生理心理活动核心词的汉泰义项分布均等,仅在个别词汇汉语义项数稍高。
社会活动核心词共有9个,主要为人类社会活动的基本词,汉语社会活动核心词义项分布是泰语的两倍,平均义项数在5.2个。汉语有6个核心词的义项数高于泰语,分别为“分、计、斗、杀、给、在”。泰语有2个核心词的义项数高于汉语,分别为“ล่า (猎)、เล่น (玩)”。
自然变化义场核心词共7个,包含自然现象的冷凝消融、物态变化和物体方位改变等。汉语核心词义项分布高于泰语,平均义项数6.1。汉语有5个核心词的义项数高于泰语,分别为“冻、烧、浮、流、烂”。泰语有1个核心词“ตก (落)”的义项数高于汉语。
3.4. 性状义场
性状义场核心词共有37个,占17.9%。其中形貌义场12个、知觉义场11个、性质情状义场14个。
形貌义场核心词共12个,包含对事物体积、面积、长度、高度等形状、外貌的描绘。形貌义场中汉语核心词平均义项数6.3个,是泰语的两倍,且汉语的每一个核心词义项数均高于泰语。这说明汉语形貌义场核心词的义项引申能力高于泰语。
知觉义场核心词共11个,指反映客观事物的整体形象和表面联系的心理过程,如颜色、利顿、冷暖、干湿、滑糙等。知觉义场中汉语核心词平均义项数4.9个,是泰语的两倍。汉语有8个核心词义项数高于泰语,分别为“红、黄、白、黑、钝、冷、干、滑”。汉语的知觉义场核心词义项引申能力也强于泰语。
性质情状义场核心词共14个,包括事物的属性、状态、情形等。性质情状义场中汉语核心词平均义项数5.7个,是泰语的两倍。汉语有12个核心词义项数高于泰语,分别为“新、旧、多、少、一些、满、男、女、远、近、好、对”。整体而言,泰语性状义场核心词义项引申能力也弱于汉语。
3.5. 关系义场
关系义场核心词共有27个,占13.1%。其中代词16个、数词5个、辅助词6个。
代词义场核心词共16个,包括人称代词、指示代词和疑问代词。代词义场中汉语核心词平均义项数是泰语的两倍,汉语有7个核心词义项数高于泰语,分别为“我、他、这、那、什么、哪、谁”。但整体而言,汉泰二者的代词义场的引申功能不是很显著。
数词义场核心词共5个,数词义场中汉泰语核心词平均义项数差异不大,主要表现在“一/หนึ่ง”。
辅助词义场核心词共6个,包括副词、连词、介词等。辅助词义场中的汉语核心词平均义项数5.0,6个核心词的义项数均高于泰语。
4. 释义分布的差异分析
词义分布一直是语义研究、词典编纂、自动化翻译和自然语言处理等重要研究方向。从概念义到引申义的扩大、递进、缩小以及词性引申等展现了人类对语言表达功能更深层次的需求。
4.1. 多义性形成的认知机制不同
认知语言学认为语言所体现的现实结构是人类心智作用的产物。多义现象是人类以隐喻和转喻等认知手段为工具,对基本范畴语词进行意义扩张的结果 [11] 。在同一语义场的核心词,具有相同的特点,往往存在着相同的认知规律,即使是在不同的语言中也表现了某种程度上相同的义项分布规律。但不同语言中词的本义相同,但同一概念义到转喻义、隐喻义的延展不同,这体现了不同民族词义认知的不同。
随着语言交流地位的提升,词汇的不同义项和所包含的意义数量即义项数往往难以确定,其选择的过程主要依赖于人们对某一单词的百科知识。词义认知主要包含转喻和隐喻两种方式,转喻体现了事物的相关性,隐喻体现了相似性。隐喻包含概念隐喻、方位隐喻、实体隐喻。概念隐喻即用一种概念构建另一种概念。方位隐喻体现了动作的方向性。实体隐喻指抽象概念的实体化,常常包含抽象的情感、情绪、思想、关系等,常常以概念隐喻为基础。
汉语词义认知路径以隐喻为主,泰语以转喻为主。如上文提到的汉语“打”义项数最多,其词义认知路径如下图1。
Figure 1. The cognitive path of Chinese “Da”
图1. 汉语“打”的义项认知路径
“打”的造字原义指“用手挥锤敲击,将钉子钉入”。“丁”为本字表示拍打钉子之义,与“扌”一起构成了“打”的义项①“用手或器具撞击物体”,基本义包含[向下] [撞击]义。[撞击]义通过概念隐喻路径隐喻指[撞击] [制造],义项得到扩大引申。在概念隐喻的基础之上还扩大了方位隐喻路径,由“打”作用力的[向下]到力扩散到[向内] [向外] [向上]三种方位。在表达抽象概念时通过实体隐喻的认知路径,人与人的关系、活动、方式等使用“打”表达出来。
泰语“ตี (打)”词义认知路径如图2。
Figure 2. The cognitive path of Thai “Dee”
图2. 泰语“ตี (Dee/打)”的义项认知路径
泰语“ตี (打)”的词义引申以转喻为主,表达了与“手”相关的各个动作。“ตี (打)”还可以词性引申作时间名词,表示凌晨一点到六点,如“ตีห้า”指凌晨五点。以泰国传统敲打钟鼓的方式计时。
总而言之,汉泰两种语言词汇义项分布不同的根本原因在于词义引申的认知路径的差异。汉语词义引申以隐喻为主,泰语以转喻为主。
4.2. 汉泰词典义项收录精细化相异
《现汉》从1978年正式出版以来,以推广普通话、促进汉语规范化为宗旨,因此在增删改方面十分谨慎。从整个词典在修订过程中的条目收录数据上可以看出,如第一版约5.6万条词目,第三版6万余条,直至2016年第七版约6.9万条目,近四十年来的《现汉》条目数据增长较少。《现汉》词汇的新义选取也十分谨慎。以“打”为例,1973年商务印书馆的《现汉》(试用本)收录的“打”义项共23条。比较发现,从第一版到第七版,“打”仅新增一条义项“用割、砍动作来收集”。《现汉》的修订说明多次提到“体现相关学科研究的新成果”,检索知网,关于“打”义项分析的高质量论文不足二十篇。核心词乃至更多的常用词的义项研究严重不足。如表[结合]义的“打成一片”,表[武打]的“唱作念打”,表[战争]义的“三打祝家庄”,表[猜]义的“打谜语”,表[扎入]的“打针”,表[收获]义的“打粮食”等,表[评议]的“打分”等义项均未收录。
相比较而言,《现泰》的“ตี (打)”义项较少,以转喻为主,其词义引申显示了与“手部动作”极大的相关性,义项表达时也就较为具体。如“ตีตรา (盖章)”,“ตี (打)”指用手按压印章的动作,这与汉语的“打印”“打戳”词义引申相似。又如上文提到的“แม่ (母)”“เนื้อ (肉)”等。
因此,建议《现汉》提高词汇释义的精细化,不能以概括性的归纳语句作为义项条目,如“打”义项㉔“采用某种方式”就较为模糊,难以精确地为教学和研究提供参考。核心词乃至更多的常用词的义项研究应得到重视,词典编纂和词汇研究应将常用词义项的精细化作为重点研究对象。
4.3. 义项提取应充分使用语料库技术
从汉泰核心词义项的分布来看,汉泰词典收录的词汇义项常常少于语言实际使用的义项数。如动物义场的“dog、snake、bird、fish、worm”,在同为中型词典的《牛津高阶英语词典》(第7版)义项数为“8、2、3、6、7”,而汉语对应词“狗、蛇、鸟、鱼、虫”和泰语对应词“หมา、งู、นก、ปลา、หนอน、เหา”的义项均只有1个。在语言实际使用中,汉语和泰语动物义场核心词的动物特性常常通过隐喻认知路径进行词义引申,比喻人或事物的特性,如“狗腿儿”“蛇蝎心肠”等,这就需要充分利用现代语料库技术。语料库已成为语言学理论研究和应用研究不可缺少的重要资源,是传统语言研究的重要补充。20世纪80年代,语料库技术已广泛应用于英语词典如牛津、朗文等词典的编纂与研究中。《现汉》和《现泰》均有较长的编写历史传统,刚开始的义项多从几十万个人工记录的“卡片”内容提取义项,为以后的词典修订奠定了坚实的基础。随着现当代科学技术的发展,国家语委“现代汉语平衡语料库”、北京大学“CCL语料库”、北京语言大学“BBC语料库”等一大批汉语语料库相继成熟,泰国TNC国家语料库也是当前发展较好的泰语语料库,为词典义项提取提供了大量的语料和分类、计算功能。
在传统词典的基础之上,将语料库技术与义项的提取和词典的编纂相结合成为词典学发展的新诉求。如何利用定量与定性相结合的方法把词典的收词、条目、义项提取建立在科学基础之上也成为词典学研究的难点。在现代语料库技术的加持下,《现汉》《现泰》的修订应重视词义义项的提取与精细化释义,这仍需要广大学者的努力。
5. 总结
现阶段,高校外语教育的新使命便是充分利用自身的语言优势,助力讲好中国故事。在加强国际传播能力建设和推进文明互鉴的进程中,外语教育应践行新责任,展现新担当 [12] 。构建人类命运共同体、传播中华优秀文化新形势要求下,外语能力显得尤为重要。泰国是中国东南亚重要贸易伙伴,中泰交流源远流长。掌握汉泰语核心词的词义特征有利于跨文化交际的开展和中国文化走出去战略的深入。从207个汉泰核心词的义项分布和名物、动作、性状、关系义场等层级分布的考察,汉泰核心词在各个义场表现出不同的分布特点。产生两种语言义项分布异同的根本原因在于语言多义性形成的认知机制。常用词义项的精细化应成为词典编纂和词汇研究的重点研究对象,通过结合现当代语料库技术与义项提取理论提高《现汉》《现泰》等词典的收词、条目和义项归纳能力。在新时代对外语能力的新要求下,我们应积极发挥小语种优势,综合全球视角助力民族复兴。
基金项目
本研究获中国外语战略中心–外教社“世界语言与文化研究”一般项目(WYZL2022GD0014)和教育部语合中心国际中文教育研究项目青年项目(21YH70D)资助。
参考文献
NOTES
*通讯作者。
1《现汉》汉语义项不包括同形词义项,不统计表“姓氏”的义项。《现泰》泰语义项不包括同形词义项。