1. 引言
扩展意义单位由Sinclair (1996: pp. 75-106)提出,他主张要将节点词、搭配词、类联结、语义趋向和语义韵作为一个整体来进行最大路径上的研究,而不能将意义局限于单个词[1]。搭配反映了词汇与其他词汇的共选;类联结体现了词汇与语法关系的共选;语义趋向是词汇与语义关系的共现,是节点词与特定语义集合之间的共选体现;语义韵则是最高级别的抽象,体现了说话人的语用和交际意图。
扩展意义单位模型被提出之后,围绕其在近义词辨析和二语对比方面的研究较多,比如Xiao & McEnery (2006)对比了汉语和英语中的部分常用词的搭配、类联结、语义趋向和语义韵[2];李晓红、卫乃兴(2012)将其应用于对比汉英中部分被认为是初级对应单位的词汇,并利用语义韵和语义趋向判断二者的对应关系[3];童富智、修刚(2022)将扩展意义单位应用于翻译中,判断在汉日文本中可以互译的两个词的对应关系[4]。
总的来说,扩展意义单位被广泛应用于对比语言学、词义辨析、跨语言对等单位意义的分析等研究方向上。但是先行研究大量集中于汉英对比,在汉日对比领域上的关注不足;同时,既有研究选择的研究对象中缺乏对汉日状态形容词的研究。因此,本研究拟利用扩展意义单位,从形式、意义和功能三个层面,选择汉日状态形容词中语料数最多的“鲜红”和「真っ赤」为研究对象,分析二者在词汇、语法、语义和语用上的的异同之处。
2. 文献综述
2.1. 扩展意义单位与对比研究
Sinclair (2004)认为构建语言的最基本单位不是具体的单词,而是多个词所组成的词项,他把这种词项称为扩展意义单元,强调以词项作为整体进行最大路径研究[5]。这种研究方法能涵盖词汇从意义、功能到语用的全部方面。
在扩展意义单位中除了节点词之外的四个组成单元中,搭配是其余后续成分的基础[6],其体现的是词项之间的共选关系,主要是反映节点词在词汇方面的功能,也是意义的一种模式[7]。类联结涉及的是词类之间的共现模式,Sinclair (2004: p. 171) [8]认为“类联接是一个语法类或结构型式与其他语法类或结构型式,或其与某词或短语的共现”。从中可以看出,其反映的是词语和语法功能的共选。语义趋向是Sinclair自创的一个概念,其意义为“有时在短语结构中存在一种选择具有特定意义词语的清晰倾向”。其反映的是其搭配词的语义特征,属于语义层面。语义韵则是整个意义单位所传达的态度意义,在整个扩展意义单位中起统领地位,决定了扩展意义单位的边界和目的,属于语用上的功能(Sinclair, 2004: p. 174) [8]。概括来看,扩展意义单位涵盖了词汇层面、语法层面、词义层面和语用层面,卫乃兴(2002)认为,扩展意义单位是典型的形式、意义、功能复合体[9]。
在扩展意义单位的研究中,跨语言间的词项对比一直是重要的一部分。Sardinha (2000)对比分析了西班牙语和英语中常用词汇的语义韵[10];Xiao & McEnery (2006)通过语义韵和语义趋向分析了汉语和英语表达结果的词汇。在国内学界,卫乃兴(2012)的研究总结了基于语料库的对比语言学研究的方法论[11];余渭深、李中正(2017)完整地对汉英高程度副词的扩展意义单位进行了对比研究[12];在日语研究中,也有部分国内学者将汉日中部分词项的搭配、类联结、语义趋向和语义韵进行对比研究,以判断不同语言之间的相应词项在形式、意义、功能和语用上是否具有相似的特征,以此判断二者的对应关系。
2.2. 状态形容词
汉语状态形容词中,“鲜红”、“雪白”等BA式状态形容词的形式与功能较为独特。形式上,蔺璜(2002)认为其应该呈现“前语素凸显后语素程度”的形式,比如“雪白、鲜红、漆黑”等[13];功能上,张国宪(2007)对如何界定汉语状态形容词进行了较为详尽地概述。首先,汉语的状态形容词应该在句法上具备如表1的特征,我们可以概括为如下特征:不可以和程度副词共现、可以作谓语、不能和否定词共现[14];李劲荣(2014)将汉语状态形容词的语法功能概括为描绘性、临时性、量性(包括调量性和足量性) [15]。
Table 1. Syntactic features of state adjectives in Chinese
表1. 汉语状态形容词的句法特征
测试框架 |
句法功能 |
I. 不能进入{最 很 比较 稍} + ______框架 |
剔除性质形容词 |
II. 可以进入NP主 + ______谓框架 |
剔除体词和虚词 |
III. 不能进入{不 没} + ______框架 |
剔除动词 |
而日语中针对状态形容词的研究则没有汉语这么丰富,荒正子(1989)指出日语中存在部分形容词具备「特定の具体的な時間に縛られている」的性质,这和汉语状态形容词的临时性一致[16];樋口文彦(2001)认为其在描述「一時的な現象」的基础上,还有「それ自身の意味を何らかの修正が与えられることになる」的功能,这与汉语状态形容词的形态意义类似[17];八亀裕美(2003, 2024)对既有的日语形容词分类研究做了概括和分析,总结认为日语中存在反映说话人主观性和临时状态的「状態形容詞」,其具有「一時性」和「評価性」的性质,并且指出「真っ赤」为典型的日语状态形容词[18] [19]。白晓光(2002)和周彤(2012)分别依据汉语状态形容词的语用特征对日语形容词进行了进一步分类和讨论。白晓光(2002)指出日语形容词可分为状态形容词和性质形容词,部分日语形容词与汉语双音节形容词类似,如「真っ赤」等是典型状态形容词,为汉日对比提供理论依据[20]。周彤(2012)将既有研究提出的「真っ赤」、「真っ白」等词的性质概括为“固化性程度”[21],这与李劲荣(2014)对汉语状态形容词“调量性”特征的概括相同,二者都有固化程度标记、评价性功能等特征等语法特征,还有不能与程度副词和否定词共现的句法特征。
汉日状态形容词在形式和功能上具有高度的相似性,其均具有描绘性、临时性、量性的语法功能,也具有不能与程度副词和否定词共现的句法功能。但是针对汉日中这一类形容词的先行研究不足,对二者的比较研究也较为缺乏。因此,本研究在调查CCL语料库和BCCWJ语料库之后,选择了在语料库中预料最丰富的“鲜红、雪白”与「真っ赤」和「真っ白」为研究对象,利用扩展意义单位模型,从词汇、语法、语义和语用的角度,进行最大路径的对比研究。
3. 研究对象、方法、目的
3.1. 研究对象
本文选择的研究对象为汉语BA式状态形容词“鲜红”和“雪白”,以及在意义、功能和形式上与其相似的日语形容词「真っ赤」、「真っ白」(周彤2012)。在研究对象选取阶段,在BCCWJ语料库中检索以「真」为接头词的词汇,选取了语料最丰富的「真っ赤」和「真っ白」作为研究对象。此外,根据广辞苑对日语研究对象的解释,确定了「真っ赤」和“鲜红”,「真っ白」和“雪白”的意义基本对应,利用扩展意义单位,对他们在词汇、语法、语义和语用层面的异同做进一步比较分析。
经过CCL和BCCWJ语料库检索,对获得的语料进行进一步筛选,排除掉部分过短无法分析的索引行之后,共获得“鲜红”语料共5754例,“雪白”的5853例;「真っ赤」的语料1178例,「真っ白」的语料1033例,再从中随机抽取500例,进行后续研究。
3.2. 研究方法
本研究按照搭配词、类联结和语义趋向、语义韵的路径对节点词进行分析,参照卫乃兴(2011)提出的对扩展意义单位对应研究的研究方法,通过综合语料库,检查节点词的搭配、类联结、语义趋向和语义韵特征的[22]。首先利用SegmentAnt和AntConc对语料进行分词和提取显著搭配词,这里参照卫乃兴(2002)对显著搭配词的定义,规定频数 ≥ 3且MI ≥ 3的搭配词为显著搭配词,分析二者在词汇方面的关系;然后,将搭配词和节点词的共现情况抽象成为类联结,对二者的语法功能展开对比;之后,按照Stubbs (2001: p. 65)提出的语义归纳法对高频搭配词的语义进行分析,总结出其语义趋向[23];最后采用Stubbs (1996)对语义韵分成积极、中性和消极的三分法,即节点词吸引的搭配词多为积极色彩的搭配词,则归纳为积极语义韵,消极和中性同理[24]。判定标准依据李晓红、卫乃兴(2011)提出的语义韵强度计算方法,选择积极语义韵的索引行与所有的索引行数量作对比,即如下公式进行计算:
本研究拟按照以上方法,对所选节点词的搭配词、类联结、语义趋向和语义韵进行全面的分析和总结,并以此揭示其在形式、语用、意义上的异同。
3.3. 研究目的
本研究的目的主要为通过扩展意义单位模型的分析,揭示汉日研究对象的搭配词、类联结、语义趋向和语义韵的异同之处。并尝试回答以下问题:汉日研究对象在搭配、类联结、语义趋向和语义韵上具体存在哪些差异?同语言间的状态形容词之间的语法和句法功能是否存在差异?
4. 数据统计与讨论
在获得了汉日节点词的索引行之后,我们利用AntConc软件对其显著搭配词进行提取和分析,按照汪蜡萍(2006)的规定,本研究选取左右跨距为4,并且将出现频次和MI值均≥3的搭配词规定为显著搭配词[25],按照此法,得到汉日研究对象的类符形符比和显著搭配的词特征如表2所示。
通过表1可以看出,两个汉语状态形容词的类符形符比分别是雪白(22.5%),鲜红(21.9%),与之对应的日语节点词分别为「真っ白」(16.7%)和「真っ赤」(16.6%)。汉语状态形容词的类符形符比显著更高,说明这两个汉语状态形容词的搭配类型比日语研究对象来说更丰富。而在汉日节点词内部中,其搭配词的丰富程度大体相当,未能体现出显著差异。
Table 2. The significant number of collocations of “鲜红” & 「真っ赤」 and “雪白” & 「真っ白」
表2. “鲜红”&「真っ赤」和“雪白”&「真っ白」的显著搭配词数量
汉语状态形容词 |
日语状态形容词 |
节点词 |
显著搭配词 类符数 |
显著搭配词形符数 |
类符形符比 |
节点词 |
显著搭配词 类符数 |
显著搭配词形符数 |
类符形符比 |
鲜红 |
183 |
814 |
22.5% |
真っ赤 |
54 |
325 |
16.6% |
雪白 |
172 |
786 |
21.9% |
真っ白 |
53 |
317 |
16.7% |
4.1. 搭配及类联结
在提取了节点词的显著搭配词之后,将搭配词的词性进行标注和统计,并对节点词和搭配词构成的类联结型式归纳如图1,发现二者既有共性,也有明显的差异。首先,在共性方面,汉日节点词的显著搭配词中集中在名词和动词,其组成的类联结型式分别为N + Adj、Adj + N和V + Adj;其次,“鲜红”和「真っ赤」以及“雪白”和「真っ白」的N + Adj的比例相同,前者均为8.5%,后者均为13.5%。而二者的差异性则更为明显,首先,根据图1可以看出,在汉语节点词中,类联结Adj + N占绝对优势,而在日语中的分布则偏少;其次,二者在和动词构成的类联结型式的数量差别很大,汉语节点词的V + Adj型式的数量不足5%,而日语节点词构成的类联结中,该型式的数量均超过了30%。
Figure 1. Distribution of colligation of Chinese-Japanese research subjects
图1. 汉日研究对象的类联结分布情况
从数据上来看,“鲜红”的类联结型式主要分布在Adj + N上,占比达到了87%,而其日语对应词「真っ赤」的类联结型式中,占比最多的为V + Adj,占比达到51.5%;“雪白”的Adj + N类联结型式占比为75%,V + Adj占比仅为1.5%,而「真っ白」的V + Adj型式高达31.5%。
总的来说,汉语节点词和日语节点词二者在类联结形式上既存在共性也存在差异性,共性主要体现在汉日节点词构成的类联结型式相同,均为N + Adj、Adj + N和V + Adj;而差异性主要体现在V + Adj的比例上,该类联结型式很少出现在汉语中,但是在日语中占比较高,这体现了汉语状态形容词与动词共现的功能较弱,与名词共现的功能较强,但是日语研究对象不存在这种倾向。
4.2. 语义趋向特征
语义趋向是对共现词语义特征的概括,也是频繁共现的词所共享的意义(Stubbs, 2001)。在本文中,根据每个节点词的搭配词出现频率,统计排前十位的词汇(见表3),对其按照如下方法进行语义归纳,总结其共同的语义特征:首先,提取每个节点词的高频搭配词,这里参照余渭深、李中正(2017)的做法,提取出现频数前十的搭配词;然后,对提取出来的词汇进行聚类分析,归纳出其高频搭配词中共享的意义;最后,根据提取出的意义,将其抽象凝练成语义趋向。按照此步骤,本文将最后得到的结果整理为表3。
Table 3. High-frequency collocations of “鲜红” & 「真っ赤」 and “雪白” & 「真っ白」
表3. “鲜红”&「真っ赤」和“雪白”&「真っ白」的高频搭配词
|
显著搭配词 |
鲜红 |
党旗(207)、血(141)、国旗(132)、旗帜(118)、辣椒(94)、大字(87)、太阳(59)、血液(32)、草莓(23)、皮肤(18) |
雪白 |
墙壁(165)、棉花(139)、牙齿(84)、浪花(70)、沙滩(53)、梨花(42)、头发(28)、肌肤(24)、羽毛(19) |
真っ赤 |
なる(167)、染まる(70)、顔(38)、嘘(32)、チ(20)、燃える(15)、焼け(13)、花(13)、充血(9)、紅葉(9) |
真っ白 |
なる(153)、頭(140)、顔(42)、目(36)、状態(15)、塗る(14)、見える(14)、気持ち(8)、雲(12)、花(10) |
根据该表,我们可以看出汉日节点词在搭配词上的差异性鲜明,汉语节点词排行前十的显著搭配词均为名词,而日语的则呈现动词和名词混杂的状态,而据此归纳出的语义趋向也呈现不同的特征,汉日节点词的语义趋向总结如表4所示。
节点词“鲜红”的显著搭配词与“特征鲜明”这一意义相关,表4中,“鲜红”的十个搭配词可以概括为“凸显、鲜明”的语义趋向。“党旗”、“旗帜”、“国旗”可以体现其“政治符号”的意义,也可以单纯指其作为实际事物颜色鲜艳;“血”、“大字”、“太阳”、“血液”和“皮肤”指的是其本身颜色的鲜明;“辣椒”和“草莓”可以体现其语义中的“鲜”,体现其“鲜明”的特质。由此可见,“鲜红”的搭配词大多体现出了其“凸显、鲜明”的语义特征,其语义趋向可以被概括为“凸显、鲜明”。
节点词“雪白”的本身意义是指“像雪一样洁白”,表现其修饰的事物的洁净,其语义趋向可以概括为“无杂质、纯净”。比如“雪白的牙齿”,体现牙齿的干净和无杂质。表3中,“雪白”的十个搭配词可以被抽象概括为“无杂质、洁净”的语义趋向。比如说,“墙壁”、“牙齿”、“肌肤”等可以被认识为体现搭配词存在干净且未受污染的特征;“羽毛”、“头发”等则可以体现搭配词共享没有杂质的语义。可以看出,“雪白”显著搭配词的语义趋向可以被概括为“无杂质、纯净”。
日语的节点词「真っ赤」的主要意义有两个「非常に赤いさま」、「まるっきり」,其显著搭配词的语义均和“程度高”相关,比如其中第二个义项「「真っ赤嘘」,意义是彻头彻尾的谎言;同时,「真っ赤な紅葉」、「真っ赤に燃える」均体现树叶十分红和燃烧程度的彻底。因此,可以将「真っ赤」显著搭配词的语义趋向概括为“纯粹,程度高”。
而「真っ白」的高频搭配词均和变化以及状态有关,「なる」本身就表示变化,「真っ白に塗られた」反映的是经过涂抹粉刷之后变成白色的变化结果;名词搭配中,「真っ白な髪の毛」、「真っ白な気持ち」表示生理或者心理的某种状态。因此,「真っ白」显著搭配词的语义趋向可以被概括为“状态与变化”。
Table 4. Semantic preference of “鲜红” & 「真っ赤」 and “雪白” & 「真っ白」
表4. “鲜红”&「真っ赤」和“雪白”&「真っ白」的语义趋向
汉语节点词 |
日语节点词 |
节点词 |
语义趋向 |
节点词 |
语义趋向 |
鲜红 |
凸显、鲜明 |
真っ赤 |
纯粹、程度高 |
雪白 |
无杂质、纯净 |
真っ白 |
状态与变化 |
4.3. 语义韵特征
语义韵是对搭配词语义色彩的描述(余渭深、李中正2017)。李晶洁、胡奕阳、陶然(2022)对利用情感分析方法计算语义韵的可行性做出了论证[26]。本研究继承该方法的逻辑,选择百度的API大模型进行情感分析进行判断,该方法的流程大致如下:首先,调用百度API的情感分析功能;然后,利用Python和API提供的代码分析节点词的500行索引;之后,提取这些索引行的节点词的搭配词,将分析出积极语义韵的索引行中,节点词的搭配词归纳成具有积极色彩,最后,利用李晓红、卫乃兴(2011)提出的语义韵强度计算方法,选择积极语义韵的搭配词数量与所有搭配词数量做比,即如下公式进行计算,归纳节点词的语义韵极性分布。本研究沿用卫乃兴(2008)对语义韵极性分类的方法,若搭配词中呈现积极语义韵的占大多数,则该节点词具有积极语义韵,而当不存在较为明显的主导倾向时,则判定其为错综语义韵[27]:
由于研究者非日语母语者,难以准确地判断日语文本的语义韵,该研究首先邀请了学校的两位日本留学生进行初步判断,再邀请两位日语外教来对初步判断结果进行检验,再以计算汉语研究语义韵极性分布相同的研究方法,归纳出“鲜红”和「真っ赤」、“雪白”和「真っ白」的语义韵极性分布如下图2、图3。
如图2所示,在节点词“鲜红”的搭配词中,占比最大的是具有积极语义韵色彩的搭配词,占比为62.66%,如:党旗、徽章、锦旗等;其次是占有中性语义韵的搭配词,占比为19.33%,如:血液、地毯等;最后是呈现消极语义韵的搭配词,占比仅18%,比如:血印、伤口等。总体来看,“鲜红”一词积极语义韵占比较高,整体呈现典型的积极语义韵。
Figure 2. Semantic prosody between “鲜红” & 「真っ赤」
图2. “鲜红”和「真っ赤」的语义韵极性对比
Figure 3. Semantic prosody between “雪白” & 「真っ白」
图3. “雪白”和「真っ白」的语义韵极性对比
在节点词“雪白”的搭配词中,占比最大的是具有积极语义韵色彩的搭配词,占比为58.67%,如:梨花、肌肤等;其次是占有中性语义韵的搭配词,占比为35.33%,如:浪花、墙壁等;最后是呈现消极语义韵的搭配词,占比仅6%,比如:脂肪、墓碑等。因此,“雪白”整体呈现的语义韵是积极的。
日语节点词「真っ赤」,在语义韵极性分布上与其相差较大,其中占比最大的为消极语义韵的搭配词,占比39.33%,如:嘘、チ、腫らす等,其次为积极语义韵的搭配词,占比34%,如:紅葉、夕焼け等,呈中性语义韵的搭配词占比最低,占比26.67%,比如:染まる、顔等。整体没有占哪一项语义韵占主导倾向,因此,「真っ赤」呈现典型的错综语义韵。
与之意义较为相近的「真っ白」,在语义韵极性分布上与存在较大区别,日语节点词中,占比最大的为中性语义韵的搭配词,占比47.33%,如:塗る、壁等,其次为积极语义韵的搭配词,占比32.67%,如:気持ち、曇等,占比最低的是消极语义韵的搭配词,占比20%,比如:状態、髭等。可以看出,没有呈主导倾向的语义韵极性,因此,「真っ白」也呈现典型的错综语义韵。
5. 讨论
本研究选择的研究对象属于状态形容词,经过先行研究验证,其功能本身存在一定的相似之处,意义也存在一定的对应关系。然而经过利用扩展意义单位对其进行全面的分析之后,二者除了一定的相似之处,依然在搭配词、类联结、语义趋向和语义韵上存在大量的差异。
在搭配词方面,汉语节点词和日语节点词的搭配词在数量上存在一定差异,汉语搭配词的数量显著多余日语节点词,并且在类符形符比上二者也有较大的差距,汉语的类符形符比明显更高,说明其搭配词丰富度要更高。类联结方面,二者既有相似之处也有不同之处,二者相似在于其均能构成N + Adj、Adj + N两类较为典型的类联结型式,并且和均能基于各自语言的特点和语法功能构成对应的类联结型式,汉语的呈现为V得Adj,日语的呈现为Adj + に + V。而差异性也主要体现在其与动词构成的类联结型式的比例和功能,汉语节点词与动词构成的V得Adj类联结占比为4.6%,而日语节点词与动词构成的Adj + に + V类联结占比达到了51.4%。
语义趋向方面,汉语两个节点词和日语两个节点词的高频搭配词均呈现不同的语义趋向,“鲜红”的显著搭配词呈现“凸显、鲜明”的语义趋向,“雪白”的则呈现“无杂质、洁净”的语义趋向;「真っ赤」的显著搭配词呈现“纯粹、程度高”的语义趋向,而「真っ白」的则呈现“状态变化、变化结果”。可以看出,不管是相同语言还是跨语言,尽管状态形容词的语法功能和句法功能均有相似之处,但是其语义趋向依然存在较大的差异。
最后是语义韵层面的差异,汉日研究对象均能分布在积极、中性和消极三个极性之中,没有出现十分极端的极性分布情况。而在相似性之外,差异性则更为明显。“鲜红”体现出显著的积极语义韵主导特征,其积极语义韵占比高达62.66%,“雪白”的中性语义韵则占比最高,达到了55.33%,整体呈现中性语义韵。而二者的消极语义韵占比均很低,总体来说,汉语研究对象的语义韵呈现“积极–中性”主导的倾向。与此相对,日语研究对象的分布则较为平均,「真っ赤」的分布极为平均,积极、中性、消极分别占比34%、26.67%和39.33%,呈现错综语义韵,同时,「真っ白」的分布也趋于平均,仅有消极语义韵占比较低,为20%,积极和中性分别占比32.67%和47.33%,也呈现错综语义韵的分布情况。总的来说,日语研究对象的语义韵整体呈现三种极性较为平均的“积极–中性–消极”的错综语义韵。
6. 结语
本文选择在意义、形式和语用功能上存在相似和可比之处的汉日状态形容词作为研究对象,基于Sinclair提出的扩展意义单位模型,进行了基于数据驱动的全面研究。结果表明,虽然汉日研究对象在意义和功能上有高度对应的地方,并且二者在搭配词、类联结、语义趋向和语义韵的分布在整体上有相似的趋向出现,但是依然存在较大的差异性。同时,同语言下的状态形容词在词汇、语法功能、语义和态度意义上也存在一定的区别。本研究不仅从较为新颖的角度,厘清了汉日状态形容词在功能和语用上的异同之处,还进一步体现了扩展意义单位能从形式、意义、功能上对跨语言单位进行对比分析的能力,在对比语言学的研究中占据重要地位。同时,囿于篇幅,本研究亦存在一些不足之处,比如未能将更多典型的汉日状态形容词囊括进来,仅仅基于语料数量选择了语料丰富的两例词进行对比,因此,对于其他汉日状态形容词的异同之处仍有待挖掘。