1. 引言
零形回指作为汉语语篇连贯的最常见手段已经得到公认。由于有关现象的复杂性、在语言学理论研究以及近些年在计算机语言应用研究中的重要性,零形回指一直受到学者们的研究和关注[1] -[7] ,近年来还有不少针对零形回指的计算机处理进行的研究[8] -[13] 。零形回指的研究目的包括零形回指的生成机制和零形回指先行语的确认和计算机解析,两方面的研究都具有重要的现实意义。然而,有关研究在语料的数量和范围方面,除了少数针对口语中的零形回指和少数针对公文和新闻语篇进行的研究之外,大多数以叙事体裁的语篇为语料,较少涉及其他体裁。对于不同体裁的语篇中零形回指的使用频率和分布状态均缺乏比较和认识,不利于对汉语零形回指规则的发现和充分描写,因而也不利于进行计算机解析与实验。本研究选取了三种汉语常用体裁的语篇,根据Ariel [14] [15] 等认知功能语言学研究者的做法,对这些语篇中零形回指的数量与分布情况进行分析、研究和比较。
2. 研究准备
本研究选取汉语的学术语篇、新闻语篇、叙事语篇若干,各约6万汉字,共18万字。语篇的年代主要从上个世纪的30年代(新闻与学术语篇从50年代开始)到本世纪初,按照改革开放前的语篇和改革开放后的语篇分为早期和近期两个时段。通过观察语料及结合认知功能语言学已有的分析模式,本研究对三种体裁中的零形回指位置规律进行分析和研究。位置指的是句法位置,包括零形回指的先行语的位置、零代词本身的位置、零形回指环境中其他成分的位置。位置的类型分为7种,根据句法功能而定,包括:1) 主题:用T表示;2) 主语属格语:用SM表示;3) 主语:S表示;4) 同位语:AP表示;5) 宾语的属格语:用OM表示;6) 宾语:用O表示;7) 旁语:用OBL表示。语料中出现零形回指的地方,即,零代词所出现的位置,均采用(*)表示。对于语料中所有的名词性成分(包括零代词在内),本研究采用括弧标注并在其前采用符号标注其句法位置。示例如下:
(1) T(它)S(眼睛里)只有O(光),AP(一种很柔和很绵软的带着茸毛的亮光),S(*)朝OBL(屠夫)忽闪几下,S(*)转身走开。
(2) SM(边防部队)的S(医生和卫生员)还背着O(药包)S(*)在OBL(村庄里)为OBL(居民)进行O(最后一次治疗)。
(3) 那时S(上学)对OBL(这些穷孩子)来说只不过是O(梦想),S(*)即使勉强能上学,S(*)又会遭到OM(反动政权和头人)的O(迫害)。
在以上第一例中,“它”是主题,在其前用T标注,“眼睛里”是主语,用S标注,“光”是宾语,用O标注,此外还有一个同位语,用AP标注,一个旁语,用OBL标注,该语句中有两处用了零形回指(*),均出现在主语位置,用S标注。在第二例中,“边防部队”是主语的属格语,用SM标注,零代词只有一个,是第二个小句的动词的主语。在第三例中,有两个零代词,都出现在主语位置,而它们所指代的先行语却是前面旁语位置上的“这些穷孩子”用OBL标注,该例中有一个宾语的属格语“反动政权和头人”,用OM标注。
通过对语料进行分析,我们不仅发现了三种体裁的汉语语篇在零形回指数量上的差别,在位置上所呈现的异同,也发现了先行语和零形回指之间位置关系的共同规律。
3. 数据的提取与分析
从三种体裁的数据来看,零形回指的使用数量存在重要的差别,零形回指的位置则有共同规律,也有一定的差异。零形回指与先行语之间的位置关系有简单的,也有繁杂的,存在共性和个性。首先看零形回指在不同体裁中的数量。
3.1. 零形回指使用数量的分体裁考察
从三种体裁各6万字的语料中,本研究共获得了6401条零回指的使用情况,各类语篇的零回指使用数量如表1。
表1显示,在总共6401例零形回指中,学术语篇中的零形回指最少,只有1398例,其次是新闻语篇,共出现1986例。叙事语篇中的零形回指最多,共有3017例。因此,从总体数量来看,新闻语篇和学术语篇中的零形回指数量偏少,叙事语篇偏多,叙事语篇中的零形回指接近前两种体裁零形回指数量之和。本研究还对各体裁的零形回指数量进行了分时段统计,结果发现,无论是早期文本,还是近期文本,零回指在学术语篇中的使用数量均为最少,新闻语篇次之,在叙事语篇中的使用数量均为最多。这说明,无论是改革开放前的语篇还是改革开放后的语篇,三种体裁在零形回指的使用数量上没有显著变化,也就说明,零代词的使用数量差异主要与语篇的体裁有关,没有时段上的差异。
3.2. 零形回指位置与位置关系的分体裁考察
零形回指的位置关系是指它与它的先行语之间的位置关系和分布规律。以往研究对于叙事语篇中的零形回指的分布有过一些分析[1] [9] 但对于其他语篇缺乏分析和比较。本研究首先对新闻语篇中的零形回指的位置及位置关系进行了统计和分析。
表2显示,在新闻语篇中,零形回指出现在三种位置,而且主要集中在主语位置,共有1870例,其次是宾语位置(65例)和主题位置(51例)。在位置关系上,又以先行语和零代词都出现在主语位置(即:主语–主语)为最多(1345例),其次是主题–主语(285例)、宾语–主语(224例)、宾语–宾语(49例)位置关系,其他位置的零形回指很少。新闻语篇中没有主题–旁语、主语的属格语–主语的属格语、主语–旁语、宾语–旁语等位置的零形回指。
学术语篇中的零形回指,上文已经提到,其使用数量在三种体裁中最少。从位置上看(表3),其零形回指更为典型地集中在主语位置,共有1332例,其次是宾语位置(41例)和主题位置(23例),还有2例主语的属格语位置上的零形回指。从先行语与零代词的位置关系看,主要集中在主语–主语(共1003例)、主题–主语(186例)、宾语–主语(122例)位置关系,其他位置关系的零形回指数量很少。没有主题–旁语、主语的属格语–主题、主语–旁语、宾语–旁语、宾语的属格语–宾语、旁语–主题、旁语–宾语等位置关系的零形回指。
叙事语篇的零形回指,前文已经提到,其使用数量在三种体裁中最多,占了本次统计近一半的数量。本研究的统计与分析发现,与前两种体裁相比,叙事语篇的零形回指关系更为复杂多样,且具有语篇作者个性差异。有几位小说家的零回指使用方式特别丰富而出格。从位置的总体情况看,叙事语篇的零形回指位置更为丰富,虽然主要数量也多集中在主语–主语、主题–主语和宾语–主语位置关系。
Table 1. Zero anaphors in texts of different genres
表1. 零形回指在不同体裁中的使用数量
Table 2. Positional distribution of zero anaphora in news reports
表2. 新闻语篇的零形回指位置关系分布
表4显示,在叙事语篇中,零形回指出现在主语、主题、主语的属格语、宾语、旁语五种位置。出现在主语位置最多,共有2714例,其次是宾语位置(168例)、主题位置(124例)、主语的属格语位置(8例)和旁语位置(3例)。在位置关系上,也是先行语出现在主语,零形回指出现在主语的位置关系数量最多(2128例),其次是宾语–主语(299例)、主题–主语(251例)、宾语–宾语(107例)、主语–主题(86例)、主题–宾语(34例)、主题–主题(32例)、主语的属格语–主语(30例)位置关系,其他位置关系的零形回指很少。叙事语篇的零形回指位置关系已明显较前两类语篇的零形回指更为复杂。
4. 讨论
根据以上数据,从三种体裁中的零形回指数量看,叙事语篇的零形回指最多,学术语篇的零形回指最少。从零形回指的位置看,新闻语篇最简单,只有三种位置,其次是学术语篇,有四种位置,叙事语篇的零形回指最复杂,有五种位置。从位置关系上看也是如此。
Table 3. Positional distribution of zero anaphora in academic texts
表3. 学术语篇的零形回指位置关系分布
在个性特征方面,新闻语篇以T-S和O-S位置关系的零形回指为其特色,因为,与回指总数高出很多的叙事语篇相比,新闻语篇T-S位置关系的零形回指数量(285例)甚至高出了叙事语篇(251例),其O-S位置关系的零形回指数量(224例)也较为接近叙事语篇(299例),而与回指总数差不多的学术语篇相比,其O-S位置关系的零形回指又比学术语篇的(122例)高出很多。另外,虽然S-S位置关系的零形回指是三种语篇的共性,但内部也有一些区别。在新闻和学术语篇中,带中间干扰成分的S-S位置关系的零形回指数量(分别为1064和854例)远远高于不带中间干扰成分的S-S回指数量(分别为281和149例)。而在叙事语篇中,则没有那么大的差距,不带中间干扰成分的S-S位置关系的零形回指(718例)超过了带干扰成分的S-S回指数量(1410例)的二分之一,虽然总数仍然是后者更多。
还有一些特殊情况,在新闻语篇中,动名词短语做先行语的情况较多见,如:“中西部快速增长”。另外,新闻语篇中的无指和泛指较多。领导指示、规章、政策、昭告等报道中多出现无指或泛指。还有一个特点是,与其余两种体裁相比,新闻语篇中的零回指句子结构最简单。其中略有时段上的区别。在时段上,改革开放前的新闻语篇中的零回指表达极为规整,改革开放后的零形回指在结构及位置关系上更为丰富,显示零回指的活跃性与思想开放有一定的关系,可以作为一个重要的观察点考察新闻语篇乃至其他语篇中的零形回指,虽然零形回指的使用数量在时段上并没有产生变化。
学术语篇的一个特点是,在空洞的探讨中多出现无指。另外,小句或者从句作为先行语的回指较多,“使动”结构关系的零形回指多,抽象回指多,排比式的零形回指多,介词短语和动词短语做先行语的也多。另外,语料分析还发现,在50年代的学术语篇中,有类似于教师札记类的文章刊登在杂志上,其中尽是零代词的无指用法,多出现在主语位置。学术语篇的语料分析还发现,回指使用的方式与个人的思维方式与思想复杂度有关。个别学者的学术语篇中出现数例极为特殊的零回指用法,含动词短语做先行语、“把 + NP”做先行语等,以及常常将VP转类为NP并使用零形回指。再次显示,零回指使用的
Table 4. Positional distribution of zero anaphora in narratives
表4. 叙事语篇的零形回指位置关系分布
复杂度似与思想活跃、思维的严谨性和开放度有关。例如,季羡林的零回指使用极少。
叙事语篇中,主语属格语位置上的先行语大于前两类语篇主语属格语之和。与体裁风格有关系,因为叙事语篇总以人物的思想活动与行动为主述对象,人物除了在主语位置之外,也常常在主语的属格语位置出现,因而获得更多的零形回指。分析还发现,语言使用灵活性大和表达的随意性强的叙事作品中多出现特殊回指,且与作者的文化高低及个人风格有关。
在先行语的位置方面,主题位置的先行语在学术语篇中最少,新闻语篇的主题位置先行语与叙事语篇的很接近,虽然新闻语篇零形回指总数比叙事语篇的少很多。这可能与新闻语篇表达要求突出主题性这一特点有关。学术语篇中主题位置的先行语较少,也应与学术语篇强调客观性有一定的关系。
在共性方面,三种体裁的零形回指位置都以主语为主。新闻语篇的零形回指总数为1986例,主语位置的零形回指占了94.2%。学术语篇中主语位置的零代词比例更高,达到95%以上。叙事语篇虽然在主题位置和宾语位置上还有一定数量的零形回指,但是,主语位置的零形回指仍然遥遥领先,在总数3017例中,约占90%。其他位置上的零形回指在三种体裁中,总数不超过500例。其中,主题位置上共有198例。宾语位置上略多一些,共有274例。主语的属格语位置上很少,只有10例,多出现在叙事语篇。宾语的属格语位置上没有零形回指。旁语位置上有3例零形回指用法,都出现在叙事语篇。
在先行语的位置方面,三种体裁也都是主语占据绝对数量,共有4643例。其次是宾语位置的先行语,共有837例,其次是主题位置,共828例。其他三个位置上的先行语都不多,主语属格语位置上的先行语共有64例,旁语23例,多出现在新闻语篇,宾语属格语位置上的先行语最少,只有6例。
如果说零形回指的先行语除了最主要的主语位置之外,还有一定数量的主题、主语属格语和宾语,约占总数的28%,那么,零代词的位置则更为单一地集中在主语,其余位置所占的比例总共不到8%。这是一个很重要的现象。
最后,在回指的位置关系上,三种体裁都以S-S位置关系的零形回指最多,而且,排在前三位的都是S-S,T-S,O-S,排在第四位的都是O-O位置关系的零形回指。其他三个位置关系的零形回指很少,总共378例,约为6%。
5. 小结
以上研究不仅挖掘出汉语零形回指在三种不同体裁的语篇中的个性,以引起学界的关注,更重要的是总结出了其中的共性。这些共性对于全面了解汉语语篇中零形回指的分布以及进行规则描写和计算机应用研究具有一定的指导意义。
基金项目
全国社会科学基金项目:基于数据库的零形回指解析方式实证研究,09BYY001。