1. 引言
国内外学术界关于韵律与节奏的类型学研究颇为丰富,从二十世纪初开始,相关研究先后经历了从定性到定量、从韵律与节奏分离到韵律节奏相结合的转变 [1]。由于话语韵律节奏牵涉层级多、范围广,容易受到各种错综复杂的语言或非语言因素影响,因而研究起来颇具挑战性 [2]。
韵律与节奏研究都涉及到韵律层级的概念。韵律层级自下而上依次分为音节层、音步层、韵律词层、音系短语层、语调短语层以及话语层 [3]。其中话语层面的韵律与节奏又称作言语韵律与节奏,是语言结构信息在语音上的总体表现。在声学上,言语韵律与节奏主要是通过调律(melody)和计时(timing)来表现的。调律是音高在话语层面的总体表现,具体指话语中音高起伏的规律,即声调、重音、句调等引起的音高总体变化规律;而计时是时长在话语层面的总体表现,具体指话语中韵律单元如音节、重读音节、载调单元等的时长变化规律,音节类型、声调、重音、停顿、语速等均会引起韵律单元的时长间隔变化 [4] [5]。对于汉语来说,韵律与节奏就是抑扬顿挫和轻重缓急的腔调 [6]。
由于汉语是声调语言,因此汉语韵律研究向来注重声调与语调之间的关系 [7]。如赵元任先生最早提出汉语语调是合成语调,即字调和语调(均表现为音高变化)的代数和 [6]。后来发现汉语语调不是简单的音高叠加代数和,而是音阶叠加代数和 [4]。在近年来的韵律与节奏研究中, [8] 发现不同方言的调律与计时模式大相径庭,同一方言内部也不尽相同,反映出较大的内部差异。因此本文试图以普通话和三种吴方言为例、将它们的声调连读变调特点与言语韵律与节奏模式进行关联分析,并用包含两级核心层的简化韵律结构对它们进行分类。
2. 相关研究综述
2.1. 研究背景
最早从二十世纪初开始,学者们就开始将节奏类型划分为三大类 [9]:以英语为代表的重音计时,以西班牙语为代表的音节计时,以日语为代表的莫拉计时。三种计时类型理论上分别表示每个包含重音的音步、音节、莫拉在时长上趋同。自二十世纪后期开始,随着电脑技术的发展,定量研究逐渐成为韵律与节奏研究的主要手段。如 [10] [11] [12] 等学者开发了一些声学参数来量化节奏与调律类型,其中经常使用到的有PE/PS (音高跨度/斜度)、ΔPE/ΔPS (PE/PS的标准差),%V (元音音段时长在整句时长中的占比)、nPVI_V/rPVI_C (语句中相邻元音音段时长配对变化规范化指数/相邻辅音音段时长配对变化原始指数)等。结果发现有些语言的调律和计时模式确实明显不同,如法语比英语的调律表现更强,即音高起伏大、变化快;且英语陈述句具有总体下降调律而法语具有总体上升调律。同时法语表现出元音占比较大、音段时长变化较小的特点,即比英语更倾向于音节计时型。
基于以上结果, [5] 还提到了用一种简化的四级结构来描述语言的韵律与节奏模式。以英语为例,从音节开始往上依次有节奏单元(RU)、音调单元(TU)和语调单元(IU)。其中节奏单元涵盖传统的音步及韵律词,音调单元一般与节奏单元重合,有时涵盖多个节奏单元及音系短语,语调单元涵盖语调短语以及话语。法语的韵律层级设置与英语不同:由于法语既没有音节重音,又没有语调重音或调核,因此其音调单元可以设置在节奏单元之下。按照这种简化的韵律层级,英语和法语的韵律特点可以简单明了地区分开来:英语音调单元的模式是[H L] (左重),法语的是[L H] (右重),分别代表下降和上升的调律趋势。这样分级的好处是可以将具有语言普遍性的韵律功能整合进入层级,不必考虑难以统一的因语言而异的韵律形式。但是这种简单的分类法是否适用于汉语,还需要进一步探讨。
2.2. 汉语相关研究
在汉语相关定量研究领域,有两类研究与本文密切相关:第一类就是利用调律与节奏参数专门针对汉语进行的调律与节奏类型学定量研究 [8] [13] [14] [15]。这些研究涉及了普通话、粤语、吴语、闽语。研究表明汉语方言话语节奏均倾向于音节计时类型,但程度不一:前两种方言比后两种调律更强、更趋向于音节计时。以上结果可以说与方言的声调连读特点有关。如多数吴方言的声调具有特殊变调现象,即连读时前字调延展至后字 [16]。这相当于减少了语流中音高的变化频次,从而造成调律起伏变化较小。另一类虽然没有直接考察节奏类型,但考察了与节奏相关的音节和音段的时长关系以及音节与音高(声调的关系)的时长关系。如 [17] [18] [19] 发现普通话倾向于音节或韵律单元/组块计时,并且音高变化幅度是随着时长改变的:位于韵律单元中间的音高成分往往由于时长不够而达不到既定目标,致使音高整体起伏相对平缓;位于语句和调群边界的音高成分则有下倾现象。
在汉语相关定性研究领域,其中一种较有影响力的观点认为汉语节奏主要体现不是在轻重交替,而是长短交替上,即相邻单音节(即字与字)之间结合的松紧程度不一,因此将汉语节奏归结为松紧型 [20]。但 [21] 认为松紧现象也出现在英语单词中,不能作为汉语特有的节奏类型,他主张应该抓住汉语有别于英语的重要特征即声调来探讨汉语节奏,即汉语的节奏类型应该从以声调为支点,以字为声调的承载单元这个角度来建立。其具体从五个方面进行了阐述 [21]:1) 声调的特征属性,即声调体现了与载调单位的聚合关系;2) 汉语的重读概念,即汉语词层/短语/语用凸显不是靠重音而是靠重读实现的,而重读是不可预测的;3) 声调重读属性,即声调通过变调规则和制约来实现凸显;4) 汉语声调是以单音节为支点构成基本的节奏单位;5) 声调调值与调类的变化通过动态平衡体现各自的节奏属性。这些观点既考虑了声调与韵律模式之间的直接联系(声调与话语韵律均以音高变化为主要声学表现),又强调了声调与节奏模式的间接联系,即时长会随着音高的变化而变化。因此本文十分认同声调支点观,并以之为基础进一步用动态声调,即语流中的声调表现,作为切入点来构建汉语方言韵律节奏类型体系。
3. 基于动态声调构建汉语言语韵律与节奏类型学的设想
3.1. 声调韵律单元的设置:以普通话为例
既然汉语声调的存在对其整体的韵律与节奏类型产生了影响,那么就可以根据汉语各地方言对于声调的使用模式对汉语韵律与节奏类型进行界定。由于汉语具有组块等长的趋势 [17] [18],而声调与音节在时长上是对应的,可以说汉语方言运用声调的方式既决定其话语的调律模式又决定其计时模式。因此,本文将汉语的韵律与节奏类型统一定性为声调节奏(Tone Rhythm)。注意 [22] 曾提出过音调节奏(Tonal Rhythm)的说法,指韵律单元在音高维度上出现的规律性,不可与此处的声调节奏混淆。如果将汉语韵律与节奏统称为声调节奏,那么语流中声调的变化就同时反映了声调本身叠加语调相关的音高变化以及声调本身叠加节奏相关的时长变化。
为了描述这些变化,有必要设置基本的调律节奏单元。但由于汉语的调律和节奏可以认为是由声调集中体现的,因此可以将 [5] 提到的节奏单元和音调单元整合成一个单元,将调律节奏一体化,命名为“声调韵律单元”(Tone Prosody Unit)。相应地,汉语韵律层级可以简化为三层:声调、声调韵律单元、语调单元,大致相当于传统的音节层、韵律词/音系短语层、语调短语/话语层。由于最小的声调连读变调域是两个字调,因此可以将中间的声调韵律单元层进一步划分为两个核心层级:基本声调韵律单元层(BTPU)与衍生韵律单元层(DTPU)1。前者一般包含两个字调,后者可以包含多个BTPU,如例1所示(以普通话语句为例):
1) 简化后的汉语普通话韵律层级示意图

例1中声调底层就是字调。最上层是语调单元。中间两级核心层B/DTPU是汉语方言韵律节奏类型划分的主要依据。其中BTPU一般围绕两个字调构建,以反映最小的连读变调域。不过根据话语的结构,一个字调或者两个以上字调也可以构成一个BTPU2。例如位于句首的三字调“有一回”作为叙事时常用的短语,可以自成一个BTPU。位于句尾的“大”,由于边界效应可以单独构成一个BTPU。双字调词/短语自成一个BTPU,如“北风”、“太阳”、“争论”、“谁的”、“本领”都各自属于一个BTPU。剩下的单字调功能词一般情况下并入前面的BTPU。如“跟”并入“北风”所属的BTPU;“在”并入“太阳”所属的BTPU3。
然后DTPU在BTPU的基础上通常按照语法或语义结构两两构建,以反映语流组块化的趋势。例句中“有一回”所属的单个BTPU由于后面有逗号,可以单独构成一个DTPU/IU;然后“北风跟”与“太阳在”所属的两个BTPU构成一个DTPU;“谁的”与“本领”所属的两个BTPU构成一个DTPU;剩下“争论”所属的单个BTPU作为谓语动词可以单独构成一个DTPU4。最后“大”所属的单个BTPU作为句尾也可以单独构成一个DTPU。然后逗号后面的四个DTPU构成另一个IU5。
最后,例1中每个声调与所在声调单元的连线中,只有1条被设为垂直连线,意味着对应的声调为支点调,BTPU必须围绕这个支点调来构建。类似地,DTPU与BTPU之间的垂直连线表示DTPU必须以对应的BTPU为支点来构建;IU与DTPU之间的垂直连线表示IU必须以对应的DTPU为支点来构建。
对于普通话来说,支点调显然不能是轻声,非轻声单音节功能词所承载的声调一般也不做支点调,如“在争论”中的“在”一般不做支点调。尽管“在”字在语法功能上隶属于短语“在争论”,但在正常语流的韵律结构中属于前面的主语“太阳”。这样支点调就会落在双字调词/短语的第一个字,因此支点调与BTPU的连接线会向右分支,即普通话的轻声连调模式决定了其有左支点调。而DTPU与BPTU的连接线相反,会向左分支,也就是说DTPU是以最后一个BPTU作为支点,相当于右支点。由于普通话非轻声连读变调前变后不变的现象如“本领”中“本”字由原调T3变为T2常被认为是后重的体现 [23],因此右支点DTPU可以看作是对这一现象的进一步体现。最后IU以最左边的DTPU为支点,以反映普通话陈述句尾部音阶整体下降的趋势 [19]。以上所述可用下图1来说明,它是与例1对应的一位普通话发音人产出的音高曲线(此图及以下几图均来自语音处理软件Praat里的语谱图):

Figure 1. Pitch contour of the illustration sentence in Mandarin
图1. 普通话例句的音高曲线
图1说明显示BTPU对应的音高曲线在前半段凸显,说明向右分支,而与DTPU所包含的第二个BTPU,即“太阳在”、“本领”对应的音高曲线则比前面一个BTPU凸显,说明DTPU向左分支。另外,整体音阶到了最后大幅下降,说明IU向右分支。从时长来看,其BTPU长短不一,但包含同样数目字调的单元时长差不多,因此可以说普通话例句具有强调律及音节计时表现。
通过以上关于简化后的两级核心韵律结构的描述,我们可以看出从声调连读模式入手对汉语方言调律节奏类型进行划分,既不用专门考虑音节之间的轻重关系,也不用专门考虑声调与语调之间的相互作用。两者均可以从对TPU的划分中反映出来。音节轻重关系一般可以由其所承载的声调时长变化情况即知。如普通话轻声和轻读的调一般在右侧,并且时长会显著缩短,体现“轻”得一带而过的特点。因此左支点调的设立就可以反映普通话音节之间的重轻关系6。
以上以普通话为例说明了简化后的汉语韵律节奏层级结构。各地方言均可以采用同样的结构。方言之间的不同则由B/DTPU的大小和分支方向而定。下一节以三种吴方言为例进一步说明。
3.3. 以声调韵律单元为基础划分韵律类型:以吴方言为例
吴语各地方言内部差异非常大。以连读变调为例,像上海话、苏州话、嘉兴话等在语流中均有后字调脱落前字调向后延展变调的特点,而绍兴话、温州话等在连读变调后则有左低右高的倾向,表现出右重的韵律结构 [24]。下面分别以来自浙北舟山定海地区、绍兴上虞地区和杭州萧山地区的吴语发音人产出例1中的句子为例7、用基于B/DTPU的核心韵律层级来表现吴语内部不同方言的不同韵律结构。首先以定海话为例。定海话属于吴语太湖片涌江小片,有7个调,T1-T7分别为阴平(52)、阳平(23)、上声(45)、阴去(44)、阳去(13)、阴入(5)、阳入(2) [25]。下例2显示了定海话例句的韵律层级:
2) 吴语舟山定海话韵律层级

例2显示定海话的B/DTPU均向右分支,这与定海话连读变调模式有关。定海方言有不少轻音变调现象,例2中T0表示轻音,是连读后的调型,一般表现为前调后部往低值延伸 [25]。这从下图2中与例2相对应的音高曲线可以看出来:

Figure 2. Pitch contour of the illustration sentence in the Dinghai dialect
图2. 定海话例句的音高曲线
图2显示例句中B/DTPU对应的音高曲线都在前半段凸显8,说明向左分支。并且音高起伏变化与BTPU的时长变化较大。说明其调律表现较强,音节计时表现弱。由于比较大的停顿出现在“争”字后,这里将最上层的IU进一步划分成三个。整体音阶又有下降趋势,因此IU设为向右分支。
与定海话不同,上虞话属于太湖片临绍小片,只有6个调,T1-T6分别为阴平(35)、阳平(13)、阴去(55)、阳去(33)、阴入(5)、阳入(2) [26]。上声根据声母清浊并入阴平或阳平。下例3显示了上虞话例句韵律层级结构:
3) 吴语绍兴上虞话韵律层级

例3显示上虞话的BTPU/DTPU/IU全部向左分支9,这与绍兴话连读变调模式有关。据 [24] 介绍,绍兴话(包括城区、东郊以及上虞)的多音词、词组、动宾结构、主谓结构中的重音都落在末音节上。 [27] 更是从连读变调与韵律、句法之间的相互关系论证了绍兴方言的右重韵律结构。这从下图3中与例3相对应的音高曲线可以看出来:

Figure 3. Pitch contour of the illustration sentence in the Shangyu dialect
图3. 上虞话例句的音高曲线
图3显示大多数B/DTPU对应的音高曲线都在后半段凸显,说明向左分支10。并且音高起伏变化较小,即使到了最后,整体音阶并没有下降,说明IU向左分支。其音高起伏与图2所示定海话例句的音高起伏相比要平缓。从时长来看,BTPU长短不一,但变化比定海话例句小,因此上虞话例句的调律表现较弱、音节计时表现较强。
和上虞话类似,萧山话也属于太湖片临绍小片,也只有6个调。但是两者在韵律表现上差别明显。萧山话的6个调T1-T6分别为阴平(44)、阳平(22)、阴去(53)、阳去(31)、阴入(5)、阳入(2) [26]。下例4显示了萧山话例句的韵律层级结构:
4) 吴语萧山话韵律层级

例4显示萧山话的BTPU向右分支,DTPU/IU向左分支。萧山话像大多数吴语一样依据语法结构的紧密性分为两种连调模式:紧密式和松散式。紧密式前调决定调式,松散型则是前字一律平调,后字调不变,有前轻后重的特点 [28]。这里将两种模式分别与B/DTPU对应,就能形成两者分支方向的不同。这从与例4相对应的音高曲线可以看出来,如图4所示:

Figure 4. Pitch contour of the illustration sentence in the Xiaoshan dialect
图4. 萧山话例句的音高曲线
图4显示BTPU对应的音高曲线分别在前半段凸显,说明其向右分支,而与DTPU所包含的第二个BTPU,即“太阳来亨”、“啥家个”、“大”对应的音高曲线则比前面一个BTPU凸显,说明DTPU向右分支。另外,整体音高起伏变化非常平缓,即使到了最后,整体音阶几乎没有下降,说明IU向左分支。从时长来看,萧山话例句的BTPU长短不一,但变化比定海话例句小,调律表现最弱,音节计时程度则较弱。
以上以普通话和三种吴方言为例说明了汉语方言与其动态声调特征可以决定与之对应的韵律节奏模式。而动态声调特征主要由声调在不同韵律层级下的连读模式反映出来。下表1总结了以上几种方言例句核心韵律结构与调律计时表现之间的联系。

Table 1. Core prosodic structures and melody/timing patterns of the illustration sentence in Mandarin and three Wu dialects
表1. 普通话和三种吴方言例句的核心韵律结构与调律计时表现
4. 结论
由于声调的动态特征是影响话语自然流畅的关键,因此本文在分析方言数据时重点考察了方言声调特别是声调连读特点对话语层面韵律与节奏模式的影响。本文提出的两级声调韵律单元(B/DTPU)旨在突出声调在语流中的表现,揭示声调与韵律之间直接或间接的联系,并将这些联系作为重要依据为汉语方言话语韵律与节奏模式确立类型学归属。特别地,本文以普通话和吴语为例说明了此结构可以将不同汉语方言之间以及同一方言内部子方言之间声调连读模式以声调为支点根据韵律单元的大小和分支方向区分开来,然后在此基础之上为其韵律与节奏类型定性。
尽管前人研究十分注重声调与语调之间的关系,也研究了声调叠加语调后的音高与时长表现,但更注重从语调功能的角度探讨韵律在语调短语层面的声学表现,且多是以汉语普通话为主要研究对象,很少作跨方言比较,更没有明确方言韵律与节奏模式的类型学归属。而本文提出的两级声调韵律单元更注重将方言的动态声调特点与调律计时模式相关联,有利于更好地描述与确立方言的韵律与节奏类型。当然,本文还有很多细节以及其它方言有待深入探讨,如方言声韵/语法结构与声调的组合对韵律会产生怎样影响的问题。这里只是抛砖引玉,在前人基础上提出自己的一些思考,为今后相关类型学理论及实证研究提供借鉴。
基金项目
浙江省社会科学界联合会研究课题“浙江吴语方言的韵律节奏类型学研究”(项目编号:2021N64)。
NOTES
1一些学者提到过类似于BTPU和DTPU的概念,如 [29] 提出的基于双音节的自然音步和基于四字格的复合音步, [30] 提出的简单韵律词和复合韵律词等。这些韵律词可以作为形成B/DTPU的基础,但B/DTPU的构成更加灵活、以反映语流的变化情况。
2一般不超过三个字调。超过三个非轻声字调就可以构成两个BTPU。
3单字调功能词不一定要按照语法结构并入相邻的BTPU。
4实验数据显示有少数受试者产出的例句对B/DTPU的划分与例1不同。如有的凸显“在”字,归入“争论”所属的BTPU;有的凸显“谁的”,单独构成一个DTPU,后面的“本领”则与“大”构成一个DTPU。
5 [31] 提到在一段话语中,以四音节最为稳定。因此DTPU的大小是四个字调的最稳定。类似地,IU的理想长度一般是四个DTPU,再长就需要分成几个IU才符合汉语说话的习惯。
6对于汉语是否有重音,学术界已有诸多争论 [23]。这里提及的音节轻重主要以其承载的字调是否轻声/轻读为依据。而轻声/轻读的主要表现就是时长的缩短。
7发音人所说本地方言用词和声调受环境影响有混杂的情况,不一定完全与参考文献中记载的相符。
8 [25] 提到定海话除轻音变调外,也有后变型变调,表现为前字调趋于中平调而后字调基本不变,调值呈现前低后高的模式,但变调后的前字不像轻音变调的后字一样有明显缩短的现象。因此B/DTPU仍然设置成以左为支点向右分支。
9“北风则”中的“则”表现为非常短的入声,不适合作为支点调。因此这里显示附着在“风”上,所在BTPU可视为向左分支,与其它BTPU分支方向保持一致。例4中的情况类似,“风”字两边都附着入声调,所在BTPU可视为向右分支,与其它BTPU分支方向保持一致。
10其中“太阳来”由于声调本身的音高是整体下倾,似乎是向右分支。但实际上“来”字的时长和音强都较大,因此仍然可以作为支点调承载整个B/DTPU单元。