1. 引言
侗台语声调的分化与归并是声调演化中一个重要问题,如许多语言中“浊平归去”的声调音变是一种比较特殊的现象,其发展变化是侗台语一个突出的演变特征,演化过程和结果具有复杂性和不平衡性。随着社会发展和语言演化的影响,北部方言红水河土语区的壮语发音人在不同年龄段的发声情况出现不同程度的音变现象,例如存在“浊音清化”的现象,但仅凭“弱化”“强化”并不能全面反映浊声母演变的所有路径,同时需要考虑“擦音化”“响音化”的演化途径。
2. 浊音清流声学研究
针对浊音清流和浊音气化现象的研究,朱晓农(2009: 1-29)证明了佤语在发声过程中存在气化现象,并指出佤语中“松–紧”元音的对立,实际上是常态音与弛声音的对立 [1]。蒙有义(2013: 77-81)证明了布努语中有气声的存在,在发声态上与浊音存在差异 [2]。Castro et al. (2010: 1-39)指出,云南文山县和红河县苗族方言中有阳上、阳去和部分阳入调类的发声态,也属于具备区别特征发声态的气声 [3]。朱晓农(2010: 1-19)以亚洲南部各语系和南方汉语方言为研究材料,证明浊音清化后低调会变成送气清音,高调则变为不送气的情况 [4]。陈忠敏(2010: 20-34)以上海话为例论证了吴方言清音浊流的声学特征和鉴定方法 [5]。孙瑾(2018: 328-336)首次发现(亻革)语野落话存在气声,且存在常态元音与气化元音的对立,声调上也存在一定程度的区别 [6]。综上可知,声母出现浊音清流现象对于元音和声调都会产生发声态改变的影响,但没有从历时纵向的角度去论证浊音气化产生弛声后对于声调演变趋势的影响。
本文经过田野调查和数据分析发现,北部方言红水河土语区壮语的阳平调存在气音,且对声调的音高产生明显的降调影响。假如浊音清流后,声门阻碍压力自然会减少,若声带振动的同时有气流呼出,造成带有喉门摩擦声或呼气声的非常态发声,那么浊音清化后不会直接使基频振动增加,而是演变为非常态的气化振动,该振动频率非常的低,音高声域处于低域,根据表现形态定义为“纯低调”1。由于气化音只与“纯低调”相匹配,因此存在气化声调和常态声调的音位对立关系。
3. 研究过程
本文选用朱晓农(2004: 3-19)的Lz-Score值作为归一化处理的方法 [7]。利用Praat软件针对发音人的每个字的录音进行标注,每一个单字都标注完毕之后,再用基频提取程序自动提取每个单字11个点的基频数据和时长,然后根据阴平(T1)、阳平(T2)、阴上(T3)、阳上(T4)、阴去(T5)和阳去(T6)六个舒声调类提取每一个调的基频测量值的均值。将基频值的均值取对数值,再取对数值的均值μ和标准差σ。将各声调在0%位置的均值要舍去,降调100%位置的均值也要舍去。按照公式(xi-μ)/σ求出每个对数值的Lz-Score值。将Praat提取中的基频时长十等分。以时长为横轴数据,以Lz-Score值为纵轴数据,做出发音人的声调格局图(如图1)。

Figure 1. Lz-Score tonal base frequency normalization diagram for the M36’s Zhuang Shusheng tones in Sanwu Town
图1. 三五镇M36壮语舒声调的Lz-Score声调基频归一图
本文以广西来宾市三五镇为中心的调查点,共调查了16位发音人,以村为单位,一共有4个点,分别为平塘村、兴隆村、老莲花村和三五村。所有发音人均为长期生活在频繁的壮语使用语言环境,没有外出务工经历,不同村之间互通无碍,壮语差异较小。根据壮语方言地图的划分,在三五镇调查的所有语言点都属于北部方言红水河土语区。根据年龄将16位发音人分为老年组(60岁及以上)、中年组(40岁至60岁)和青年组(20岁至40岁),老年组选取4名,中年组和青年组选取6名,且男女比例1:1,确保不同年龄和性别的实验样本得到均衡。2单字调字词选取《壮汉词汇》(1984) [8] 的常用例字作为发音字词,每组调类取12个字词,6个调类共选取72个单字进行声音样本采集,故16位发音人共采集1152个音频样本,该样本数量已符合具有代表性声学参数的基本要求。表1为三五镇壮语舒声调单字调词表。

Table 1. List of single-character words for the Zhuang Shusheng tones in Sanwu Town
表1. 三五镇壮语舒声调单字调词表
在指称发音人时,为方便查看性别和年龄,用“M”表示男性(Man),用“W”表示女性(Woman),用数字表示年龄,代码分别是M71、W70、M62、W64、M56、W52、M49、W47、M45、W42、M36、W38、M35、W32、M33、W29。以下为老年组发音人的Lz-Score 图2。

Figure 2. Lz-Score values for the M71’s Zhuang Shusheng tones
图2. M71壮语舒声调的Lz-Score值图

Figure 3. Lz-Score values for the W70’s Zhuang Shusheng tones
图3. W70壮语舒声调的Lz-Score值图

Figure 4. Lz-Score values for the M62’s Zhuang Shusheng tones
图4. M62壮语舒声调的Lz-Score值图

Figure 5. Lz-Score values for the W64’s Zhuang Shusheng tones
图5. W64壮语舒声调的Lz-Score值图
根据各发音人的Lz-Score值图,并结合实际听感来确定16位发音人六个舒声调的调值,做出如下表2三五镇壮语16位发音人单字调调值。

Table 2. Table of Shusheng tones values for the 16 pronouncers of the Zhuang in Sanwu Town
表2. 三五镇壮语16位发音人舒声调调值表
根据声调调值可以看出:16位壮语发音人的阳类调(T2、T4、T6)相较于阴类调(T1、T3、T5)较为混乱,尤其是阳平调和阳去调,不同年龄段的调值和调型存在明显的差异性,但又体现声调演化规律性:阳平调的调值和调型在老年组中呈现为升调,在中年组中主要呈现为“凸”型调,而在青年组中统一呈现为降调;阳去调的调值在老年组中存在与阴去调相似的情况,调型为高平调,在中年组中主要呈现为中降调,在青年组中呈现为高降调。由于阳平调的演化规律性相对阳去调更加明显,本文选取阳平调作为研究对象,提取基频、谐波、共振峰等声学参数对其进行声学分析,并结合发声态和音法演化理论探讨三五镇壮语阳平调的音变机制。
4. 阳平调基频参数分析
4.1. 基频点离散性分析
所有具有可能性的数据分布被称为离散空间分布。通过将阳平调基频值的离散空间分布与集中空间分布作对比,可以更好地判断数据内部的个体离散性,并有效地处理异常值。通过实验测量带有塞音和塞擦音的阳平调整体音高分布情况,合成做出箱式图,如图6所示。

Figure 6. Box plot of the frequency distribution of the Zhuang Yangping tone base frequencies in Sanwu Town
图6. 三五镇壮语阳平调基频分布箱式图
从老年组(Elderly group)、中年组(Middle-aged group)和青年组(Youth group)三组发音人的阳平调音高范围中可以看出,阴平调音高离散型分布呈现三种情况:老年组是处于常域中较高的调域,基频范围在150~250 Hz之间;中年组是介于常域和下域之间,基频范围在50~175 Hz之间;青年组是处于下域的纯低调域,基频范围在0~100 Hz之间。根据上、下水平线和上下四分位距分布范围和高低状况,青年组(Youth group)音高分布范围最集中,老年组(Elderly group)和中年组(Middle-aged group)分布范围最大,说明不同这两种组内部不同发音人之间的发音差异较为显著,可以看出三五镇壮语的老年组和中年组的阳平调都出现不同程度的演化,而青年组基本完成了演化结果。
4.2. 基频线性拟合分析
基频线性拟合需要基于数值的线性关系来设置。本文最佳拟合线的直线方程设定过程主要参考Tbain (1999: 333-357)通过对一种语言中某些特定的塞音进行多个第二共振峰(F2)起始点和目标点的检验,得到一条与全部样本之间的总误差最小的线,即最佳拟合线 [9]。采用直线关系拟合法求得所需要的参数,最后求得二者的线性方程式,并给出相应的拟合结果,将三组曲线合成一个图中作对比,如图7所示。

Figure 7. Scattered linear fit of Yangping tone of the Zhuang in Sanwu Town
图7. 三五镇壮语阳平调散点线性拟合图
实验结果表明:三五镇壮语老年组和青年组的阳平调基频数据更加符合线性关系,且老年组的拟合曲线趋势为升调,基频分布在上域,青年组的拟合曲线趋势为低降调,基频分布在下域,中年组的拟合曲线为“两折”型,基频分布在中域。说明老年组和青年组的阳平调已处于两种完全对立的调型,而中年组则处于过渡阶段,基频数据点由上域逐渐向下域发展。
从图7可以看出,声调基频值从老年人向青年人演化过程中,整体走势向下并最终集中在100 Hz左右,形成位于调域下方的短降调。根据声调目标在低点的表现形式,青年组的阳平调存在“纯低调”(朱晓农、章婷、衣莉,2012:193-199)的特征:一是各种曲线轨迹走向的低调调型,如低平、低降等,例如广西藤县岭景镇话、北京话、台州方言等发成基频断裂的嘎裂声,赫兹值远低于一般发声态的频率下限,其记音为11、12、21等,都是“纯低调”这一调类的语音变体;二是改变发声模式,创造一个“低”调域。例如,咸阳话的阴平调在末尾的最低点有一个断裂,导致整个基频断裂,使曲线无法显示出声调的拱度,让声音出现低沉和下降的现象,听感上是一个低降调 [10]。
为了更好地判别三五镇壮语阳平调是否由于发声态变化引起的声调演化,需要结合下域发声态类型来分析阳平调演化为“纯低调”的成因。朱晓农(2012)用发声态来定义“调域”和“声域” [11],如图8。
下域的发声态为气声,因为气声纵向最松弛,声带松弛使得振动时带有送气,爆发能量减小,声道壁较松软,后接元音音高降低,所以基频最低。因此,笔者推测阳平调极有可能是受到气化音的影响,从而在浊音清化后没有提升基频值,而是将振动频率降至最低端,形成“纯低调”。

Figure 8. Six types of vocal states in the three vocal ranges
图8. 三个声域的六类发声态
5. 阳平调谐波参数分析
由于气声发声态最为松弛,辅音爆发能量较小,可以用第一谐波(H1)和第二谐波(H2)之间的能量差值来判断。Bickly (1981: 71-81)认为气化音的H1与H2的能量差(H1-H2),显著地大于常态音的H1与H2的能量差 [12]。Ladefoged (2001: 383-406)进一步指出,气化音的H1和H2差值要大于常态音的H1和H2差值,即常态音的H1和H2差值更接近于零 [13]。图9和图10是三五镇壮语“逃”[dui2]在56岁男性和32岁男性发音时的宽带语图,左边是常态浊音,右边是浊音清化后的非常态“清音浊流”气化音。通过观察图11和图12对应的功力频谱图(瞬间能量)可以看出,在声带振动30~40 ms点的常态浊音的H1能量小于H2,且H1与H2的差值较小;而右边非常态气化音的H1能量大于H2 (H1 > H2),且H1与H2的差值较大。
Blankenship (2002: 193-228)曾提出一个确定气声的声谱特征:第一谐波的数值大于第一共振峰(H1 > F1),当第一和第二谐波差值对气化音和常态音不能明显区分时,可以使用第一谐波与第一共振峰之间的差值作为替代能量差的方法 [14]。由于语言和个体之间的差异,有些语言不能简单地使用H1-H2数值决定是否有气声,像吴语中有时气化程度不高,则会出现反例。由于声带后部闭合不完全,气流溢出,失去大量声能,导致第一共振峰(F1)能量低于正常发音(陈忠敏,2010:20-34),即气化音H1-F1比正常发音的H1-F1的差值大。因此,利用H1与F1能量差也可以区分常态音和气化音 [5]。

Figure 9. Broadband diagram of the pronunciation of the M56’s Zhuang word “flee” [dui2]
图9. 壮语“逃”[dui2]M56发音宽带图

Figure 10. Broadband diagram of the pronunciation of the M32’s Zhuang word “flee” [dui2]
图10. 壮语“逃”[dui2]M32发音宽带语图

Figure 11. Spectrogram power of the M56’s Zhuang word “flee” [dui2]
图11. 壮语“逃”[dui2]M56功力频谱图

Figure 12. Spectrogram power of the M32’s Zhuang word “flee” [dui2]
图12. 壮语“逃”[dui2]M32功力频谱图
根据表3的数据,中年组、老年组的谐波差和谐波共振峰差的平均值总是小于青年组。因此,在同一个单字词中,不同年龄段的差异可以充分反映出它们是两种不同的声音类型,中年组和老年组是正常态的浊音,青年组是非常态的气音。常态音和气化音在不同年龄段是否存在显著差异,本文将采用配对样本T检验方法,用Origin软件的相配性操作验证它们之间的显著性,设置信区间为95%。从表3的统计结果可以看出,常态音和气化音的H1-H2和H1-F1小于0.05,表示常态音和气化音H1-H2和H1-F1值有显著差异,因此具有统计意义,可以证明声调差异体现在不同的发声类型上。
表4和表5中的对组甲表示“不同年龄组之间的常态音H1与H2的谐波差与气化音H1与H2的谐波差的数值比较”;对组乙表示“不同年龄组之间的常态音H1与F1的差值与气化音H1与F1的差值的数值比较”。T检验的结果是两组数据存在显著差异,表明老、中、青年组的谐波和基频值在一定范围内存在差异,应属于不同的发声态类型。经过以上数据对比和统计分析,证明了三五镇壮语存有两种不同的发声态类型,即常态化音和非常态化气声的对立。

Table 3. Mean values of vocal tone harmonics of Zhuang speakers in three age groups in Sanwu Town (unit: db)
表3. 三五镇三组年龄段壮语发音人声调谐波均值表(单位:db4)

Table 5. Repeat sampling for paired sample testing
表5. 成对样本检定的重复取样
6. 阳平调音法演化分析
6.1. 气化弛声产生的原因
一般的台语存在“清、带”爆发音的对立,三五镇壮语的阳平调由于发生了“浊音清化”现象,已不存在常态浊爆音,即声母辅音由常态浊辅音变为弛声清辅音,如图13~16的发音人W29壮语“飞”[pin2]和“毛”[bɯn2]的宽带图及功力频谱图,“飞”[pin2]的辅音/p/是常态清辅音,而“毛”[bɯn2]的辅音/b/是弛声清辅音。常态清辅音声门打开时在除阻前约80毫秒,与成阻同时;弛声清辅音的声带较为松弛,口腔擦化气流将喉头气压降低,并给后接元音的高频处造成乱纹,基频的声学能量大于第二谐波(H2)。
根据传统语音学,声调的阴阳最初由清浊声母决定的,但现代语音学发现清浊声母是喉咙发声状态的差异,而不是声道的音调差异(朱晓农,2009:324-332) [15]。三五镇壮语从常态浊声母演变为非常态的弛声,其实是发声状态发生了变化。一般而言,声音状态的差异视为声调差异处理的,如苗语、吴语等在口腔中摩擦产生的气声都为声调差异而处理。此外,由于弛声引起的基频下降,较低的音高构成了声音的低调域,与声调中域的正常态音构成了最小的对立,因此在区分声调特征方面起着作用。

Figure 13. Broadband diagram of the pronunciation of the W29’s Zhuang word “fly” [pin2]
图13. 壮语“飞”[pin2]W29发音宽带图

Figure 14. Broadband diagram of the pronunciation of the W29’s Zhuang word “fly” [bɯn2]
图14. 壮语“飞”[bɯn2]W29发音宽带图

Figure 15. Spectrogram power of the W29’s Zhuang word “fly” [pin2]
图15. 壮语“飞”[pin2]W29功力频谱图

Figure 16. Spectrogram power of the W29’s Zhuang word “fly” [bɯn2]
图16. 壮语“飞”[bɯn2]W29功力频谱图
壮语阳平调(T2)中存有“浊音清流”现象,即发弛声时闭相阶段声门没有闭紧,声带振动同时,出现漏气的“浊流”。由于壮语的促声调已出现不同程度的舒化,即部分入声无塞音韵尾,且与其它六种调类相结合,根据语言的“补偿机制”,为了与其他调类进行区别,这六个调类构成了低调域。结果表明,三五镇的阳平调中存在低域的弛声,并与其他阳类调发声态所构成的中域形成对立。
6.2. 演化链移路径的逆向表现
目前声调演变的研究主要表现为调类稳定,调值多变。针对声调演化类型学研究,朱晓农运用外部比较法,总结了与声调上升、下降、曲折演化有关的四大演变规律,前两个是循环的,后两个变化结果能够加入前两个循环。这些演变规律在惠普闽语(朱晓农、刘泽民、徐馥琼,2009:4-15) [16]、梅州客家话(朱晓农、李菲,2016:1-8) [17] 和泰语(朱晓农、林晴、趴差桠,2015:3-18) [18] 的演化路径情况中得到验证,如下图17声调四大链移律。

Figure 17. The four major chains of tonal shift rhythms
图17. 声调四大链移律
推断每种方言的声调变化阶段,在传统的时间尺度上重建声调演变,并利用图17对两种升调、两种降调和两种平调演变规律的描述预测声调演变的趋势。该图还显示了在语音和地理上连续的共时音调变化。
从表2三五镇16位壮语发音人单字调调值中可以看出,三五镇壮语阳平调属于顺时针链移环(R1:{32 > 42 > 52 > 55 > 45 > 35 > 24 > 23/323/32})的后半段,即高升{35}→中升{24}→央凹{324/323}→低降{32}。在三五镇壮语按照年龄逐渐递减的实际链移过程中,由中升{24}演化为低降{21}的中间过渡段并不是“央凹”型声调{324/323},而是“央凸”型声调{131/121},具体案例在W70、M62、W64、W47、M45和W42的阳平调中可以体现。因此,三五镇壮语的声调演化路径在中升调向低降调演化过程中存在不符合朱晓农总结的“央凹”型过渡特征,而是“央凸”型过渡特征。本文通过用三域六度的“下域”声调模型模拟出该段音高曲线变化的过程,得出图18和图19所示。

Figure 18. Clockwise chain-shift ring model of tonal evolution
图18. 顺时针链移环声调演化模型

Figure 19. Model of the evolution of the Yangping tone of the Zhuang in Sanwu Town
图19. 三五镇壮语阳平调演化模型
从图18和图19可以看出:顺时针链移环从中升调变成低降调是由于中升{24}调的折点出现在前端,原来的上升趋势由前往后演变(见图18的段点线),折点前段出现降调趋势后,随着调型和声域的发展,上升趋势和折点消失,降调曲线成为声域整体趋势(见图18的实线),演化成为低降调{32}。三五镇壮语阳平调从中升调变成低降调是由于中升{14}调的折点出现在后端,原来的上升趋势由后往前演变(见图19的段点线),折点后段出现降调趋势后,随着调型和声域的发展,上升趋势和折点消失,降调曲线成为声域整体趋势(见图19的实线),演化成为低降调{21}。这一演化特例说明:在顺时针链移环声调演化过程中,声调内部的演化存在逆向发展,一般声调演化是从前往后移动,而三五镇壮语阳平调是从后往前移动,这一特例具有演化类型学的价值。
7. 结语
本文对壮语的16位发音人的舒声调进行了声学分析,并提取基频值、Lz-score值、频谱斜率、不同谐波与共振峰之间的能量差等声学参数。在对比声调格局和调型调值结果后,首先常态发声和气化发声是我们在壮语中发现的两种发声方式,其具体体现在阳平调声学参数的差异上,通过T检验证明三五镇壮语存在常态声调和气化声调的音位对立,具有社会语言学研究价值。
其次,由于“浊音清化”现象的存在,壮语的阳平调由全浊声母演变为弛声声母。根据语言的“补偿机制”,为了区别于其他声调,这六个声调构成了发声态的低域。由于声调是由发声状态和音高组成的,气声一般只与低声调同时出现,因此本文首先发现壮语在常态音和气化音之间存在对立差异。
最后,结合“声调四大链移律”的顺时针链移环,首次发现三五镇壮语阳平调声调内部的演化过程中存在逆向发展,一般声调演化是从前往后移动,而三五镇壮语阳平调是从后往前移动,这一特例具有演化类型学的价值。
NOTES
1针对凹调的类型研究中,朱晓农、章婷、衣莉于2012年首次提出“纯低调”概念,它是建立声调类型研究的首要条件。“纯低调”是指“低于明确调型的声调”,即“underspecified tone”;其次,纯低调在具体的实现过程中,会有多于一种方式来表现“低”这个目标。
2该实验年龄层级划分参照陶寰、陈楠于2018年对乐山方言单字调研究中老中新三派的年龄划分。本文未选取20岁以下的青少年是由于20岁以下的发音人壮语能力受到汉语语言接触的影响较大,许多单字词不能熟练地念读或读成汉语方言音,导致该年龄段的语音样本不具备代表性。
3由于篇幅有限,本文只列出三五镇壮语老年组发音人的Lz-Score值声调格局图。
4注:db为声音强度度量单位,即幅值。其定义为:两个同类功率量或可与功率类比的量之比值的常用对数乘以10等于1时的级差。