1. 引言
藏语作为汉藏语系藏缅语族藏语支的代表性语言,以我国青藏高原为核心分布并延伸至周边国家,形成丰富的地域变体[1]。学界普遍采用瞿霭堂[2]的分类体系将藏语方言划分为卫藏方言、康方言与安多方言。藏北那曲话传统上属康方言北部次方言,地处康方言延伸地带与卫藏方言交界,因地理邻近与语言接触受卫藏方言影响,是藏北跨方言过渡带的典型代表[3]。
现有藏语方言研究多聚焦纯卫藏方言、康方言、安多方言核心区域,如王志敬[4]剖析卫藏方言拉萨话元音的舌位与唇形特征;鲜曜华[5]详细描写了康方言昌都话的元音系统及历史演变规律;完么措等[6]揭示安多方言元音的共振峰参数与格局特征;那曲话这类兼具康方言底色、受卫藏方言影响的过渡带次土语,其基础元音的声学量化与格局特征研究仍较薄弱。
人类语言普遍以/i、a、u/为核心三角骨架、辅以/e、o/构成基础元音系统[7],格桑居冕等[8]研究表明这五个单元音正是古藏语元音系统的原始核心。本研究聚焦/a、i、u、e、o/五个基础单元音,采用元音格局理论[9]与声学实验方法,提取6名那曲市发音人元音稳态段的第一、第二共振峰(F1、F2)参数,经归一化计算舌位相对值(V1、V2),绘制声学元音图与格局图,明确那曲话基础元音的声学定位与系统特征,完善藏北跨方言过渡带的语音声学数据库,为汉藏语系方言接触下的元音演变研究提供实证支撑。
2. 实验说明
2.1. 实验设备
录音选取隔音及封闭效果良好的室内环境,避免环境干扰。录音设备采用iPhone 15语音备忘录,搭配戴尔Inspiron 5580笔记本电脑,原始音频以M4A格式保存。后续通过格式工厂软件将音频文件统一转换为WAV格式,便于声学分析。音频处理及共振峰参数提取均采用Praat 6.4.27语音分析软件,确保数据采集的标准化。
2.2. 发音人
本实验选取6名藏语那曲话母语者(3男3女,22~30岁),均为藏族、大学学历,其中5名来自那曲市色尼区、1名来自那曲市安多县,所有发音人自幼在那曲生长,日常以那曲话交流且无发音障碍,可保障方言纯度与发音稳定性。发音人信息具体见表1。
Table 1. Information of six speakers
表1. 6位发音人信息
编号 |
姓名代码 |
年龄 |
民族 |
受教育程度 |
出生地 |
M1 |
DZNM |
22 |
藏族 |
大学 |
那曲色尼区 |
M2 |
GSPC |
26 |
藏族 |
大学 |
那曲色尼区 |
M3 |
PBCL |
30 |
藏族 |
大学 |
那曲安多县 |
W1 |
AZM |
24 |
藏族 |
大学 |
那曲色尼区 |
W2 |
YZ |
24 |
藏族 |
大学 |
那曲色尼区 |
W3 |
ND |
25 |
藏族 |
大学 |
那曲色尼区 |
2.3. 实验例字
实验例字以藏语那曲话5个核心基础单元音/a、i、u、e、o/设计,每个元音对应4个常用口语词汇(见表2)。录音前先让发音人熟悉例词列表,确保对词汇发音的自然度与熟练度;随后由发音人对每个例词自然朗读1遍,例词间隔2~3秒,避免刻意发音导致的声学参数偏差,总共得到6 (发音人)*5 (基础元音)*4 (例词) = 120个有效录音样本。
Table 2. The citation form of five basic vowels in Nagqu Tibetan
表2. 藏语那曲话5个基础元音例词
基础元音 |
例词1 |
例词2 |
例词3 |
例词4 |
国际音标 |
词义 |
国际音标 |
词义 |
国际音标 |
词义 |
国际音标 |
词义 |
/a/ |
/kha/ |
ཁ་ 嘴 |
/ama/ |
ཨ་མ་ 母亲 |
/sa/ |
ས་ 地 |
/ta/ |
རྟ་ 马 |
/i/ |
/ri/ |
རི་ 山 |
/phipu/ |
བེའུ་ 牛犊 |
/jin/ |
ཡིན་ 是 |
/ti/ |
མཐིལ 底部 |
/u/ |
/khur/ |
འཁུར་ 背 |
/tuŋ/ |
དུང་ 鼓 |
/ʨʰu/ |
ཆུ་ 水 |
/lu/ |
གླུ་ 歌曲 |
/e/ |
/khe/ |
ཁེ་ 克 |
/me/ |
མེ་ 火 |
/sem/ |
སེམས་ 心 |
/ʨhe/ |
ལྕེ་ 舌头 |
/o/ |
/kho/ |
ཁོ་ 他 |
/mo/ |
མོ་ 她 |
/tho/ |
ཐོག་ 雷 |
/lo/ |
ལོ་ 年 |
2.4. 实验数据处理方法
声学实验方法是元音特征系统分析的重要技术支撑,既能通过声学元音图直观地呈现元音分布态势,也可借助元音格局图实现元音系统的精细化描写[10]。元音的共振峰频率是核心声学参数,其中第一共振峰(F1)、第二共振峰(F2)对元音分布格局最为关键,即F1频率与舌位高低呈负相关,舌位越高F1值越小,舌位越低F1值越大;F2频率与舌位前后呈正相关,舌位越前F2值越大,舌位越后F2值越小,且F2还受嘴唇圆展度影响,圆唇会使F2频率降低[9]。
本研究采用Praat 6.4.27软件提取数据,聚焦每个例词的元音稳态段,提取6名发音人5个基础元音的F1、F2频率值,再对每位发音人同一元音的F1、F2数据进行均值计算,消除个体发音的随机误差,为后续分析提供基础数据。为使声学数据差异更贴近人类听觉感知距离,参照Schroeder等[11]提出的转换模型,将F1、F2原始频率值转换为Bark值,计算公式为:
(1)
随后依据石锋、时秀娟[12]的方法,将Bark值转化为V值以消除发音人生理差异,构建相对化元音格局图,计算公式为:
(2)
(3)
其中,V1为某元音F1的相对值,V2为该元音F2的相对值;B1x、B2x分别为该元音F1、F2的Bark值;B1min、B2min分别为各元音F1、F2 Bark值的最小值,B1max、B2max分别为各元音F1、F2 Bark值的最大值。
声学元音图绘制遵循语音学标准化流程,以F1频率值为纵坐标(Y轴)、F2频率值为横坐标(X轴)建立坐标系,按惯例将坐标轴翻转,使坐标原点移至右上方,最终呈现纵轴F1刻度上小下大、横轴F2刻度左大右小的特征[13],为后续元音分布特征分析提供可视化依据。
3. 实验结果与分析
3.1. 藏语那曲话声学元音图
Table 3. Statistical data of basic vowels of six speakers
表3. 6位发音人基础元音统计数据
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
868 |
325 |
417 |
470 |
486 |
F2 (Hz) |
1510 |
2351 |
1328 |
2184 |
911 |
B1 (Bark) |
7.66 |
3.36 |
4.22 |
4.70 |
4.83 |
B2 (Bark) |
11.02 |
13.94 |
10.24 |
13.45 |
7.96 |
V1 |
100 |
0 |
19.89 |
32.63 |
34.14 |
V2 |
51.51 |
100 |
38.77 |
92.17 |
0 |
声学元音图作为语音声学分析的重要可视化工具,能够直观反映特定语言系统内各类元音的空间分布态势及彼此间的离散程度[10]。基于数据处理阶段得到的各元音F1、F2频率值,本研究统计得到6名发音人5个基础元音的F1、F2均值(四舍五入保留整数),以及经Bark值转换后的B1、B2均值和V值归一化处理后的V1、V2均值(保留两位小数)。6名发音人的F1、F2原始测量数据详见表A1,各项参数的平均值统计结果如表3所示。
根据实验所得各发音人所发例词F1和F2的平均值,以第一共振峰(F1)频率值为纵坐标,第二共振峰(F2)频率值为横坐标,坐标原点设置在右上方,绘制出藏语那曲话声学元音图,绘制声学元音图均进行四舍五入保留整数,如图1所示:
Figure 1. Acoustic vowel chart of Nagqu Tibetan (Unit: Hz)
图1. 藏语那曲话声学元音图(单位:Hz)
从图1藏语那曲话声学元音图可清晰观察到,五个基础元音在声学空间呈现规律性分布,共同构成以/i、a、u/为顶点的三角形元音系统,完整反映了那曲话核心元音的声学空间分布特征。五个基础元音的纵向(F1)分布范围为325~868 Hz,横向(F2)分布范围为911~2351 Hz。其中元音/i/的F1均值325 Hz (表3)为所有元音中最小、F2均值2351 Hz为最大,呈现前高元音特征;元音/a/的F1均值868 Hz为最大、F2均值1510 Hz居中,是低央元音的典型表现,二者作为古藏语原始核心元音,在声学空间中定位明确,体现了那曲话对藏语元音系统的传承性。
元音/u/的F1均值417 Hz、F2均值1328 Hz虽处于后高元音区域,但相较于纯康方言的典型后高元音,其F2频率明显偏高,这可能与那曲话处于卫藏–康方言过渡带、受卫藏方言语音接触影响有关,推测是发音时舌位后缩幅度微调所致。关于这一特征,将在后续章节展开进一步讨论。而元音/e/以F1均值470 Hz、F2均值2184 Hz成为前中元音,位于/i/与/a/之间的前中部区域;元音/o/则以F2均值911 Hz (表3数据)成为五个元音中舌位最靠后的后中元音,处于/u/与/a/之间的后中部区域,二者共同支撑起元音系统的中部层次。
从分布情况与离散程度来看,/i/和/a/的数据点分布相对集中、离散度小,表现出较强的稳定性,这与其作为高频核心元音的功能地位相符;/u/的分布范围略大于前二者,存在一定个体变异。/e/和/o/则各自占据独立的声学空间,无明显分布重叠,既体现了过渡带方言元音系统的有序性,也为后续细分分析提供了清晰的声学基础。
3.2. 藏语那曲话基础元音格局图
元音格局图是经过相对化和归一化绘制得到的,这样做能最大限度地过滤掉不同发音人因口腔的形状不同造成的个性发音差异,凸显元音之间相对关系的共性特征。绘制基础元音格局图主要以声学元音图为基础,利用V值公式进行计算可以得到,如图2所示(数据见上文表3的V1和V2值)。
Figure 2. Vowel pattern chart of basic vowels in Nagqu Tibetan
图2. 藏语那曲话基础元音格局
元音格局标准图形中,V1表示元音舌位高低,V2表示元音舌位前后。元音/i/、/u/的V1值处于0~30范围,属于高元音;元音/e/、/o/的V1值处于30~70范围,属于中元音;元音/a/的V1值处于70~100范围,属于低元音。高元音的/i/、中元音的/e/ V2值分别处于80~100和70~100范围,属于前元音;中元音/o/的V2值处于0~30范围,属于后元音;低元音/a/的V2值处于40~60范围,属于央元音;而高元音/u/的V2值为38.77,处于20~80范围,属于央元音,这与高元音/u/常规的后元音分类不符,呈现出舌位前移的倾向。
整体而言,那曲话基础元音格局既保留了高/中/低元音分层、前后央元音分布的语言普遍架构,又在高元音/u/的舌位前后位置上呈现出偏离常规的特征,体现了过渡带方言元音系统传承与变异并存的特点。
3.3. 那曲话基础元音的性别发音差异分析
对本次实验3名男性、3名女性发音人的发音数据分别绘制声学元音图(图3、图4)与元音格局图(图5、图6)。由图可见,元音/a/在发音时,男性舌位较高,女性舌位偏低;元音/i/的舌位前后存在差异,女性发音舌位更靠前;元音/u/的舌位分布无明显性别差异,二者特征趋于一致;元音/o/发音时,男性舌位略靠后,女性舌位相对靠前;元音/e/的舌位高低有别,男性舌位略高于女性。
Figure 3. Acoustic vowel chart of three male speakers
图3. 三位男性声学元音图
Figure 4. Acoustic vowel chart of three female speakers
图4. 三位女性声学元音图
Figure 5. Vowel pattern chart of three male speakers
图5. 三位男性基础元音格局图
Figure 6. Vowel pattern chart of three female speakers
图6. 三位女性基础元音格局图
3.4. 藏语那曲话元音/u/的分布特征与讨论
在3.1、3.2的分析中,那曲话元音/u/未呈现康方言常规后高元音的典型特征,通过观察元音/u/的声学元音图(图7),其整体分布存在明显离散性。康方言常规元音/u/为典型后高元音,F2值通常处于较低区间,对应舌位靠后;而那曲话元音/u/的部分发音点偏离了这一常规区间,呈现F2值升高的特征,进而导致元音/u/的整体分布中心向舌位偏前的方向偏移。
Figure 7. Acoustic vowel chart of /u/ (Including “shui (water)”)
图7. /u/音声学元音图(含例字“水”)
Figure 8. Acoustic vowel chart of /u/ (Excluding “shui (water)”)
图8. /u/音声学元音图(不含例字“水”)
后续验证发现,这些偏离的发音点对应例字“/ʨʰu/水”的发音。剔除后,元音/u/的声学元音图(图8)中,发音点的集中性显著提升,F2均值向后高元音应有的F2水平回落,整体向舌位靠后的方向靠拢;对应元音格局图(图9),/u/的舌位前后维度更接近常规/u/的发音态势,但仍未完全呈现后高元音的核心特征,依旧存在F2偏高、舌位偏前的轻微偏离。
Figure 9. Changes in vowel pattern chart before and after excluding “shui (water)”
图9. 剔除例字“水”前后元音格局图变化
针对上述现象,其成因或为多重因素共同作用的结果,结合方言特征与语音学原理深入讨论如下:
第一,方言接触的潜在影响。从藏语方言的元音系统特征来看,这一偏离与片区音系差异相关联。芦珺[14]认为传统康方言的单元音系统中并无/y/音位,/u/作为后高元音,“F2偏低、舌位靠后”是其典型声学表现;但鲜曜华[5]的研究显示,康方言内部(如昌都话)后期已出现/y/音的语音变异,且在声学空间中聚类于靠近/i/的前元音区域打破了传统康方言的元音格局。而以拉萨话为代表的卫藏方言中,/y/是稳定存在的前高圆唇元音音位,其核心标识正是F2值偏高(1500 Hz~2000 Hz)、舌位偏前[15]。
那曲话归属于康方言片区,因邻近卫藏方言核心区拉萨一带,易受其语音影响;结合图7可知,其例字“/ʨʰu/水”对应的/u/音F2落在1500~2000 Hz区间,与拉萨话/y/的核心F2区间高度重合,舌位偏前特征也与元音/y/一致,这一表现脱离了/u/音的低F2特征。因此,该变异可解释为那曲话/u/音在特定词汇中,受卫藏方言音系吸引而呈现向/y/音方向靠拢的趋势,可视作方言接触引发音变的潜在信号。
第二,特定语音环境的协同发音效应。本研究中发生显著变异的例字“水”,其声母为腭化辅音/tɕʰ/。语音学研究表明,腭化声母由于其发音部位(舌面前与硬腭接触)的特性,会显著抬高后接元音的F2频率,产生元音舌位前移的听感,这是一种常见的协同发音效应。因此,目前观测到的/u/音前移现象,有可能是由/tɕʰ-/这一特定声学环境所导致,而非音位系统的历时演变。
第三,研究方法的局限。本研究基于共时语料,虽能清晰揭示语音变异的存在,但难以严格论证其历时演变过程。确凿的音变证据需要历时语料的追踪,或运用显像时间假设对比不同年龄层发音人的差异。此外,本次实验词汇样本有限,未能完全平衡声母环境。
综上所述,那曲话中/u/音在“水”一词里表现出前移的特征既可能是方言接触引发的音变初期态势,也可能是特定语音环境下的协同发音结果。本研究更倾向于认为,这反映了一种在方言接触宏观背景下,于特定协同发音环境中率先凸显的声学变异趋势。这一发现为过渡带方言的动态研究提供了重要实证,后续工作可通过扩大样本、控制语音环境、开展社会语言学调查,进一步辨析变异性质并厘清其动因与机制。
4. 结语
本研究通过元音格局理论与声学实验方法,对藏语那曲话/a、i、u、e、o/五个基础元音的格局特征展开探究,得出以下结论:
第一,藏语那曲话五个基础元音以/i、a、u/为顶点构成三角形系统,/i/和/a/分布集中、稳定性强,/e、o/分别占据前中与后中区域;具体来看,/a/的男性发音舌位较高、女性偏低,/i/的女性舌位更靠前,/e/的男性舌位略高于女性,/o/的男性舌位略靠后、女性相对靠前,/u/的发音特征在男女之间趋于一致。
第二,研究发现元音/u/在共时层面存在分布离散性,其核心偏离点对应例字“水”(/ʨʰu/),该音F2值升高,集中于1500~2000 Hz区间,与卫藏方言/y/音核心声学特征高度相似,剔除该字后/u/音分布虽更集中,但仍残留舌位偏前特征。该现象的成因可能关联方言接触下的音变趋势,亦不能排除特定声母环境的协同发音效应。
第三,上述发现为藏语过渡带方言的语音研究提供了重要共时证据与个案。作为康方言与卫藏方言的交界代表,那曲话中/u/音所呈现的变异特征,反映了过渡带方言语音系统的动态性与复杂性,也为进一步探索方言接触与语音变异之间的互动机制提供了切入点。未来研究可通过扩大词汇样本、控制语音环境、结合社会语言学调查等方法,深入辨析此类变异的性质、动因与演变路径。
附 录
Table A1. Statistical data table of formant frequencies of basic vowels in Nagqu Tibetan for six speakers
表A1. 6位发音人藏语那曲话基础元音共振峰统计数据表(单位:Hz)
M1 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
759 |
276 |
364 |
412 |
433 |
F2 (Hz) |
1290 |
2270 |
1265 |
2016 |
765 |
M2 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
758 |
330 |
417 |
488 |
444 |
F2 (Hz) |
1369 |
2059 |
1329 |
1911 |
846 |
M3 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
706 |
307 |
383 |
504 |
452 |
F2 (Hz) |
1404 |
1976 |
1367 |
1921 |
908 |
W1 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
1057 |
316 |
476 |
474 |
577 |
F2 (Hz) |
1656 |
2663 |
1370 |
2418 |
1012 |
W2 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
955 |
389 |
432 |
478 |
584 |
F2 (Hz) |
1656 |
2662 |
1273 |
2379 |
915 |
W3 |
基础元音 |
/a/ |
/i/ |
/u/ |
/e/ |
/o/ |
F1 (Hz) |
970 |
329 |
428 |
467 |
490 |
F2 (Hz) |
1680 |
2473 |
1363 |
2461 |
1050 |