1. 引言
语音象征(sound symbolism)是语言学、认知科学与心理语言学中的重要议题,关注语音形式与意义之间的系统性、非任意性映射(Dingemanse et al., 2015) [1],挑战了传统语言学中的“语言任意性原则”(Saussure, 1983) [2],并为理解语言的起源、结构与认知机制提供了新的视角。自Sapir (1929) [3]通过实验揭示语音与意义间的系统对应关系以来,语音象征研究经历了从哲学思辨到实验验证、从单语言到跨语言比较的演进(张立昌、蔡基刚,2013) [4]。
20世纪以来,大量研究表明语音象征广泛存在于自然语言系统之中。无论是音高、频率与意义特征之间的统计规律(Blasi et al., 2016) [5],还是Bouba-Kiki效应所揭示的跨模态感知一致性(Ramachandran & Hubbard, 2001) [6],都说明语言的声音形式并非完全任意。语音象征在语言理解、词汇记忆、情绪表达及品牌传播等多领域展现出重要的认知功能(Imai & Kita, 2014; Lockwood & Dingemanse, 2015) [7] [8]。近年来,随着神经语言学与计算语言学的发展,研究进一步延伸至脑神经机制、语言敏感期与人工智能语义建模等方向,显示语音象征已成为连接语言形式、意义与感知系统的重要纽带(马亚男等,2022) [9]。
尽管近年来语音象征研究成果不断涌现,但国内现有研究仍以理论综述与个案探讨为主,系统性的量化分析相对匮乏,且对语音象征研究的整体格局、主题演化及前沿趋势尚缺乏基于文献计量学的系统梳理。鉴于此,本文以Web of Science核心合集(2000~2025年)为数据来源,借助CiteSpace信息可视化工具,对近二十五年来国际语音象征研究进行计量分析与知识图谱绘制,以期揭示该领域的知识结构与发展脉络,为我国语音象征研究的深化提供参考与启示。
2. 数据来源与处理
本文选取的数据来自Web of Science (WOS)核心数据库,以“sound symbolism”为关键词,检索从2000年到2025年的相关文献(截止至检索日期2025年9月27日),文献类型限于论文(article)和会议论文(proceedings paper),筛选出有效论文数据593篇,包括作者、文献来源、题名、摘要、关键词、发表时间等字段。
在数据分析过程中,采用CiteSpace文献计量与可视化分析工具,对上述593篇文献进行共现网络与突现分析。通过关键词等共引关系的可视化呈现,从整体上揭示2000~2025年间语音象征研究的研究热点与发展趋势,并在此基础上对研究方向和动态变化进行系统梳理。
3. 近二十五年来语音象征研究的发展特征
3.1. 文献数量统计分析
已发表文献的数量及其变化趋势不仅能在一定程度上反映该主题或学科研究的发展速度,也能反映其所处的发展阶段。图1展示了WOS数据库中近二十五年来语音象征研究的相关论文的数量及其变化趋势。
Figure 1. Number of publications on sound symbolism (2000~2025)
图1. 2000~2025年间语音象征相关研究的论文数量
从2000年到2025年,语音象征相关论文数量总体呈上升趋势,体现出这一领域研究的不断扩展,增长规律存在明显的阶段性变化。
2000~2009年为起步探索期。这一阶段年均发文量不足5篇,2000、2002和2005年仅各发表1篇,表明研究尚处于分散的个体探索阶段。2010~2015年为稳步增长期。2010年文献数首次达到两位数(12篇),2015年进一步升至25篇,较前一阶段增长显著。2016~2018年为高速发展期,是整个时间序列中增长幅度最大的阶段。2016年文献数达29篇,2017年跃升至48篇,2018年达到峰值51篇,比2010年增长约4倍。2019~2025年为稳步深化期。2019~2023年间文献数量总体保持高位,研究热度持续不减、保持稳定。2024年发文量达到57篇,为25年间最高值。截至本研究的数据检索日期(2025年9月27日),2025年已发表文献数达35篇,预计全年数据将继续增长,显示语音象征研究的稳定增长与关注度的持续上升。
由此可见,语音象征研究在近二十五年间已由边缘话题逐步走向主流,其稳定的增长态势表明该领域正在迈向成熟阶段,并展现出持续扩大的学术影响力。
3.2. 语音象征研究整体研究趋势
为进一步揭示语音象征研究的热点演变与前沿主题,本文利用CiteSpace对2000~2025年间的关键词进行了突现分析(见图2)。突现词指在一定时期内被频繁引用或高频使用的关键词,其变化趋势可反映研究领域在不同阶段的关注焦点与研究热点的演变轨迹。
如图2所示,语音象征研究在过去二十五年中共出现了9个突现关键词,分别为phonetic symbolism (语音象征)、associations (联想)、sound (声音)、shape correspondences (形状对应)、kiki、bouba、iconicity(象似性)、acquisition (习得)以及norms (规范化)。这些突现词的出现时间与持续时间反映了该领域研究从理论探讨向实证与跨模态方向转化的过程。
2008年至2017年间“音位象征(phonetic symbolism)”突现强度较高(3.69),说明在这一时期,研究者主要聚焦于语音象征及其音位层面的系统特征,致力于界定语音形式与意义之间的映射关系,并构建相关理论框架。同一时期,“联想(associations)”与“声音(sound)”的突现(分别集中在2013~2016年与2015~2017年)体现了学界对语音与意义之间非任意映射关系的持续关注。
自2017年起,突现词的性质开始发生变化,“形状对应(shape correspondences)”“kiki”“bouba”(经典实验范式)等关键词的突显,表明跨模态对应(crossmodal correspondences)成为研究核心课题。这一阶段的研究不仅验证了传统“bouba-kiki范式”的普适性,也推动了语音与视觉、触觉、情感等多感官整合研究的兴起。
进入2019年以后,研究焦点进一步向认知与应用层面延伸。“iconicity”(象似性)成为突现强度最高的关键词(5.48),显示学界对语言非任意性与象似性本质的探讨达到高峰。而“acquisition”(习得)与“norms”(规范化)的出现,表明语音象征研究已深入到语言习得与心理表征领域,标志着语音象征研究的实证化与数据驱动特征愈加明显。
可以看出,语音象征研究在2000~2025年间呈现出由理论建构到实验验证、再到认知应用的阶段性扩展与深化。研究范式经历了从“形式–意义映射”到“多模态感知整合”的转变,体现出该领域正逐步迈向跨语言、跨感官与跨学科的综合发展阶段。
Figure 2. Burst keywords in sound symbolism research
图2. 2000~2025年间语音象征研究的突现关键词
3.3. 语音象征研究热点领域的可视化分析
本研究借助CiteSpace对2000~2025年间语音象征研究领域的高频关键词及其中心性进行了可视化分析,绘制了该领域的知识共现图谱(见图3)。高频关键词能够反映学界关注的核心主题,中心性则用于衡量关键词在研究网络中的“中介”作用。中心性的值越高,表明该关键词在连接不同研究主题中的作用越显著。
Figure 3. Knowledge map of high-frequency keywords in sound symbolism research
图3. 语音象征相关论文高频关键词的知识图谱(2000~2025年间)
Table 1. Keyword co-occurrence frequency and centrality
表1. 关键词共现频次及中心性(频次10次以上)
序号 |
频次 |
中心性 |
关键词 |
序号 |
频次 |
中心性 |
关键词 |
1 |
357 |
0.46 |
sound symbolism |
20 |
21 |
0.02 |
words |
2 |
102 |
0.14 |
perception |
21 |
19 |
0.04 |
arbitrariness |
3 |
83 |
0.09 |
correspondences |
22 |
18 |
0.04 |
english |
4 |
72 |
0.14 |
phonetic symbolism |
23 |
18 |
0.04 |
frequency |
5 |
69 |
0.09 |
language |
24 |
16 |
0.04 |
language evolution |
6 |
69 |
0.09 |
symbolism |
25 |
13 |
0.06 |
integration |
7 |
58 |
0.02 |
shape |
26 |
12 |
0.04 |
infants |
8 |
50 |
0.06 |
iconicity |
27 |
12 |
0.01 |
maluma |
9 |
48 |
0.1 |
crossmodal correspondences |
28 |
12 |
0.02 |
recognition |
10 |
39 |
0.03 |
consonants |
29 |
12 |
0.01 |
taste |
11 |
37 |
0.1 |
speech |
30 |
11 |
0.01 |
communication |
12 |
35 |
0.03 |
pitch |
31 |
11 |
0.01 |
emotion |
13 |
32 |
0.04 |
synaesthesia |
32 |
11 |
0.02 |
gesture |
14 |
31 |
0.09 |
acquisition |
33 |
11 |
0.05 |
information |
15 |
30 |
0.02 |
bouba |
34 |
11 |
0.01 |
speeded classification |
16 |
27 |
0.05 |
brand names |
35 |
10 |
0.01 |
evolution |
17 |
26 |
0.04 |
associations |
36 |
10 |
0.01 |
impact |
18 |
25 |
0.02 |
kiki |
37 |
10 |
0.01 |
norms |
19 |
24 |
0.03 |
sound |
38 |
10 |
0.01 |
size |
通过对CiteSpace共现图谱中词频 ≥ 10的38个关键词进行统计(见表1),可以发现语音象征研究的核心热点词汇主要涵盖语言符号关系、跨模态感知、语音特征、实验范式及语言习得等方向。频次最高的关键词为“sound symbolism (语音象征)”,频次达357,中心性为0.46,显示其在整个网络中居于核心地位,是该领域的研究基点与概念核心。
从中心性与频次的结合分析可知,本领域的研究热点大体可归纳为以下四个方向:
(1) 语言符号与象似性研究
该方向关注“语音象征(sound symbolism)”“音位象征(phonetic symbolism)”“象似性(iconicity)”“任意性(arbitrariness)”“语言演化(language evolution)”等关键词,聚焦于语言符号系统中形式与意义之间的非任意映射关系,是语音象征研究的理论核心与概念基点。早期学者如Sapir (1929) [3]通过实验揭示声音与意义、形状之间存在系统对应,动摇了语言任意性假设的绝对地位。随后,Ohala (1994) [10]从发声动因与声学机制角度提出“自然映射”假说,为语音象征的生理基础提供了合理解释。进入21世纪,研究从理论论证逐渐转向跨语言实证与量化建模,形成以象似性为核心的系统研究框架。
大量跨语言研究显示,象似性不仅表现为局部的语音–语义对应,还构成语言内部的系统性网络。Iida等(2024) [11]通过对日语、汉语、韩语与英语母语者被试的语义评分实验发现,不同语音特征在“大小”“亮度”等维度上形成既共享又特有的映射模式,揭示了象似性的普遍性与语言特异性并存的特征。此类研究推动了从“单一映射”向“多维语义网络”转变,使象似性由感知直觉上升为解释语言结构与认知机制的重要概念。
同时,语言象似性的理论内涵也在不断扩展,从对任意性的反思发展为包含“iconicity-indexicality-systematicity”三维互动的符号系统模型(Monaghan & Roberts, 2021) [12],用以量化象似性与任意性在不同语言结构中的比例关系。此类模型验证了语言符号系统的多层互构特征,标志着语音象征研究正从理论思辨迈向可计算的符号机制解释。研究发现,象似性不仅影响语言的共时结构,还在历时演化中具有稳定化功能:高象似性词在历史演变中更为稳定,提示象似性可能在语言演化过程中发挥“稳定化”的作用。与此同时,语义网络分析表明,象似性词汇在词汇系统中的连接密度与扩散范围均高于任意性词,说明声音–意义映射不仅塑造语言的感知形式,也参与语义结构的形成与传播,是语言系统自组织的重要动力。
该方向揭示了象似性在语言系统形成与演化中的组织功能,为理解语言符号的认知基础与演化规律提供了新的框架。
(2) 跨模态对应与联觉研究方向
该方向以“跨模态对应(crossmodal correspondences)”“联觉(synaesthesia)”“形状(shape)”“音高(pitch)”“味觉(taste)”等关键词为核心,探讨声音与多种感官维度之间的系统映射机制,是语音象征研究从语言符号走向多感官认知的重要分支。早期研究沿袭Köhler (1929) [13]提出的“bouba-kiki”范式,验证了声音与视觉形状之间的稳定对应关系。Deroy & Spence (2016) [14]进一步提出,多感官整合而非简单联想构成了声音–意义映射的心理基础。Velasco等(2015) [15]通过“味觉–形状”匹配实验发现,甜味倾向于与表征圆润形状的语音对应,而苦味则与表征尖锐形状的语音相匹配,表明语音象征体现了语音与感知经验之间的普遍联结关系。
进入2020年代,语音象征研究的焦点逐渐从行为实验转向多模态整合与神经机制的相关研究。神经影像与脑电证据表明,语音象征依赖于、多感官协作的感知网络:语音–形状匹配任务会同步激活视觉皮层与颞叶语言区(McCormick et al., 2021) [16],并在200毫秒内引发自动的一致性效应(Körner et al., 2022) [17]。
该方向推动语音象征研究从单一的音义非任意性解释迈向多感官与神经机制层面的理解,揭示声音不仅承载语言信息,也参与视觉、味觉、情绪等的感知加工,展现语言与感知经验深度交互整合的认知机制。
(3) 实验范式与经典效应研究方向
该方向以“bouba”“kiki”“maluma”等关键词为代表,聚焦于语音形式与意义、形状、触感等之间的直觉性映射,是语音象征研究中实验方法最为成熟、影响最广的领域。自Köhler (1929) [13]提出“bouba-kiki”范式以来,研究者通过操控语音参数(如频率、响度、清浊度)与感知特征(如形状、大小、质地)之间的对应关系,持续验证音义映射的跨语言稳定性与心理现实性。Spence与Gallace (2011) [18]将该范式拓展至味觉领域,发现酸味与高音调、甜味与低音调的稳定配对,证明语音象征可跨越语言界限延伸至感官体验。
近十年来,实验研究的重点逐渐由验证性研究转向机制化与参数化建模。De Carolis等(2018) [19]采用隐性反应范式发现,语音与形状匹配条件下反应时显著缩短,揭示语音象征加工具有自动性。Pathak & Motoki (2022) [20]基于品牌命名任务指出,清辅音(p、k、t)与“锐利感”、浊辅音(b、d、g)与“圆润感”稳定对应,显示语音象征在实际语言使用中的功能价值。近年来,机器学习与语音合成技术被用于生成受控语音刺激与量化声学–语义关系(Erben et al., 2021) [21],推动传统范式向统计建模与计算实验转型。
Loakman 等(2024) [22]进一步利用多模态大模型(VLMs)复现“bouba-kiki”实验,发现模型能部分捕捉人类的象似性判断模式,说明语音象征规律具有一定的可计算性。这些研究共同促成了从“验证效应”到“解释机制”的范式转变,使语音象征实验方法实现了跨模态、跨领域与跨技术的融合,为后续理论模型构建奠定了坚实基础。
(4) 语言习得与发展研究方向
这一领域关注“acquisition (习得)”“infants (婴幼儿)”“language evolution (语言演化)”“communication (交流)”等关键词,关注声音–意义映射在语言学习早期阶段的作用及其在语言演化中的功能,是语音象征研究中连接语言认知与发展心理的重要领域。研究表明,象似性不仅帮助儿童建立初步的词汇系统,也为语言产生与演化提供认知支架。Ozturk等(2013) [23]发现,婴儿在4个月时即可识别语音与视觉形状间的匹配关系,说明象似性感知在语言形成之前已存在。Imai & Kita (2014) [7]据此提出“语音象征引导假说”(sound symbolism bootstrapping hypothesis),认为象似性为儿童构建音义映射提供了重要线索,在语言习得初期具有启发与引导功能。
随后研究进一步表明,象似性对语言学习的影响不仅限于儿童阶段,也体现在词汇发展、概念形成与跨语言迁移中。Sidhu等(2022) [24]发现象似性词汇在低龄儿童产出中频率更高,随年龄增长逐渐减少,表明象似性是语言学习的过渡机制。Lockwood & Dingemanse (2015) [8]指出,象似性通过增强音义联结强度与记忆保持度,提高词汇学习与语义提取效率。Imai & Childers (2020) [25]则发现,名词象似性有助于感知类别识别,动词象似性促进事件理解与动作编码,揭示象似性在不同词类功能中的差异性作用。
该方向揭示了语音象征在语言习得与认知发展中的持续作用机制,凸显象似性作为连接语言形式与感知经验的重要纽带,为理解语言学习的心理基础与认知机制提供了实证依据。
综观2000~2025年间语音象征研究的发展,可以看到该领域从早期的理论论证,逐步迈向跨语言、跨模态与跨学科的系统研究。四个研究方向既相互独立,又彼此衔接:语言符号与象似性研究奠定了理论与概念基础,揭示语音形式与语义映射的非任意性;跨模态对应与联觉研究拓展了音义映射的感知维度,为语音象征提供了心理与神经层面的证据;实验范式与经典效应研究通过范式革新与参数化设计,推动了象似性效应的可重复验证与机制探讨;语言习得与发展研究进一步揭示了象似性在语言学习、认知加工中的功能,使语音象征研究从语言结构层面延伸至语言认知与发展层面。可以看出,该领域正从定性描述走向数据驱动的多维建模阶段,逐渐形成了连接语言形式、感知经验与认知机制的综合研究框架,为揭示语言的感知根基与认知普遍性提供了系统解释。
但本文仍存在若干局限性。首先,数据完全来自Web of Science核心数据库,该数据库以英文文献为主,可能造成对日语、韩语等与语音象征高度相关的语言研究呈现不足。因此,本文所得研究趋势应被视为对WOS数据范围内的反映,而非对全球语音象征研究全貌的完全呈现。
4. 结语
本文基于CiteSpace对2000~2025年间Web of Science核心数据库中以“sound symbolism (语音象征)”为主题的文献进行了可视化计量分析,从共现网络、突现词与高频关键词等方面系统梳理了该领域的知识图谱与研究脉络。分析结果表明,该领域由早期的理论探讨逐步迈向多维实证化与跨学科融合阶段。研究议题从语音–意义对应机制的哲学思辨,转向基于行为实验、语料统计与神经测量的实证检验,并在方法论上实现了从定性解释到数据驱动的范式转变。
首先,从语音象征研究的数量变化趋势来看,2000~2025年间文献数量总体呈稳步上升态势。增长过程具有明显阶段性,整体发展脉络清晰,显示该领域已由边缘议题逐渐走向主流研究方向,未来有望成为研究热点领域。
从语音象征研究的演变轨迹来看,通过突现词在时间序列上的变化可以发现,该领域的研究已由对语音象征概念及音义非任意性关系的探讨,逐渐转向多感官整合、实验心理学与跨模态感知等方向,并进一步延伸至认知与应用层面。这一演进体现出研究范式从理论建构到实验验证、再到认知应用的阶段性深化,显示该领域正迈向跨语言、跨感官与跨学科的综合发展阶段。
从研究热点来看,近二十五年的语音象征研究可归纳为四个核心方向:语言符号与象似性、跨模态对应与联觉、实验范式与经典效应、以及语言习得与发展。语言符号与象似性研究揭示了象似性在语言结构与历时演化中的稳定化功能;跨模态感知研究从视觉、听觉、触觉与情绪等多感官认知出发,阐明了语言与感知经验深度交互整合的认知机制;实验范式研究在“Bouba-Kiki”效应的基础上,通过隐性反应、声学操控与计算建模,深化了对语音象征加工机制的系统理解;语言习得方向强调象似性在早期词汇学习中的认知引导作用,揭示声音–意义映射在儿童语言发展的支架功能,反映语音形式对概念建构与记忆提取的促进效应。反映语音形式对概念建构与记忆提取的促进效应。四者共同构建了从语言形式到认知加工的多层次研究体系,不仅丰富了对语言非任意性与感知机制的认识,也促进了语音象征成果在语言习得、品牌传播及跨模态认知等领域的实践转化。
基于本研究的计量结果,未来研究可从三个方向进一步深化:首先,从突现词的时间演化可见“iconicity-acquisition”连续突现且持续时间较长,说明象似性在语言学习中的作用正成为增长点,未来应在更细分的词类与发展阶段展开系统验证。其次,关键词中心性显示跨模态研究虽热度高,但维度发展不均衡,研究仍集中于少数范式(如bouba-kiki),未来可围绕音高、质地、情绪等高中心性但分散的感知维度构建更系统的实验矩阵。最后,知识图谱中象似性与跨模态对应关联紧密,但与系统性、语言演化的连结较弱,提示未来需将跨模态实验数据与历时语料结合,以弥补“感知层级象似性”向“语言结构层级象似性”过渡的理论断层。随着多模态实验技术与数据分析方法的不断发展,语音象征研究有望在揭示语言的感知基础与认知普遍性方面发挥更核心的理论与应用价值。
基金项目
本文为2025年度大连理工大学基本科研业务费项目“具身认知视角下汉日语音象征的认知机制研究”(批准号:DUT25RW104)阶段研究成果。