语言中的递归运算能力是人类独有的吗?——基于近二十年的文献回顾
Is the Ability of Recursively Computing in Language Unique to Humans?—Based on a Review of Literature Spanning Nearly Two Decades
DOI: 10.12677/ml.2025.132219, PDF, HTML, XML,   
作者: 杨启航:苏州大学外国语学院,江苏 苏州
关键词: 语言递归运算合并Language Recursion Computation Merging
摘要: 为什么只有人类具有“语言”能力,而其它动物(即使是与我们最相近的黑猩猩)只具备简单的“交流”能力?这一问题困扰并驱使着语言学家、认知神经科学家等不同领域学者提出不同的假设和猜想,并在近二十年里力图通过实证方式验证其猜想,其中Hauser等人2002年提出的假设得到了最多的关注,他们认为人类语言区别于动物交流的本质在于是否能在语言系统中进行递归运算。本文总结近二十年理论、实证研究结果,首先定义什么是“语言”和什么是语言系统中的“递归”,并在此基础上回顾总结语言中的“递归运算”能力是否是人类独有的,并为后续的实证研究提供研究思路。
Abstract: Why do humans uniquely possess “language”, while other animals (even our closest relatives, chimpanzees) are limited to simple forms of “communication”? This question has puzzled and inspired scholars from various disciplines, including linguistics and cognitive neuroscience, to propose diverse hypotheses and conjectures. Over the past two decades, researchers have endeavored to test these ideas through empirical methods. Among these, the hypothesis put forward by Hauser et al. in 2002 has garnered the most attention. They argued that the essence of human language, distinguishing it from animal communication, lies in the capacity for recursively computing elements within the language system. This article synthesizes theoretical and empirical research findings from the past twenty years, first defining what is “language” and what is “recursion” in language systems, and then addressing whether the capacity for “recursion” in language is unique to humans. At last, I offer insights and directions for future empirical research.
文章引用:杨启航. 语言中的递归运算能力是人类独有的吗?——基于近二十年的文献回顾[J]. 现代语言学, 2025, 13(2): 735-745. https://doi.org/10.12677/ml.2025.132219

1. 引言

《圣经》里曾有这样一个故事:很久以前,人类说着同一种语言,决定建造一座通天的塔,希望到达天堂。塔在巴别城(Babel)建起,但上帝见此举傲慢无礼,决定阻止。他让人们开始说不同的语言,使彼此之间无法交流。最终,巴别塔的建设陷入混乱,人们分散到世界各地,塔也被废弃。也因此,世界上才会有那么多种不同的语言。这则故事看似荒诞,背后也包含着两个有趣但难以回答的问题:人类语言的共同属性是什么?为何只有人类拥有“语言”?近二十年来不同领域的学者针对这两个问题提出了不同的假设和猜想,其中Hauser等人提出的假设最具有争议性[1] [2]。他们认为,人类语言系统有别于其它动物交流系统是因为一种叫作“递归运算”的能力,例如鸟类能够运用递归运算进行精确的长途飞行,而仅有人类将这一能力内化在语言系统(I-language)中,使得我们的外化语言系统(E-language)能够产出无数包含复杂意义的语言表达式[3]。本文基于过去二十年的实证研究探讨语言中的递归运算能力是否可能是人类独有的,并为未来回答这一问题的研究方向提供思路。本文的结构设置如下:第二部分将围绕“什么是语言”这个问题展开,在本文中,“语言”指的是一种大脑认知运算机制[4],而不是不同语种之间的差别(例如英语、法语、汉语等不同语种的差别);第三部分围绕“递归”的定义展开,在该部分我会介绍递归运算的不同定义,明确语言中的递归运算是什么;第四部分根据近二十年的部分实证研究进行讨论,探讨语言中的递归运算能力是否是人类独有的。

2. 什么是“语言”?

市面上常见的语言学导论中,“语言”被定义为“用于人类交流的任意声音符号系统”。这一定义受到许多学派的赞成,认为“语言”只是用来进行交流的工具,是社会文化的产物[5]-[7]。例如Fedorenko等人利用功能性核磁共振技术,发现语言激活的脑区和其它与思维有关的活动激活的脑区没有交叉之处,因此断定语言与思维无关,语言只是用于交流的主要工具[8]。不同社会文化之间的交流方式不同,因此不同语言之间的形式应当没有明确的共性可言,儿童习得一种语言也只不过是简单的、基于使用(usage-based)的“刺激–反应”过程,在不断接收“语言”信号刺激的情况下,儿童便能习得任何一种“语言”[9]。在这种观点下,语言来源于社会生活,是社会文化的产物;不同社会文化映射着不同种语言,因此人类语言的共同属性难以确定,而人类语言与动物交流的区别或许是人类有更加高级的认知功能。

另一种观点则认为,“语言”应当被定义为:一种由生物遗传决定的、能够利用有限方法(finite means)产出无限具有层级性表征式的认知运算机制(a computational cognitive mechanism) [4]。更加细致一些,“语言”被简化为一种大脑认知运算机制,它以原特征(atomic features)为输入项,通过最简单的运算方式(即binary set-formation),将两个原特征“合并”,输出为一个更大的表征式,并通过某种加标运算方式(labeling algorithm),给这个输出的表征式新的名称,而这个新的名称只能为两个原特征中最显著的那一个,这便是生成语言学下的“合并”运算机制[10]。例如,当输入项为形容词{green}和名词,那么大脑将这两个输入项合并为{green, ball},并加标为ball,因为在这两个输入项中,ball比green的句法特征更加突出(green ball解读为“有一只球,它的(颜色)属性是绿色”,而不是“有一种绿色,它的属性是球”)。而“合并”可以把该输出项作为新的输入项,与另外一个原特征继续进行合并操作,如此以来不断产生新的表征式,这便是“递归性合并”[11]。而不同种语言之间的差异也仅仅体现在语序(英语:green ball,法语/西语:ball green)、词汇形式、语音形式等外显形式上,本质上所有语言的内在形式,即递归性合并运算机制,是相同的[3]。这一观点认为,人类独有的语言能力首先是由基因赋予的(genetic endowment),且受到其它认知功能(或自然法则)制约;儿童习得某(几)种语言是经历从基因赋予的初始状态(initial state),到接收外界特定某(几)种语言的信号并学习其特定的词汇形式、句法特征,形成一个稳定状态(final state)的过程[12] [13]。如若人类独有的语言能力由基因赋予的,那么任何一种人类语言都会存在共性,并受到相同原则的制约,这便是“普遍语法(Universal Grammar, UG)”的含义,任何研究语言初始状态的理论都归于UG的范畴内[14] [15]。因此在该观点中,“语言”(特指某种大脑认知运算机制)存在同一起源,且这种可能人类独有的运算机制或许来自于基因突变[16]

本文支持第二种观点,认为“语言”是人脑的某种认知运算机制,可能是人类独有的,本文后续围绕语言中的递归运算的内容也将以此定义为基准。

3. 语言中的递归运算

递归是一个基础概念,可以应用于多个领域,包括计算机科学、数学和语言学。在计算机科学中,递归通常指一种函数调用自身的过程[17],其中阶乘函数是一个典型的例子。在语言学中,一个典型的例子是“Mary knows that Mike found that Jack saw…”这样的句子,可以用形式语法规则表示为:S → N + V + S。Chomsky (1957)首次阐述了递归在语言学中的重要性,他认为递归使人们能够通过有限的句法规则生成无限数量的句子[18]。自从Hauser等人提出“递归是语言能力中唯一独特的人类成分”这一观点[1],并被Pinker和Jackendoff称为“唯递归假设(the recursion only hypothesis, ROH)”以来[19] [20],关于递归是人类天生遗传的能力,还是“通过基于输入数据进行的统计学习而逐步涌现的结果”[21]这一争论从未停止。在本文第四章节中,我简要回顾了部分支持或反对ROH的可靠行为和神经生物学证据。在本章节中,我将总结前人文献并定义语言中“递归”的含义。

3.1. 合并和语类递归

合并(Merge)操作是指将两个语言单位(例如“the”和“flower”)结合成一个最小的层级结构(如“the flower”)。正如Chomsky所提出的[10] [12] [22],合并遵循无界原则(unbounded),即生成的结构(如“the flower”)可以与另一个成分(例如动词“blooms”)结合,形成更大的语言单位(如“the flower blooms”)。这一操作可以递归性地应用,从而生成无限数量的层级结构,因此合并是语言系统存在递归性质的必要操作之一。合并是二元的,这意味着每次操作只能将两个语言单位结合在一起。这种假设的二元特性具有哲学和理论上的依据,并受到儿童语言习得路径的观察支持。图1提供了基本合并操作的示意图。假设xy是两个语言单位,将xy合并生成一个最小的层级结构K = {x, y}。进一步将新生产的单位K与另一个语言单位(如z)合并,将生成另一个层级结构K' = {z, {x, y}}。如果用于合并的z是直接从词库中选择的词汇项,这一操作称为外合并(External Merge),表示该操作在工作区中引入了一个新的成员(见图1(a))。如果z = xz = y,则这一操作称为内合并(Internal Merge),表示合并操作没有从词库中选择新成分,而是从已有的合并结构中选择以创建新的结构(见图1(b))。

Figure 1. An example of how MERGE operates. (a) External-merge refers to the process that newly generated element “K” merges with a new element “z”, where zx and y; (b) Internal-merge means the newly generated element “K” merges with a new element “z”, where z = x or y. Specifically, “Mary” under the node “z” is copied from that under the node “y

1. 合并操作在树形图上的具体形式。(a) 在生成单位K后,输入项为zzxy时,所用到的操作是外合并;(b) 当生成单位K后,输入项为zz = xy时,所用到的操作是内合并;具体来说,z节点下的“Mary”是从y节点下的“Mary”那儿“复制”来的

而语类递归(categorical recursion)指的是一种语言表征式,而非某种操作[21] [23]。例如某一结构包含多个相同语类或类型的成分,那么该结构就展示了语类递归的特性。例如,“John thinks that Mary said that Bill left”这样的句子体现了语类递归,因为它包含多个嵌套子句(“that Mary said”和“that Bill left”),这些子句都属于同一语类,即补语短语(CP, Complementizer Phrase)。

总而言之,合并指的是搭建语言层级结构的基本操作,而语类递归特指合并操作下产生的一个特定、由多个相同语类搭建而成的具有层级性的语言表征式。这两个概念当前生成语言学理论(如“最简方案”)中都处于核心地位,但它们描述的是两个不同的方面,前者指的是人脑中进行的认知操作,后者指的是通过这种操作形成的独特语言表征式。语类递归强调了通过合并操作实现的具有层级性和自相似的具体语言表征式。

3.2. 直接递归和间接递归

合并这一基础操作和语类递归都通过组合两个语言单位形成层级结构。然而,自然语言中也存在不体现句法层级关系的结构,其中并列结构就是一个典型例子。例如,(1a)中的名词似乎没有展现层级关系,因为交换它们的位置不会改变表达的整体语义;而(1b)中的名词短语位置变化则会导致完全不同的表达意义。像(1a)这样通过并列标记结合语言单位的结构,Chomsky将形成该结构的操作称为“形成序列”操作(Form Sequence) [24],Roper则称之为直接递归(direct recursion) [25],这种操作同样可以生成无限长的语言表达式。

Roeper (2011)提出,直接递归是语法的默认模式,因为它涵盖了早期儿童使用“并列”来表达的许多关系,这些关系后来会被更复杂的因果或时间连接词(如“so”、“then”、“but”)所取代[25]。他的观点得到了可靠的实证研究支持。例如,Matthei (1982)发现,当儿童听到包含一系列形容词修饰的名词短语(如“second green ball”)时,他们倾向于将其理解为并列的表达(如“second and green ball”),即“第二个并且是绿色的球”,而非成人通常采用的层级结构,即“绿色球中的第二个球”[26]。Pérez-Leroux等人(2018)观察到,无论是儿童还是成人,在生成递归结构时都表现出比生成非递归结构更大的困难[27]。这些研究结果进一步支持了直接递归是语言早期发展的基本模式的观点。

1a) Ben, Chuck, Jack…and Mary decided to go camping. = Mary, Jack, Chuck…and Ben decided to go camping.

1b) Ben’s father’s friend’s bike ≠ Ben’s friend’s father’s bike

相较而言,间接递归(indirect recursion)是指将两个不同的语言单位绑定成一个较大的组成部分,这种机制与合并存在一定相似性。Hollebrandse和Roeper (2014)通过短语结构规则展示了间接递归如何在表示层面运作。例如,在像“John knows that Mary found that…”这样的递归句子中,支撑该操作的表示规则涉及两个特定规则:S → NP VP和VP → V (S)。他们指出:“句子层面的递归并非直接生成,而是必须通过另一个节点……与并列不同的是,每个成分都必须依次被解释。‘母亲的厨师的车’并不等同于‘厨师的母亲的车’”[28]

总结下来,直接递归是指通过并列标记结合两个语言单位,并被认为是儿童语言中的默认语法模式。间接递归则在基本操作上与合并共享相似之处,但在定义递归的视角上有所不同:间接递归从语言表达式的角度定义,而合并则从语言(认知)操作的角度定义。

4. 近二十年支持/反对“语言系统中的递归运算能力是人类独有的”的实证研究回顾

验证递归运算是否是人类狭义语言能力中唯一的核心成分的一种最直接的方法,是通过比较现代人类与大约六百万年前分化于其他非人灵长类的祖先之间的颅骨和大脑解剖结构。如果可以否定原假设(即在人类和祖先之间,与交流相关的大脑结构及其功能并无显著差异),那么我们就可以合理推断,语言中运用递归运算的能力可能是一种涌现现象,或许由基因突变或大脑中新增的神经连接引发。然而,由于技术限制以及可用样本的缺乏,目前这一研究方向几乎不可能实现。Hauser等人提出了使用比较研究法作为探讨这一强假设的替代途径[1]。这一研究方向已经产生了许多具有前瞻性的成果,无论这些研究的结论是支持还是反对原假设。因文章篇幅原因,在本节中我们主要回顾两个领域的比较研究:跨物种对比实验,和语言习得/加工实验。

4.1. 跨物种对比实验

跨物种对比研究通常聚焦于人类与其他非人灵长类或鸟类之间的比较。在Hauser等人(2002)的综述中[1],构成广义语言能力(faculty of language in broad sense, FLB)的关键组成部分——感觉运动系统和概念意图系统——在人类与许多其他物种之间存在一定的相似性。例如,模仿他人声音的能力被认为是儿童轻松习得词汇的重要机制,这种能力在海豚和鸣禽中也被观察到,但在非人灵长类中缺失。在语音感知和产生方面,许多非人灵长类能够基于节奏差异区分不同的语言,并能够发出特有的、物种典型的声音[29]-[32],类似的语音表达能力也可以在鸟类中观察到。因此,他们认为人类语言FLB中的感觉运动系统和概念意图系统是和其它大多数动物有共性的。而狭义语言能力(faculty of language in narrow sense, FLN),假设中仅包含递归运算能力,且仅有人类拥有,相关的观察数据则呈现了不同的图景。例如,虽然黑猩猩等非人灵长类能够将物体的数量与阿拉伯数字对应,并且能够进行一些基本的数学运算(例如,左边的箱子里有两根香蕉,右边的箱子里有两颗橙子,总共是4个物体),但要达到这一水平通常需要数千次试验以及多年的训练[33] [34]。此外,与人类儿童通过开放性学习快速掌握阿拉伯数字不同(即一旦儿童学会1、2、3,甚至4,就会自动理解整数列表的递归计算并掌握后续所有数字),黑猩猩学习每一个数字所需的时间几乎相同,并且无法理解其中的内在结构,因此属于封闭式学习。

回到语言系统中的递归运算能力对比实验,目前主流的实验范式是通过人工语法学习,比较人和其它灵长类或鸟类对人工语法序列的产出和理解能力,而大多数实验涉及的人工语法实验刺激都采用语类递归序列表征式。例如,Fitch和Hauser (2004)比较了人类与棉顶狨在人工语法序列尾递归(tail recursion)和内递归(nested recursion)学习中的表现[35]。他们发现,棉顶狨能够轻松掌握初级的有限状态语法(Finite State Grammar, FSG),这种语法以(AB)n序列为特征,仅表现出局部依存关系,例如A1B1A2B2A3B3序列。然而,当涉及到以AnBn递归序列为特征、具有长距离依赖关系的短语结构语法(Phrase Structure Grammar, PSG)时,例如A3A2A1B1B2B3,棉顶狨即使经过多年训练,也无法掌握该人工语法的规则。这表明“棉顶狨在自发识别或记忆层级组织的声学结构能力上存在一种特定且根本性的计算限制”[35]。相比之下,对比组(人类)参与者仅在极其有限的学习时间内(少于3分钟)就能够轻松学会并掌握这两种人工语法的规则。因此他们推断,棉顶狨无法理解PSG序列的原因在于它们的神经计算能力受制于某些因素,而这些因素中语言系统的递归运算能力受限是关键,因此人类能够理解更加复杂的PSG序列,而其它猿类则不能。

然而这一推论很快被之后的人工语法实验打破。通过类似的实验范式,Gentner等人(2006)发现,经过数千次试验后,欧洲椋鸟能够理解同时理解由简单的尾递归规则组成的(AB)ⁿ序列,以及更加复杂的短语结构语法(Phrase-Structure Grammar,PSG;或上下文无关语法,context-free grammar,CFG),并能够判断呈现给它们的刺激序列是否符合这两种语法的规则[36]。这一发现反驳了Fitch和Hauser (2004)提出的“只有人类能够理解PSG语法”的假设。此外,Abe和Watanabe (2011)通过熟悉–区辨范式(familiarization-discrimination paradigm)观察到,白腹文鸟能够自发地区分语法正确的PSG人工语法序列(例如A2A1CzB1B2)与语法违背的序列(例如A1A2CzB1B2),且所需的训练时间非常短[37]。他们还在文鸟的大脑中定位了负责这种区辨的特定脑区——前脆皮外侧大细胞核(LMAN)。这一脑区被认为类似于人类负责句法加工的脑区(即Broca区,BA 44和BA 45)。因此,他们大胆推测,雀形目鸣禽(如白腹文鸟)能够处理PSG语法,而这一能力此前被认为是人类特有的。

针对Gentner等人和Abe & Watanabe的研究,Corballis (2007)提出了反驳意见,认为Gentner等人的实验结果或许仅仅表明被测试的鸣禽能够通过简单的机制(如计数或快速数量感知)来区分PSG人工语法序列,而非通过语言系统的递归运算来加工[38]。Corballis进一步指出,真正理解PSG语法需要理解嵌套元素内部的配对关系(例如A1只能与B1配对,因为两者有独特的联系),而不仅仅是区分语法正确的结构与其他结构。另一方面,Beckers等人(2012)质疑了Abe和Watanabe在白腹文鸟实验中的方法学问题[39]。他们指出,熟悉化阶段的刺激与测试阶段语法正确条件下的刺激存在相似性,而在语法错误条件/熟悉化阶段与语法正确条件/熟悉化阶段之间的相似性存在明显的不平衡。因此,鸣禽对语法正确/错误条件的反应差异可能主要是由于测试阶段的正确和错误条件与熟悉化阶段刺激之间相似性的差异所导致的,而非真正的语法处理能力。

有关非人类灵长类动物和鸣禽能否处理人工语法序列,近几年发表在ScienceNature上的几篇文章给出了一定程度的答复[40]-[42]。Ferrigno等人(2020)通过非语言递归任务,比较了不同物种以及人类社会不同文化背景、不同年龄段(儿童vs.成人)的参与者产出人工语法PSG的能力[40]。作者们用括符(例如,{ [ ] })来测试研究对象的语法产出能力,并通过贝叶斯统计分析来推断/预测研究对象是通过哪种加工策略来产出符合PSG语法的序列的。研究表明,人类参与者(包括儿童和来自不同文化背景的成年人)能够高效地产出符合PSG语法的序列表征式,且产出PSG语法的比例要显著高于产出其它语法对应的序列表征式(i.e., cross-dependency, tail-recursion);而猴子则需要额外训练才能表现出这一能力,且尽管猴子在经过训练后展现了递归规则的转移能力,但其表现仍显著低于人类。这一结果说明递归能力在人类中具有发展早、跨文化一致的特点,而在猴子中虽然存在潜力,但需要更多外部支持。同时,Liao等人(2022)的研究发现,乌鸦表现出类似的递归运算能力[41]。作者们采用与Ferrigno等人(2020)同样的实验范式,发现能够泛化生成未见过的PSG嵌套结构,并在层级增加时仍保持这一能力。与猴子相比,乌鸦在产出PSG嵌套结构中表现更优,而与人类儿童表现接近。研究表明,理解/产出符合PSG语法的人工语法序列可能在灵长类以外的物种中独立进化,并非人类所独有。Suzuki等人(2022)的实验揭示了日本山雀具有核心合并(core-Merge)能力[42]。通过播放单声源的“警报–召集”组合呼叫,日本山雀表现出显著的防御行为,而当呼叫从两个声源播放时,这种行为明显减少,表明它们将单一来源的组合呼叫视为整体。这一发现表明,核心合并能力可能不仅存在于人类,也可能是某些动物通信系统中的关键认知机制。

综上所述,跨物种对比实验大多使用人工语法序列为实验刺激,且得出的结论存在不一致性。一部分研究认为其它非人类动物因语言系统中不存在或只有有限的递归运算能力而无法理解/产出符合PSG语法的人工语法序列,而另一部分研究则通过特定的实验设计发现例如猴子、乌鸦等动物能够产出符合PSG语法的人工语法序列,即使它们的产出能力不如人类群体。

4.2. 语言习得和语言加工实验

跨物种比较研究中关于递归结构(如短语结构语法PSG)理解和产出的证据揭示了人类与其他动物在行为和神经层面的差异与相似性,但正如上文所述,大多数跨物种对比实验采用的是人工语法范式,而该范式是否能够有效揭示语言加工涉及的具体机制还存在很大争议[43]。而儿童语言习得的研究给语言递归能力的发展提供了一个研究窗口。例如,在语类递归表达式习得路径的研究中,可靠的实验数据一致表明,儿童在理解或产出语类递归结构方面存在显著困难,或者直到较晚的年龄才能够习得接近成人水平的递归结构[26] [44]-[51]。例如,Matthei (1982)发现,直到大约5岁,儿童才能对前置修饰语语类递归序列(如“second green ball”)的理解实现接近成人的能力[26]。而在此之前,儿童倾向于选择“扁平”的句法结构。他指出,5岁以下的儿童更倾向于将层级性结构“second green ball”理解为非层级性的“second and green ball”。在一项“诱导–产出”实验中,Pérez-Leroux等人(2018)发现,无论是儿童还是成人,在产出名词短语中的递归性修饰结构(如“the bird on the alligator in the water”)时都比产出非递归结构(如“the plate with oranges under the table”)更加困难[27]。有趣的是,Yang等人(2022)通过一项高度结构化的“诱导–产出”任务测试了儿童生成四种递归性关系从句的能力,发现儿童直到10岁才掌握递归嵌套的关系从句结构,这是所有递归关系从句类型中习得年龄最晚的[51]。同时,即便在10岁,仍有相当一部分儿童产出了部分缺失的结构,这些结构类似于Huang和Phillips (2021)描述的“缺失名词短语”结构[52]。然而需要指出的是,目前大部分习得实验最关注的部分是儿童何时(when)习得某个递归性语言表征式,而常常忽视这一现象背后的原因(why)以及儿童是如何(how)习得这一特定的语言表征式的,未来的习得实验需要通过更新实验范式来关注后两个问题的解答。

回到语言加工的讨论中,研究者发现,人类参与者在处理符合PSG语法的人工语法序列与处理有限状态语法(finite-state grammar,FSG,非递归性质)的人工语法序列时,两种结构的加工涉及神经活动。例如,通过记录头皮EEG信号比较FSG和PSG句法加工差异的研究表明,违反FSG序列会引发更大的P300成分[53],这一成分通常由与初始预期偏离的刺激引发,反映了一般工作记忆的增强(关于P300的综述可参见[54])。相反,PSG违反则会引发ELAN (early left-anterior negativity,早期左前部负波),这一成分被认为反映了初始短语结构构建的过程[4] [55]-[58]。这些结果说明人类大脑在计算加工不同语法序列时会采取不同的加工模式。

尽管大量实验表明,人类具备处理短语结构语法(PSG)的能力,但在实际处理这种语法对应的表征式时(尤其是多层中心嵌套表征式),我们的处理能力并没有很好。在自然语言中,引入超过两层嵌套结构会给句子解读带来极大的困难。例如句子:“The rat the cat the dog chased killed ate the malt”(改编自[59])。研究一致发现,处理如此复杂的结构需要比处理较简单结构投入更多的认知资源[60]-[70]。此外,在某些语言中(例如英语:[68] [69];法语:[70];汉语:[52]),当一个嵌套结构(如(2a))省略某个成分(如动词短语)时(如(2b)),母语者在语法性/可接受性判断测试中对句法违背的句式的偏好并不亚于句法正确的句式。此外,针对句法违背的句式对应的阅读时间也不比句法正确的句式更长,甚至会更短[71] [72]。这种现象被称作“语法性错觉”[73]或“动词短语缺失效应”(missing-VP effect)。这些结果似乎表明,我们大脑在加工处理这类递归性语言表征式时更倾向于对递归结构采取一种非递归、“更扁平”的解读。Chomsky和Miller (1963)将此现象归因于核心句法之外的因素(可能是工作记忆) [59]

总结下来,目前的儿童语言习得实验和语言加工实验都有可改进之处,从而更好地探索人类语言系统中的递归运算能力。习得实验在关注儿童习得具体某种递归性语言表征式的同时,还需要关注儿童是如何习得这种表征式的,以及为何是在某个特定年龄段习得的。前者可以采用历时追踪方法,关注部分儿童从不会到会的整个过程,并关注可能促进该结构习得的各种认知因素;后者则需要探究儿童习得过程中大脑神经网络的发育和构建(可参考[56])。值得注意的是,习得实验和加工实验都需要跳出“仅关注某个/些具体语言表征式的习得/加工模式”这单一实验范式,而聚焦于习得/加工这种表征式背后所需的具体认知操作和对应的神经信号特征(可参考[74] [75])。

5. 总结

人类语言的共性是什么(即普遍语法UG包含的内容是什么)?为何人类语言系统有别于动物交流系统?这两个问题始终吸引着全世界哲学、语言学、生物学、人类学、神经科学等领域的科研人员,并驱使我们不断探索人类语言系统的奥秘。本文聚焦于人类语言系统中的递归运算,首先明确定义了“语言”和语言系统中“递归”这两个概念,并简要回顾了近二十年支持或反对“仅人类具备语言中的递归运算能力”这一假设的实证研究,指出目前的实验结果和实验范式不足以明确支持或推翻这一假设。未来的研究应当聚焦于解剖(decompose)语言系统中“递归运算”这一概念,将其具化为不同的子操作系统,对不同的操作系统进行更加细致化的描述,探索不同物种、不同年龄段之间特定子操作系统的异同(从具体的行为学差异到大脑结构、神经活动和基因序列上的差异),从而不断接近上述两个终极问题的答案。

致 谢

感谢杨彩梅教授在文章大方向上给予我指导和建议,同时感谢2023年初苏州大学外国语学院开设的《认知语言学》课程,督促我在当时写下这篇文章的初稿,并在此基础上进行修正。

参考文献

[1] Hauser, M.D., Chomsky, N. and Fitch, W.T. (2002) The Faculty of Language: What Is It, Who Has It, and How Did It Evolve? Science, 298, 1569-1579.
https://doi.org/10.1126/science.298.5598.1569
[2] Hauser, M.D. and Watumull, J. (2017) The Universal Generative Faculty: The Source of Our Expressive Power in Language, Mathematics, Morality, and Music. Journal of Neurolinguistics, 43, 78-94.
https://doi.org/10.1016/j.jneuroling.2016.10.005
[3] Chomsky, N., Seely, T.D., Berwick, R.C., Fong, S., Huybregts, M.A.C., Kitahara, H., et al. (2023) Merge and the Strong Minimalist Thesis. Cambridge University Press.
https://doi.org/10.1017/9781009343244
[4] Friederici, A.D., Chomsky, N., Berwick, R.C., Moro, A. and Bolhuis, J.J. (2017) Language, Mind and Brain. Nature Human Behaviour, 1, 713-722.
https://doi.org/10.1038/s41562-017-0184-4
[5] Christiansen, H.M. and Chater, N. (2018) Creating Language: Integrating Evolution, Acquisition, and Processing. The MIT Press.
[6] Thompson, B., Roberts, S.G. and Lupyan, G. (2020) Cultural Influences on Word Meanings Revealed through Large-Scale Semantic Alignment. Nature Human Behaviour, 4, 1029-1038.
https://doi.org/10.1038/s41562-020-0924-8
[7] Everett, D.L. (2005) Cultural Constraints on Grammar and Cognition in Pirahã. Current Anthropology, 46, 621-646.
https://doi.org/10.1086/431525
[8] Fedorenko, E., Piantadosi, S.T. and Gibson, E.A.F. (2024) Language Is Primarily a Tool for Communication Rather than Thought. Nature, 630, 575-586.
https://doi.org/10.1038/s41586-024-07522-w
[9] Christiansen, M.H. and Chater, N. (2015) The Language Faculty That Wasn’t: A Usage-Based Account of Natural Language Recursion. Frontiers in Psychology, 6, Article 1182.
https://doi.org/10.3389/fpsyg.2015.01182
[10] Chomsky, N. (1995) The Minimalist Program. MIT Press.
[11] 胡旭辉. 语言官能与外部世界的联结——基于生成语言学的语言模型初探[J]. 外语教学与研究, 2024, 56(3): 452-462, 481.
[12] Chomsky, N. (2005) Three Factors in Language Design. Linguistic Inquiry, 36, 1-22.
https://doi.org/10.1162/0024389052993655
[13] Yang, C., Crain, S., Berwick, R.C., Chomsky, N. and Bolhuis, J.J. (2017) The Growth of Language: Universal Grammar, Experience, and Principles of Computation. Neuroscience & Biobehavioral Reviews, 81, 103-119.
https://doi.org/10.1016/j.neubiorev.2016.12.023
[14] Chomsky, N. (2023) Genuine Explanation and the Strong Minimalist Thesis. Cognitive Semantics, 8, 347-365.
https://doi.org/10.1163/23526416-bja10040
[15] Mendívil-Giró, J. (2018) Is Universal Grammar Ready for Retirement? A Short Review of a Longstanding Misinterpretation. Journal of Linguistics, 54, 859-888.
https://doi.org/10.1017/s0022226718000166
[16] Berwick, R.C. and Chomsky, N. (2016) Why Only US. The MIT Press.
https://doi.org/10.7551/mitpress/9780262034241.001.0001
[17] Cormen, T.H., Leiserson, C.E., Rivest, R.L. and Stein, C. (2022) Introduction to Algorithms. MIT Press.
[18] Chomsky, N. (1957) Syntactic Structures. Mouton de Gruyter.
[19] Pinker, S. and Jackendoff, R. (2005) The Faculty of Language: What’s Special about It? Cognition, 95, 201-236.
https://doi.org/10.1016/j.cognition.2004.08.004
[20] 杨彩梅, 董昕. 唯递归假说中“递归”的界定[J]. 解放军外国语学院学报, 2022, 45(1): 1-10, 160.
[21] Chomsky, N., Gallego, Á.J. and Ott, D. (2019) Generative Grammar and the Faculty of Language: Insights, Questions, and Challenges. Catalan Journal of Linguistics, 229-261.
[22] Chomsky, N. (2007) Approaching VG from Below. In: Sauerland, U. and Gärtner, H.M., Eds., Interfaces + Recursion = Language? Mouton de Gruyter, 1-30.
https://doi.org/10.1515/9783110207552.1
[23] Dékány, É. (2019) Foundations of Generative Linguistics. Acta Linguistica Academica, 66, 309-334.
https://doi.org/10.1556/2062.2019.66.3.1
[24] Chomsky, N. (2020) Minimalism: Where We Are Now, and Where We Are Going. Gengo Kenkyu, 160, 1-41.
[25] Roeper, T.W. (2011) The Acquisition of Recursion: How Formalism Articulates the Child’s Path. Biolinguistics, 5, 57-86.
https://doi.org/10.5964/bioling.8831
[26] Matthei, E.H. (1982) The Acquisition of Prenominal Modifier Sequences. Cognition, 11, 301-332.
https://doi.org/10.1016/0010-0277(82)90018-x
[27] Pérez-Leroux, A.T., Peterson, T., Castilla-Earls, A., Béjar, S., Massam, D. and Roberge, Y. (2018) The Acquisition of Recursive Modification in NPs. Language, 94, 332-359.
https://doi.org/10.1353/lan.2018.0019
[28] Hollebrandse, B. and Roeper, T. (2014) Empirical Results and Formal Approaches to Recursion in Acquisition. In: Roeper, T. and Speas, M., Eds., Recursion: Complexity in Cognition, Springer, 179-219.
https://doi.org/10.1007/978-3-319-05086-7_9
[29] Fitch, W.T. (1997) Vocal Tract Length and Formant Frequency Dispersion Correlate with Body Size in Rhesus Macaques. The Journal of the Acoustical Society of America, 102, 1213-1222.
https://doi.org/10.1121/1.421048
[30] Kuhl, P.K. and Padden, D.M. (1982) Enhanced Discriminability at the Phonetic Boundaries for the Voicing Feature in Macaques. Perception & Psychophysics, 32, 542-550.
https://doi.org/10.3758/bf03204208
[31] Owren, M.J. and Bernacki, R.H. (1988) The Acoustic Features of Vervet Monkey Alarm Calls. The Journal of the Acoustical Society of America, 83, 1927-1935.
https://doi.org/10.1121/1.396477
[32] Rendall, D., Owren, M.J. and Rodman, P.S. (1998) The Role of Vocal Tract Filtering in Identity Cueing in Rhesus Monkey (Macaca mulatta) Vocalizations. The Journal of the Acoustical Society of America, 103, 602-614.
https://doi.org/10.1121/1.421104
[33] Kawai, N. and Matsuzawa, T. (2000) Numerical Memory Span in a Chimpanzee. Nature, 403, 39-40.
https://doi.org/10.1038/47405
[34] Matsuzawa, T. (1985) Use of Numbers by a Chimpanzee. Nature, 315, 57-59.
https://doi.org/10.1038/315057a0
[35] Fitch, W.T. and Hauser, M.D. (2004) Computational Constraints on Syntactic Processing in a Nonhuman Primate. Science, 303, 377-380.
https://doi.org/10.1126/science.1089401
[36] Gentner, T.Q., Fenn, K.M., Margoliash, D. and Nusbaum, H.C. (2006) Recursive Syntactic Pattern Learning by Songbirds. Nature, 440, 1204-1207.
https://doi.org/10.1038/nature04675
[37] Abe, K. and Watanabe, D. (2011) Songbirds Possess the Spontaneous Ability to Discriminate Syntactic Rules. Nature Neuroscience, 14, 1067-1074.
https://doi.org/10.1038/nn.2869
[38] Corballis, M.C. (2007) Recursion, Language, and Starlings. Cognitive Science, 31, 697-704.
https://doi.org/10.1080/15326900701399947
[39] Beckers, G.J.L., Bolhuis, J.J., Okanoya, K. and Berwick, R.C. (2012) Birdsong Neurolinguistics: Songbird Context-Free Grammar Claim Is Premature. NeuroReport, 23, 139-145.
https://doi.org/10.1097/wnr.0b013e32834f1765
[40] Ferrigno, S., Cheyette, S.J., Piantadosi, S.T. and Cantlon, J.F. (2020) Recursive Sequence Generation in Monkeys, Children, U.S. Adults, and Native Amazonians. Science Advances, 6, eaaz1002.
https://doi.org/10.1126/sciadv.aaz1002
[41] Liao, D.A., Brecht, K.F., Johnston, M. and Nieder, A. (2022) Recursive Sequence Generation in Crows. Science Advances, 8, eabq3356.
https://doi.org/10.1126/sciadv.abq3356
[42] Suzuki, T.N. and Matsumoto, Y.K. (2022) Experimental Evidence for Core-Merge in the Vocal Communication System of a Wild Passerine. Nature Communications, 13, Article No. 5605.
https://doi.org/10.1038/s41467-022-33360-3
[43] Hochmann, J., Azadpour, M. and Mehler, J. (2008) Do Humans Really Learn AnBn Artificial Grammars from Exemplars? Cognitive Science, 32, 1021-1036.
https://doi.org/10.1080/03640210801897849
[44] Eisenberg, S.L., Ukrainetz, T.A., Hsu, J.R., Kaderavek, J.N., Justice, L.M. and Gillam, R.B. (2008) Noun Phrase Elaboration in Children’s Spoken Stories. Language, Speech, and Hearing Services in Schools, 39, 145-157.
https://doi.org/10.1044/0161-1461(2008/014)
[45] Hollebrandse, B., Hobbs, C., De Villiers, J. and Roeper, T. (2008) Second Order Embedding and Second Order False Belief. In: Becker, M. and Ud Deen, K., Eds., Language Acquisition and Development, Cambridge Scholars Publishing, 268-278.
[46] Li, D., Yang, X., Roeper, T., Wilson, M., Yin, R., Kim, J., Merritt, E., Lopez, D. and Tero, A. (2020) Acquisition of recursion in Child Mandarin. Proceedings of the 44th annual Boston University Conference on Language Development, Boston, 7-10 November 2019, 294-307.
[47] Limbach, M. and Adone, D. (2010) Language Acquisition of Recursive Possessives in English. In: Proceedings of the 34th annual Boston University Conference on Language Development (Vol. 34, pp. 281-290). Somerville, Cascadilla Press.
[48] Mcdaniel, D., Mckee, C. and Garrett, M.F. (2009) Children’s Sentence Planning: Syntactic Correlates of Fluency Variations. Journal of Child Language, 37, 59-94.
https://doi.org/10.1017/s0305000909009507
[49] Pérez-Leroux, A.T., Castilla-Earls, A.P., Bejar, S. and Massam, D. (2012) Elmo’s Sister’s Ball: The Problem of Acquiring Nominal Recursion. Language Acquisition, 19, 301-311.
https://doi.org/10.1080/10489223.2012.685019
[50] Terunuma, A., Isobe, M., Nakajima, M., Okabe, R., Inada, S., Inokuma, S. and Nakato, T. (2017) Acquisition of Recursive Possessives and Locatives within DPs in Japanese. Proceedings of the 41st Annual Boston University Conference on Language Development, Boston, 4-6 November 2016, 626-636.
[51] Yang, C., Hu, Y., Fan, J., Dong, X. and Jeschull, L. (2022) An Experimental Study of Mandarin-Speaking Children’s Acquisition of Recursion under a Formal Definition/Classification System for Recursion. Lingua, 271, Article ID: 103228.
https://doi.org/10.1016/j.lingua.2021.103228
[52] Huang, N. and Phillips, C. (2021) When Missing NPs Make Double Center-Embedding Sentences Acceptable. Glossa: A Journal of General Linguistics, 6, Article 37.
https://doi.org/10.5334/gjgl.1292
[53] Baldwin, K.B. and Kutas, M. (1997) An ERP Analysis of Implicit Structured Sequence Learning. Psychophysiology, 34, 74-86.
https://doi.org/10.1111/j.1469-8986.1997.tb02418.x
[54] Polich, J. (2011) Neuropsychology of P300. In: Kappenman, E.S. and Luck, S.J., Eds., The Oxford Handbook of Event-Related Potential Components, Oxford University Press, 159-188.
[55] Friederici, A.D. (2002) Towards a Neural Basis of Auditory Sentence Processing. Trends in Cognitive Sciences, 6, 78-84.
https://doi.org/10.1016/s1364-6613(00)01839-8
[56] Friederici, A.D. and Chomsky, N. (2017) Language in Our Brain: The Origins of a Uniquely Human Capacity. The MIT Press.
https://doi.org/10.7551/mitpress/9780262036924.001.0001
[57] Friederici, A.D., Pfeifer, E. and Hahne, A. (1993) Event-Related Brain Potentials during Natural Speech Processing: Effects of Semantic, Morphological and Syntactic Violations. Cognitive Brain Research, 1, 183-192.
https://doi.org/10.1016/0926-6410(93)90026-2
[58] Neville, H., Nicol, J.L., Barss, A., Forster, K.I. and Garrett, M.F. (1991) Syntactically Based Sentence Processing Classes: Evidence from Event-Related Brain Potentials. Journal of Cognitive Neuroscience, 3, 151-165.
https://doi.org/10.1162/jocn.1991.3.2.151
[59] Chomsky, N. and Miller, G.A. (1963) Introduction to the Formal Analysis of Natural Languages. In: Duncan Luce, R.R.B.R. and Galanter, E., Ed., Handbook of Mathematical Psychology, John Wiley and Sons, 269-321.
[60] Bahlmann, J., Schubotz, R.I., Mueller, J.L., Koester, D. and Friederici, A.D. (2009) Neural Circuits of Hierarchical Visuo-Spatial Sequence Processing. Brain Research, 1298, 161-170.
https://doi.org/10.1016/j.brainres.2009.08.017
[61] Blumenthal, A.L. (1966) Observations with Self-Embedded Sentences. Psychonomic Science, 6, 453-454.
https://doi.org/10.3758/bf03328087
[62] Friederici, A.D. (2013) Is There a Brain Basis of Recursion? In: Lowenthal, F. and Lefebvre, L., Eds., Language and Recursion, Springer, 101-113.
https://doi.org/10.1007/978-1-4614-9414-0_8
[63] Gibson, E. (1998) Linguistic Complexity: Locality of Syntactic Dependencies. Cognition, 68, 1-76.
https://doi.org/10.1016/s0010-0277(98)00034-1
[64] Gibson, E., Tily, H. and Fedorenko, E. (2013) The Processing Complexity of English Relative Clauses. In: Sanz, M., Laka, I. and Tanenhaus, M.K., Eds., Language Down the Garden Path: The Cognitive and Biological Basis for Linguistic Structures, Oxford University Press, 149-173.
https://doi.org/10.1093/acprof:oso/9780199677139.003.0006
[65] Kimball, J. (1973) Seven Principles of Surface Structure Parsing in Natural Language. Cognition, 2, 15-47.
https://doi.org/10.1016/0010-0277(72)90028-5
[66] Miller, G.A. and Isard, S. (1964) Free Recall of Self-Embedded English Sentences. Information and Control, 7, 292-303.
https://doi.org/10.1016/s0019-9958(64)90310-9
[67] Schlesinger, I.M. (1975) Why a Sentence in Which a Sentence in Which a Sentence Is Embedded Is Embedded Is Difficult. Linguistics, 13, 53-66.
https://doi.org/10.1515/ling.1975.13.153.53
[68] Frazier, L. (1985) Syntactic Complexity. In: Zwicky, A.M., Dowty, D.R. and Karttunen, L., Eds., Natural Language Parsing: Psychological, Computational, and Theoretical Perspectives, Cambridge University Press, 129-189.
https://doi.org/10.1017/cbo9780511597855.005
[69] Gibson, E. and Thomas, J. (1999) Memory Limitations and Structural Forgetting: The Perception of Complex Ungrammatical Sentences as Grammatical. Language and Cognitive Processes, 14, 225-248.
https://doi.org/10.1080/016909699386293
[70] Gimenes, M., Rigalleau, F. and Gaonac’h, D. (2009) When a Missing Verb Makes a French Sentence More Acceptable. Language and Cognitive Processes, 24, 440-449.
https://doi.org/10.1080/01690960802193670
[71] Frank, S.L., Trompenaars, T. and Vasishth, S. (2015) Cross‐Linguistic Differences in Processing Double‐Embedded Relative Clauses: Working‐Memory Constraints or Language Statistics? Cognitive Science, 40, 554-578.
https://doi.org/10.1111/cogs.12247
[72] Vasishth, S., Suckow, K., Lewis, R.L. and Kern, S. (2010) Short-Term Forgetting in Sentence Comprehension: Crosslinguistic Evidence from Verb-Final Structures. Language and Cognitive Processes, 25, 533-567.
https://doi.org/10.1080/01690960903310587
[73] Phillips, C., Wagers, M.W. and Lau, E.F. (2011) 5: Grammatical Illusions and Selective Fallibility in Real-Time Language Comprehension. In: Runner, J., Ed., Experiments at the Interfaces, BRILL, 147-180.
https://doi.org/10.1163/9781780523750_006
[74] Pylkkänen, L. (2019) The Neural Basis of Combinatory Syntax and Semantics. Science, 366, 62-66.
https://doi.org/10.1126/science.aax0050
[75] Murphy, E. (2024) ROSE: A Neurocomputational Architecture for Syntax. Journal of Neurolinguistics, 70, Article ID: 101180.
https://doi.org/10.1016/j.jneuroling.2023.101180