1. 引言
纳米句法是在生成语法的原则参数理论框架和句法制图理论下进一步发展而来的一种新的句法研究理论。我们在知网输入关键词“纳米句法”,发现国内目前只有三篇相关论文,分别是易保树 & 倪传斌(2018) [1]、佟和龙 & 梅德明(2019) [2] 和李巧(2021) [3]。易保树 & 倪传斌(2018) [1] 在讨论名词和动词的区分时,只是简单提到了纳米句法的基本观点:句法由单个的特征投射而来,特征合并组成语素、词、短语,纳米句法理论本质上否认词类的独立存在。佟和龙 & 梅德明(2019) [2] 也是一篇引介性文章,旨在向国内语言学界介绍纳米句法的基本假设和若干应用研究,文章最后还提到了纳米句法对现代汉语句法研究可能带来的启发。李巧(2021) [3] 是一篇硕士论文,作者在纳米句法的理论框架下,探索了汉语趋向动词“来”、“去”的历时演变路径。纳米句法理论在我国的实际应用研究还处于初步阶段,但在国外语言学界已经取得了很多成果,我们选取Lena Baunaz & Eric Lander (2018) [4] 这篇文章进行介绍,一方面希望介绍纳米句法理论的基本理念和原则,增进国内学者对该理论的了解,另一方面也希望能为该理论与现代汉语研究的结合提供一丝借鉴。
2. 纳米句法的理论来源
句法制图和分布式形态学都是生成语法框架下的语言学研究理论,二者均对纳米句法的出现产生了深刻的影响。句法制图始于Pollock (1989) [5] 对屈折层I的分裂以及Abney (1987) [6] 提出DP功能投射于NP之上的观点,沿着这一思路,句法制图理论逐渐发展起来,Rizzi (1997) [7] 对意大利语左缘结构进一步分裂,Cinque (1999) [8] 通过跨语言研究得出IP的功能层级和对应的副词层级等大大推进了句法制图理论的发展。句法制图的目标旨在“绘制尽可能详细、精确、完整的句法结构图”(Rizzi, 2013) [9],这种理念也推动了纳米句法理论的前进。
分布式形态学(Halle & Marantz, 1993 [10], Marantz, 1997 [11], Bobaljik, 2007 [12], 2012 [13] 等)在纳米句法理论的发展中也发挥了重要的作用,两个理论框架都是后插入模型,它们的共同理念在于,句法不仅决定句子结构,也决定单词结构,但纳米句法试图消除分布式形态学中的各种后语法规则和操作。纳米句法对词库的看法不同,而且去除了为句法提供信息的句法前的语素列表,在纳米句法理论中,语素的特征和句法的中心语没有区别。二者的语法模型对比见下图(图1,图2)。
3. 纳米句法核心理念
纳米句法(Caha, 2009 [15], 2010 [16])仍旧是生成语法框架下的一种研究方法,符合乔姆斯基的原则参数框架,其基于功能投射的精细本质和句法结构的精简性研究,可以说是句法制图理论的直接产物。纳米句法本身作为一个新的理论框架,不仅正处于发展的过程中,而且已经具备了一套实证研究的方法。

Figure 1. The grammatical model of Distributed Morphology (Embick, 2015 [14])
图1. 分布式形态学的语法模型(Embick, 2015 [14])

Figure 2. The grammatical model of nano-syntax (Caha, 2009 [15]; Starke, 2011 [18])1
图2. 纳米句法的语法模型(Caha, 2009 [15]; Starke, 2011 [18])1
纳米句法依旧遵循了严格的句法–语义投射和一个特征——一个中心语的准则,认为句法结构本质上上非常简单。如果X、Y、Z三个句法语义特征构成一个语素,纳米句法中不可能把三个特征同时排列成一个“特征集”,而是把特征作为中心两两合并,坚持二分和右分支,形成不对称的树形图,在这点上,坚持了生成语法的基本思想。
3.1. 子语素中心语 & 短语拼写
Lena Baunaz & Eric Lander (2018) [4] 介绍了纳米句法中的两个关键概念——子语素中心(submorphemic head)和短语拼写(phrasal spell-out)。抽象特征和语音实现之间并非一一对应的关系,在任何一种语言里,特征区别总是多于变体。把特征描写为子语素,单个语素通常可以对应于多个形式特征,特征合并到树形图中,如果中心语是子语素,而多个中心语组成一个语素,拼写出的就不仅仅是中心语,还有可能是目标短语,这也是分布式形态学框架中的基本假设。例如,芬兰语的向格由-lle标示,复数由-i标示,而拉丁语的格和数都由同一个语素-ās表示(Caha, 2009 [15], Rocquet, 2013 [17]),这体现了特征和语音间的不对应,具体来看芬兰语和拉丁语的例子:
1) a) karhu-lle
bear-All
onto the bear
b) karhu-i-lle
bear-PL-ALL
onto the bear
2) puell-ās
girl-ACC.FEM.PL
girls.ACC
如果在树形图中表示,芬兰语单独的K和Num合并,而拉丁语中,-ās同时对应K和Num两个特征,为了解决更广泛的问题,纳米句法采用了针对短语的拼写系统,芬兰语的两个语素分别看作KP、NumP两个短语,两种语言的词干也是看作短语成分,如图3所示。

Figure 3. Finnish karhu-i-lle & Latin puel-ās (quoted by Lena Baunaz & Eric Lander 2018 [4])
图3. 芬兰语karhu-i-lle &拉丁语puel-ās (转引自Lena Baunaz & Eric Lander 2018 [4])
短语拼写的引入带来了语法结构的深层次转变。短语拼写是一种把多个中心语词汇化为一个单元的方法,并且不会破坏语素内中心语的层级序列,因此短语拼写允许句法和形态之间直接而透明的对应。形态如同句法一样,在层级序列中把抽象特征作为中心语合并,语素不是事先构造然后作为原始结构块进入句法的,相反,语素由句法构建,且句法的初始构建块是特征(Starke, 2011a [18], 2011b [19])。在形态即句法的思想指引下,特征只能在句法中进行组合,语素在一开始构建好才能储存,如此就不再有特征束(feature bundles)构成的句法前词库了,词库必须是句法后的。从语言习得的角度来看,儿童必须随时间推移确定哪些SMS结构要储存在心理词汇中,也就是说,句法机制不断运行并生成句法树,其中有些是至关重要的,值得储存,当创建一个新条目储存某个SMS结构时,也可以把该结构和语音、概念信息联系起来。真正进入句法计算的只有普遍语法提供的单个原子特征,句法根据普遍的层级序列把中心语进行合并,从而形成语法结构,在句法推导的每一环节,任何句法构建的内容都必须从词库中词汇化,之后继续构建句法,然后再词汇化,如此循环。句法生成的结构叫句法树(S-trees),词汇条目中的句法树称为词汇树(L-trees),词汇树和句法树都源自SMS成分,所以没有必要区分。
3.2. 基本工具和技术
下面简单介绍纳米句法研究中经常使用的方法和工具,以及该理论的重要组成部分——拼写机制。
三种基本工具
在纳米句法中,绘制普遍的精细结构的基本工具包括语义(semantics)、融合(syncretism)和形态包容(morphological containment)。语义组合性是绘制语言结构的方式之一,对于结构而言,路径可以解释为源头和目标的特征组合而成,语义在建立功能层级和决定结构大小差异方面发挥着作用,但仅靠语义是不够,语义事实和句法、形态事实密不可分,Pantcheva (2011) [20] 不仅提供了一些语义论元支撑她提出的路径特征层级,还通过实证研究说明了路径的句法、形态与语义事实的一致性。一个特征能否进行编码的决定性因素在于形态句法,原则上,功能层级的每一个中心语都应该在某种语言里得到形态上的证据支持。
绘制语法结构的第二个基本工具是融合。纳米句法理论也是一种融合理论,对融合的密切关注和研究也推动了纳米句法的发展(Caha, 2009 [15], 2010 [16]; Taraldsen, 2009 [21] 等)。Caha (2009) [15] 把融合的现象定义为两种不同形态句法结构的表面融合,也就是说,当两个甚至更多不同的语法功能以一种形式拼写时,就会出现融合。如法语的方位、目标会发生融合,都用à表示,但英语没有出现融合的情况。又如Caha (2009) [15] 从跨语言视角细致地研究了格系统,并说明格的融合受到限制,如俄语中可见主格–宾格、宾格–属格、属格–与格–工具格的融合,说明只有相邻的格才能发生融合,经过跨语言的调查,Caha (2009) [15] 提出格连续性的普遍原则:非偶然的格融合在跨语言中以连续区域为目标;格的顺序:NOM-ACC-GEN-DAT-INS-COM。只有毗邻特征成分(adjacent cells)才能融合的假设最早由Bobaljik (2007 [12], 2012 [13])提出,被称为*ABA定理。这一原则为探索句法的原子成分提供了强大的工具,辅之以跨语言的验证,我们不仅可以确定有哪些精细的特征存在,还可以进一步推断它们的线性顺序。
然而融合并不能揭示功能特征结构的所有信息,正如上文所述,它可以反映线性顺序,但不能鉴别层级,这时就需要纳米句法研究中常用的第三个工具——形态包含。还是以格为例,不同语言的形态学事实已经表明,有些格包含在其他格里面,如西吐火罗语的宾格包含在属格和与格中,与格包含在工具格中等,介词短语也有类似的情况,如阿拉伯语的与格介词li选择属格作为补足语;德语工具格介词mit选择与格作为补足语:
3) a) li-l-binti (Arabic)
to the girl.GEN
b) mit einem Hammer (German)
with a.DAT hammer
形态包含,尤其是能够直接观察到的形态包含,对于观察底层功能结构嵌套非常清晰,从上述例子中我们就可以看到与格大于属格、工具格大于与格(内部机制见图4)等。

Figure 4. Dative case included in the instrumental PP (quoted by Lena Baunaz & Eric Lander 2018 [4])
图4. 表工具介词短语中的与格(转引自Lena Baunaz & Eric Lander 2018 [4])
由此可以推断出正确的格层级结构如下(图5)。

Figure 5. The case hierarchy (quoted by Lena Baunaz & Eric Lander 2018 [4])
图5. 格层级(转引自Lena Baunaz & Eric Lander 2018 [4])
纳米句法中的拼写原则
融合涉及到一个形式要适用于多个结构环境的情况,词库中存储条目(单一语素)时,一个词汇树可以匹配多个句法树,要更多地了解两者的交互,需要进一步说明短语拼写。一个词汇项由语音结构、句法结构和概念结构三者构成。每种语言都有自己的词汇项,包括语音、句法和概念信息,当它们能够成功存储时,就构成了语言习得。每个句法结构不一定都对应于特定的词汇项,事实上,融合现象表明,单个词汇树通常会投射到多个不同大小的句法树上,这就需要讨论它们之间的匹配问题,匹配过程不仅在句法树和词汇树之间建立联系,也会在句法树和语音形式、概念之间建立联系。词汇树和句法树的匹配涉及三条原则,一一阐述如下:(一) 超集原则(the Superset Principle);(二) 别处原则(the Elsewhere Principle);(三) 循环覆盖/重写原则(the Principle of Cyclic Override)。
(一) 超集原则(Caha, 2009 [15], Vanden Wyngaerd, 2018 [22]):如果词汇是句法的超集,词汇树可以匹配句法树;如果词汇项包含一个和句法节点相同的节点,并且下面所有节点都相同,词汇树可以匹配句法树。
在纳米句法中,超集原则是解释融合现象的核心所在,也正是这一条原则使得单个词汇树可以匹配多个句法树。Rocquet (2013) [17] 分析了法语强代词elle和弱代词elle (she)的融合情况,如下图,L1可以拼写为S1或S2,其中S1和L1完美匹配,S2虽然和L1不同,但L1仍是S2的超集,词汇树包含了S2句法树,S1,S2拼写出来的都是elle (图6)。
(二) 别处原则(Kiparsky, 1973) [23]:当多个词汇树可以对同一个句法树词汇化(通过超集原则)时,此时应选择多余材料最少的词汇树。
这条原则确保了更具体的词项能够优先于一般的词项,又叫最佳拟合原则(the Best Principle)或最简原则(Minimize Junk)。仍以法语代词为例(见Rocquet, 2013 [17]),法语表男性第三人称的强代词lui (him),如果按照超集原则,lui会同时在强弱两个环境中拼写出来,但事实并非如此,因为还有一个词汇项——弱代词il (he)与之竞争,看Rocquet (2013) [17] 提供的例句:

Figure 6. The fusion of strength and weakness in Elle (quoted by Lena Baunaz & Eric Lander 2018 [4])
图6. Elle的强弱融合(转引自Lena Baunaz & Eric Lander 2018 [4])
4) a) Marie travaille. Pierre, quant à lui /*il, joue sur la plage.
M. works P. as to himSTRONG /heWEAK plays on the beach
Marie is working. As for Pierre, he is playing on the beach.
b) Il /#Lui joue sur la plage.
heWEAK /heSTRONG plays on the beach
he is playing on the beach.
例句a中,介词quant à后使用弱代词il不合语法,但b句却完全可以,第二条原则就可以用来解释这种现象,参照下图,可以看到有两个词汇树,L3和S3不匹配,但L2、L3同时适用于S4,前者是S4的超集,L3与S4完美适配,根据别处原则,L3更适合S4,L3把句法树词汇化,S4拼写出il (he) (图7)。

Figure 7. Strong lui vs. weak il (quoted by Lena Baunaz & Eric Lander 2018 [4])
图7. 强lui vs.弱il (转引自Lena Baunaz & Eric Lander 2018 [4])
超集原则和别处原则也有助于我们理解*ABA定理,对如何确定哪些特征可以在功能序列中发生融合发挥着重要作用。
(三) 循环覆盖/重写原则:前面的词汇化被后面的词汇化推翻或取消。
循环覆盖原则又叫最大胜利定理,在自下而上的结构派生系统中的应用非常直观,下面仍以法语代词的例子进行说明,下图分别是是法语附着语素le (him)、弱代词il (he)、强代词lui (him)的词库条目(图8),结构是由一次一个功能特征构建起来的。构建lui的第一步是构建S8,根据别处原则,拼写出L6,然后添加S特征得到S9,拼写出il,il的拼写覆盖了之前的le,最后添加特征C,结构[CP[SP[IP]]]拼写出lui,lui的拼写覆盖了低层的il,见图9。

Figure 8. The lexical entries of French clitic le, il, lui (quoted by Lena Baunaz & Eric Lander 2018 [4])
图8. 法语附着语素le (him)、弱代词il (he)、强代词lui (him)词库条目(转引自Lena Baunaz & Eric Lander 2018 [4])

Figure 9. The cyclic override in the derivation of lui (quoted by Lena Baunaz & Eric Lander 2018 [4])
图9. Lui派生过程中的循环覆写(转引自Lena Baunaz & Eric Lander 2018 [4])
需要注意的是,循环覆写并不会取消SMS结构,恰恰相反,这条原则能够确保系统派生中始终保持“最新”状态,在SMS和词库之间进行最新且最有效的匹配。这一点对语音非常重要,虽然语法信息和概念信息都可以通过组合建立,但受线性约束,语音必须始终选择最新最佳的发音方式。
习语在纳米句法中的解释
到这里,我们就完成了对超集原则、别处原则和循环覆写原则的介绍。下面来看短语拼写规则对习语的解释力,习语自身带有各种特点,标准句法理论解释习语时总是面临各种问题,但在纳米句法理论中解释习语就会更容易。
Starke (2011a) [18] 提到,在短语拼写规则下,习语是很自然的,只是内部存储了相对高级的成分。“相对高级的成分”不仅可以是动词或名词短语,也可以包含体、时等功能层级。习语分为两种,一种是语音上的,一种是概念上的。语音上不规则形式代替了规则形式的就是语音习语,如child的复数形式不是childs而是children,child-s在派生过程中的某个节点上构建,之后该组合在更高的节点上被children语音覆盖;概念习语指的是那些规则概念被特殊的概念信息所取代,如kick the bucket脱离原本的意义,变为die的意思,派生过程中与kick、the和bucket有关的单个概念在最高节点处被替换或收到额外解释。从纳米句法视角分析习语需要注意两点,首先,不是所有的词汇条目都有自己的语音和概念内容,尤其是概念习语只是“劫持”已有的词汇条目,没有自己的语音;同理,语音习语也没有自己的概念内容,它们指代的是已有词汇项的概念意义。其次需要注意的是,循环覆写原则主要和语音习语密切相关,与概念习语无关。
拼写驱动的移位
前面我们介绍了拼写涉及的三个原则,这部分将介绍这些原则如何应用于一个完整的推导过程。在运用这些原则时,如果要为拼写提供恰当的结构配置,句法结构常常需要变化,这种以帮助拼写为目的的结构变化,我们称之为拼写驱动移位。Starke (2011b) [19] 发展了一个重要的观点,拼写具有成分身份严格条件(strict constituenthood condition)限制:只有成分可以作为拼写目标。
当一个句法结构需要词汇化时,要查阅词库是否有词汇条目可以与之匹配,这个过程是逐步渐进的,按照纳米句法学家的假设,结构是由一次一个中心构建起来的,而且每一层次的结构都必须成功地被词汇化,在每次循环过程中,这个结构都有多次被成功词汇化的机会,最后直至结构中的任一部分都不再是非词汇化的状态。拼写驱动移位的计算过程如下:
保留 > 循环 > “滚雪球”(STAY > CYCLIC > SNOWBALL)
假设在推导过程中,[HP[GP]…]已经形成且得以拼写,下一步特征F添加到结构[HP[GP]…]中,如图10所示。结构[HP[GP]…]已经拼写,但特征F没有。为了拼写特征F,结构首先需要保持原样,并检查词库中是否有包含结构[FPF[HP[GP]…]的词汇条目(图10)。如果没有合适的词条,则将F姊妹节点最左边的女儿节点GP移到F的左边,并检查词库中是否有包含剩余的词条,即[FP[HP…] (图11)。如果没有合适的条目,则循环移位被撤消,F的姊妹节点被移到F的左侧,并检查词汇中剩余的成分,即FP (见图12)。

Figure 10. The spell-out process of STAY (quoted by Lena Baunaz & Eric Lander 2018 [4])
图10. 拼写运算过程-STAY (转引自Lena Baunaz & Eric Lander 2018 [4])
拼写驱动的移位是一个为词汇化生成新的候选成分的过程,这一机制很大程度上受制于Cinque (2005) [24] 的U20理论:包含扩展投射的中心语的一个成分经历左向短语移位,并且可能涉及不同程度的伴随现象(pied-piping)。在该理论框架进行的许多研究说明,拼写移位的落脚点是一个没有标记的指示语位置,这种移位也不会留有语迹(Starke, 2011b [19])。作者还就如何应用拼写移位进行了实例说明,我们这里不做详细介绍。

Figure 11. The spell-out process of CYCLIC (quoted by Lena Baunaz & Eric Lander 2018 [4])
图11. 拼写运算过程-CYCLIC (转引自Lena Baunaz & Eric Lander 2018 [4])

Figure 12. The spell-out process of SNOWBALL (quoted by Lena Baunaz & Eric Lander 2018 [4])
图12. 拼写运算过程-SNOWBALL (转引自Lena Baunaz & Eric Lander 2018 [4])
前面主要解释了后缀或右侧附加语素在拼写驱动移位中的应用,那么,前缀或介词一类的前置成分如何派生呢。文献中有各种解释,Lena Baunaz & Eric Lander (2018) [4] 主要介绍了三种解释方法:跨越(span ning)、核心移位(head-movement)和额外空间的使用(the use of an additional workspace)。从跨越的视角看,拼写不需要严格的构成条件就可以匹配,跨越是“核心的不寻常序列”。前缀结构由核心移位形成的解释是Caha (2010) [16] 在Travis (1984) [25] -Baker (1988) [26] 的基础上提出的。第三种方法对于拼写要求成分身份,得到了Pantcheva (2011) [20] 等的提倡,句法结构可以在多个认知工作空间中建立,派生前缀的方法之一可以先假设在一个次工作空间内构建一个复杂的核心结构,然后和主要的空间结构合并,这种情况下,复杂核心在自己的工作空间分别构建,也不需要核心移位,还能使特征的内部序列符合功能层级序列。合并到主要工作空间的复杂核心也是一个合适组成成分。如何把复杂核心合成到拼写的运算过程中仍然需要回答,这时可能就需要为前缀性的或复杂核心结构提供空间,在之前的运算中增加一个步骤,即STAY > CYCLIC > SNOWBALL > HEAD-MOVE或STAY > CYCLIC > SNOWBALL > CONSTRUCT。我们这里只概括地说明三种解释前缀性成分的方法,没有给出具体案例,更多内容可以参考Lena Baunaz & Eric Lander (2018) [4]。
4. 纳米句法中的原则和参数
根据纳米句法的观念,语言结构的原子由句法–语义特征按照普遍的功能序列层级合并为句法核心得来的,但要回答普遍特征是什么这个问题,纳米句法学家也需要对广泛语言的形态句法现象进行详细研究。
词库树决定了拼写运算的过程,但不同语言词库树也不同,与词库树匹配的句法树在拼写中也会随语言而不同,也就是说,语言拼写出的结构会因词库内容不同而不同,这样就可以解释由词库不同而导致的变异。功能序列虽然呈现出跨语言的一致性,但词库存储的结构会随语言变化而变化,这可以看作语言的参数。Pantcheva (2011) [20] 研究路径表达时,提到马其顿语和荷兰语的例子,马其顿语nakaj (toward)可以分解为位置语素kaj (at-Place)和na-(to-Path),如图,而荷兰语narr (toward)是一个位置和路径不可分裂的多功能语素,如图13。

Figure 13. Macedonian nakaj vs. Dutch narr (quoted by Lena Baunaz & Eric Lander 2018 [4])
图13. 马其顿语nakaj vs. 荷兰语narr (转引自Lena Baunaz & Eric Lander 2018 [4])
图示简单表明了这两种语言在功能层级序列表现上的不同,马其顿语分裂成了两个词汇树,而荷兰语将其存储为一个单元。
词库存储导致变异这一纳米句法方法同样适用于句子层面的现象。
5. 结语
纳米句法本质上仍是制图方法在语言结构上的应用,尤其在研究语素内部结构上表现得尤其明显。纳米句法也遵循了制图理论所要求的严格句法–语义投射、语法投射简洁性、一个特征——一个中心语原则等假设。
纳米句法中的短语拼写不再需要专门针对中心语或终端节点,而是可以拼写整个短语,短语拼写是对语素内部结构从纳米句法视角作出的回应:句法特征和中心语都是子语素构成的。句法负责构建语素,词库为句法提供信息。纳米句法理论的核心是关注拼写,确定句法结构如何通过词库匹配而实现词汇化,拼写的过程受到三个原则制约,分别是超集原则、别处原则和循环覆写原则。在具体的推导过程中,句法结构可以发生改变从而产生与词库存储结构匹配的成分,这些变化通过移位实现,也就是我们所说的拼写驱动移位,受STAY > CYCLIC > SNOWBALL这样的算法控制。
纳米句法把句法、语义、形态三者结合视为一个单一模块SMS,SMS模块采用原子特征,根据功能层级序列把特征合并作为中心语,其中功能层级序列是跨语言普遍的,体现了语言的原则性,而功能层级序列分裂成的词汇条目随语种变化而不同,体现的是语言的个性,这是语言变异的参数性所在。总而言之,纳米句法理论有助于进一步探索语言的共性、个性以及二者之间的交互关系。
Lena Baunaz & Eric Lander (2018) [4] 把纳米句法理论置于制图理论和分布式形态学的背景下展开介绍,他们首先分别概述了制图理论的发展历史和基本理论,以及分布式形态学的理论和术语,指出了二者与纳米句法的主要差异,然后在主体部分重点结合具体实例介绍了纳米句法理论,包括纳米句法的核心理念、主要技术、基本工具等,最后从原则参数框架的角度对纳米句法进行了整体解读。这篇文章既为我们交代了纳米句法理论发展的背景知识,也细致地介绍了纳米句法的核心理念以及利用纳米句法分析语言现象需要掌握的技术和工具,对我们阅读和理解纳米句法理论方面的文章很有帮助,也能启发我们在今后利用该理论分析和研究汉语语言现象,与其他语言进行对比,进一步揭发语言的共性和变异本质。
基金项目
本文是北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)项目的阶段性成果(项目编号:22YCX190)。
NOTES
1SMS代表syntax,morphology,semantics,纳米句法中,三者被视为同一模块。