1. 引言
语言基本单位的变异规律始终是社会认知语言学的核心探索议题。关于语言结构基本构成单位,不同学派对其的界定存在根本分歧:索绪尔[1]将“词”视为语言符号系统的核心单位;乔姆斯基[2]则主张语言知识的基本构成是词库与句法规则的互动体系;而Goldberg [3]提出的构式语法理论,将“构式”(construction)定义为“形式–意义”的配对体,认为其是人类语言知识的基本单位,这一观点已获得学界广泛认同。
作为人类交际的基本认知表征单位,构式在不同语域(register)中的变体选择不仅体现了语言系统的动态适应性,更揭示了社会认知因素对语言编码的深层制约机制。双及物构式(ditransitive construction)作为英语中表达“成功传递”语义的典型构式,其变体形式,双宾构式与介词宾构式的分布规律,长期以来是形式语言学与认知语言学的研究焦点。然而,现有研究多局限于句法语义接口的静态分析,对语域这一动态社会认知维度的影响尚未形成系统性探讨,尤其缺乏基于大规模语料库的实证数据支撑,以及对跨语域变异规律的量化阐释。此外认知语言学强调构式的体验性与互动性,但现有研究对双宾构式在正式/非正式、书面/口语等语域中的编译规律关注不足,尤其是语义偏移与句法调适的认知机制尚不明确。本研究为填补这一空缺,以双宾构式为研究对象,使用逻辑回归方法,探究其在四种语域的变化情况。本研究揭示双宾构式在英语典型语域中的结构变异,构建基于认知框架的语域编译模型,为社会认知语言学及语言教学提供理论支撑。
2. 文献综述
双及物构式的研究始于对“形式–意义”映射关系的探索,形成了形式语言学与功能语言学的理论分野。形式语言学路径以Chomsky的生成语法为核心,将双及物构式视为句法转换的产物。早期研究认为,双宾构式源于介词宾构式的深层结构移位[4],其变异仅受句法规则制约,像NP1的生命度、NP2的指称性。这一视角虽揭示了构式的形式关联性,却忽视了语义与语境的影响。例如其无法解释为何“She baked him a cake”可接受,而“She donated him a book”却需介词补全[5]。
认知语言学路径则突破形式限制,Goldberg [3]的构式语法理论首次明确双及物构式的核心语义为“成功转移”,即施事通过动作使客体从源点向接受者转移,其整体意义独立于动词个体。此外,Goldberg通过跨语言对比确认,双及物构式的原型语义为“实物转移”,其认知基础源于人类对“给予”事件的具身体验,如手递物品的动作序列。这一核心语义表现为三个必要条件:施事有意向性、客体发生空间转移、接受者最终获得领属权。后续研究进一步发现,该构式的语义范畴可通过隐喻扩展至抽象领域,像“He taught her a lesson”中知识传递,且动词与构式的互动存在语义协调度差异:高适配动词如give、send无需额外标记,低适配动词如explain、donate则依赖介词补全[6]。这为解释构式变体选择提供了语义基础,但对语境动态性的关注仍显不足。
21世纪以来,双及物构式研究从理论推演转向基于真实语料的量化分析,形成两大突破:变异语用学视角和历时分析。Bresnan等人[7]利用Switchboard口语语料库的587例双及物表达,通过多元回归模型证实:除动词类型外,间接宾语的生命度、宾语长度、信息新旧度等语用变量可解释70%以上的构式选择差异。例如,当间接宾语为代词时,双宾构式使用率高达83%。至于双及物构式的历时研究,Traugott [8]对14~19世纪英语语料的追踪发现,双及物构式的语义扩展与社会交往模式相关。商业革命时期“商品交换”场景推动实物转移义的高频使用,而启蒙运动时期知识传播需求促使抽象转移义显著增加,如“teach”,“convey”进入构式。上述研究虽揭示了双及物构式的句法–语义规律,但在语域维度存在明显缺口:现有实证研究多聚焦单一语域,缺乏对多语域变异的系统量化,这正是本研究的核心突破点。
语域作为社会情境与语言选择的中介变量,其对句法结构的影响研究主要沿三条路径展开。其一是语域理论的框架构建。Halliday [9]提出的语域三变量模型(话语范围、基调、方式)为分析语境和语言互动提供了基础。后续研究证实,不同语域中句法复杂度、词汇密度呈现系统性差异[10],如学术语域偏好名词化结构,而口语语域依赖省略与重复。构式变异的语域敏感性。近年来,语料库实证研究发现构式选择具有显著语域依赖性。Thompson [11]对英语使役构式的分析表明,口语中更倾向使用简洁的“V NP Adj”结构,而书面语中则偏好介词补全式。对于双及物构式,Stefanowitsch和Gries [12]的初步研究发现,学术语域中介词宾构式占比显著高于双宾构式,但未深入探讨认知机制与量化规律。社会认知因素的调节作用社会认知视角强调,语域中的构式选择受交际意图与互动策略驱动。
近年来,社会认知语言学提出“变异即认知适应”的理论框架[13],强调语言形式的选择是交际者基于语境需求、认知效率与社会规约的综合决策过程。在此视角下,语域作为语境的核心表征[14],可能通过调节认知负荷与社会互动目标,系统性影响双及物构式的分布模式。例如,正式书面语可能因信息密度的需求更倾向经济性较高的双宾构式,而非正式口语则可能因互动性强而依赖显性句法标记[15]。然而,这一假设仍需通过跨语域对比研究加以验证。
尽管双及物构式与语域变异的研究已取得进展,仍存在三方面显著局限。构式语法与语域理论的跨学科对话匮乏,尚未建立语域和构式互动的系统性分析框架;实证数据局限,现有研究多依赖小型语料或内省数据,缺乏基于大规模多语域语料库的量化证据;对语域、动词语义、宾语特征等变量的交互作用探讨不足,未形成可预测的变异模型。本研究拟通过整合构式语法与社会认知语域理论,基于四种典型语域的大规模标注语料,采用逻辑回归模型量化分析影响双宾构式选择的核心变量,弥补现有研究在实证广度与理论深度上的不足。“send”作为双及物构式的核心动词,具有典型的研究意义。基于此,本研究以动词“send”及其变形为切入点,依托大型英语语料库,探究以下问题:1) 相较于口语,书面语中的双宾构式有什么差异;2) 相较于非正式场合,正式场合中的双宾构式有什么差异;3) 双及物构式的选择受什么变量显著影响。
3. 语料库方法
3.1. 语料来源
本文共设置四种语域变体:书面非正式、书面正式、口语正式和口语非正式。这四种语体是场合和模态的交叉结果,分别对应文字模态的非正式场合、文字模态的正式场合、声音模态的正式场合和声音模态的非正式场合。本文所使用的语料库主要为英国国家语料库BNC,spoken BNC2014和Hansard Corpus (British Parliament)。在BNC提供的语域选项中,本文将Fiction and verse,Non-academic prose and biography,Unpublished written material作为书面非正式文体(nwri);将Newspapers,Academic prose和Other published written material作为书面正式语体(wri);将Spoken conversation作为口语非正式语体(nsp);将Other spoken material作为口语正式语体(sp)。另外从spoken BNC2014 (口语非正式)和Hansard Corpus (口语正式)里提取语料,共得到四种语体下,双及物构式853条,双宾构式443条和介宾构式410条。
3.2. 单位
本文的语料标注主要参考[16],共有如下变量:构式类型(shbilx)、主题有生性(tys)、受事有生性(rys)、主题定指性(td)、受事定指性(rd)、主题有代性(tp)、受事有代性(rp)、受事与主题长度比(单词数) (len)、主题复杂性(tc)、受事复杂性(rc)、动词意义(vs)、句型(st)、语气(yn)、语态(v)。
构式类型分为双宾构式(1)和介宾构式(0)。在有生性标注上,只要主题和受事是有生命的人、动物,或者指代的对象是一个组织或团体,都算有生(Y)。花草树木、电子产品及其衍生品、日常用品等无生命物体都算是无生性物体(N)。在定指性方面,如果主题和受事前面有定冠词、所有格(’s),以及作为组成成分的人称代词(their hands)视为定指(Y),如果名词前有不定冠词、单独的名词和非人称代词就是不定(N)。在代词性方面,只要主题和受事是代词,如them,her,it等则视为代词性(Y),如果是专有名词、普通名词(无论单复数)都视为非代词性(N)。复杂性指标主要关心主题和受事是否有后置成分修饰(不定式、过去分词、从句),如果有则视为复杂(C),没有则为简单结构(S)。动词意义主要和send传达的东西有关。如果send传达的是抽象的、看不见摸不着的东西,比如感谢、精神、消息、希望等则标注为A (abstract);如果传递的是实质的物体,比如信件、文件、申请书等标注为T (transitive)。在这一点上,本文与Szmrecsanyi的研究设计有所差别。另外,本文稍加修改了Szmrecsanyi的受事与主题长度比的定义,以单词数之比替换字母数之比,因为本文认为思考的单位是单词而不是字母。句型变量上,主要有陈述句(D)和疑问句(I)两种。为计算方便,祈使句归到陈述句名下。语气变量有两个水平,肯定(Y)和否定(N)。语态变量也有两个水平,主动(A)和被动(P)。
3.3. 统计建模
本研究在R软件中使用逻辑回归模型,以双宾构式的选择(1 = 双宾构式,0 = 介宾构式)为二分类因变量,探究各预测变量对构式选择的影响。模型中语域作为固定效应纳入分析,语域包含四个水平:口语非正式(nsp)、书面非正式(nwri)、口语正式(sp)、书面正式(wri);其余预测变量同步纳入固定效应,包括受事有生性、主题定指性、受事代词性、主题复杂性、动词含义及受事–主题长度比。对所有分类固定效应采用和对比编码(sum coding)进行参数化,实现各语域水平间的两两对比并得到标准化系数估计;连续变量受事–主题长度比经对数化处理后纳入模型,以消除量纲影响并提升模型拟合度。
模型选择采用AIC向后剔除法:从包含所有预测变量的初始模型出发,逐步剔除非显著效应(p > 0.05),通过比较赤池信息准则(AIC)保留具有显著较低AIC值的模型,最终得到最优拟合模型,如图1所示。模型拟合度通过预测准确率、C统计量(C-value)评估,后续辅以决策树与随机森林分析进行变量重要性验证,以确保研究结果的可靠性。
4. 结果与讨论
本文在R中使用逻辑回归模型,以双宾构式选择为因变量,将语域、受事有生性等变量设为固定效应,对分类变量采用和对比编码(sum coding)分析,连续变量长度比经对数化处理后纳入模型。初始模型包含所有预测变量,经AIC向后剔除法逐步剔除非显著效应,最终得到最优拟合模型,模型预测准确率达到89.8%,模型C值达到96.3%,可见模型对数据的拟合程度较好。最终模型中,仅受事有生性、主题定指性、受事代词性、受事–主题长度比、主题复杂性和动词含义对双宾构式的选择有显著影响,结果如表1所示。Wri (书面正式)为对比和编码基准水平;结果由glm拟合逻辑回归模型计算所得语域对构式选择具有显著影响(p < 0.05),其中书面非正式语域(p = 0.0154 < 0.05)的正向影响达到统计显著水平,表明其相比平均语域更倾向于使用双宾构式。而口语正式语域虽趋势相反,但未达显著水平。此外,受事–主题长度比、受事有生性等变量也显著影响构式选择。从图1的边际效应,即双宾构式使用预测概率来看,书面非正式语域选择双宾构式的预测概率最高,其次为书面正式语域,口语正式和口语非正式的预测概率接近0。这一结果直接验证了书面语相较于口语更倾向使用双宾构式,且非正式书面语的双宾构式选择偏好最为显著的核心结论,与研究假设一致。
Table 1. Coefficients and statistical characteristics of register as a fixed effect
表1. 语域固定效应的系数与统计特征
Term |
Estimate |
SE |
z |
p |
OR |
95% CI下限 |
95% CI上限 |
(Intercept) |
−1.4116 |
0.6466 |
−2.183 |
0.029 |
0.2438 |
0.0494 |
0.7373 |
rys1 |
0.7333 |
0.2335 |
3.1406 |
0.0017 |
2.082 |
1.3397 |
3.3735 |
td1 |
0.4905 |
0.1348 |
3.6384 |
3.00E−04 |
1.6331 |
1.2574 |
2.1358 |
rp1 |
−1.2747 |
0.1599 |
−7.9739 |
1.00E−04 |
0.2795 |
0.2021 |
0.3789 |
len |
−5.0822 |
0.7013 |
−7.2464 |
1.00E−04 |
0.0062 |
0.0015 |
0.0233 |
tc1 |
1.1436 |
0.3026 |
3.7793 |
2.00E−04 |
3.138 |
1.8213 |
6.0505 |
rc1 |
−0.8149 |
0.6391 |
−1.2751 |
0.2023 |
0.4427 |
0.0898 |
1.2749 |
nsp |
−0.2462 |
0.2189 |
−1.1244 |
0.2609 |
0.7818 |
0.5085 |
1.202 |
nwri |
0.567 |
0.2341 |
2.4217 |
0.0154 |
1.7629 |
1.1226 |
2.8192 |
sp |
−0.3475 |
0.2332 |
−1.4898 |
0.1363 |
0.7065 |
0.4465 |
1.1163 |
vs1 |
−0.4848 |
0.1473 |
−3.2909 |
0.001 |
0.6158 |
0.4592 |
0.8192 |
在有生性方面,前人研究表明双宾构式更倾向于选择有生的受事和无生的主题[17]。本文验证了这个结论,如图2所示,受事有生命时,更倾向于使用双宾构式。
如图3所示,本文发现在主题无定时,更倾向于选择双宾构式,这也验证了[17]发现的结果。
在有代性方面,如图4所示,受事是代词时更倾向用双宾构式。这也与Bresnan发现的结果相同[17]。
如图5所示,受事与主题之比是一个连续变量,受事相较主题越短越容易选择双宾构式。这也符合英语句子的“尾重原则”[18]。
如图6所示,复杂主题更倾向用双宾构式,这也符合Röthlisberger的研究结果[19]。
如图7所示,在传递具体物体时更倾向用双宾构式。这一点与Szmrecsanyi的研究结果不一致[17],
Figure 1. Marginal effect of register
图1. 语域的边际效应
Figure 2. The impact of patient animacy on construction choice in dative alternation
图2. 与格交替中受事有生性对构式选择的影响
Figure 3. The impact of theme definiteness on construction type in dative alternation
图3. 与格交替中主题定指性对构式类型的影响
Figure 4. The impact of patient pronominality on construction type in double-object constructions
图4. 双宾构式中受事有代性对构式类型的影响
Figure 5. The impact of the length ratio between patient and theme on construction type in double-object constructions
图5. 双宾构式中受事主题长度比对构式类型的影响
Figure 6. The impact of theme complexity on construction type in double-object constructions
图6. 双宾构式中主题复杂度对构式类型的影响
Figure 7. The impact of verb meaning on construction type in double-object constructions
图7. 双宾构式中动词意义对构式类型的影响
在他的研究中,传递实物的用法更偏向于使用介宾构式。这种差异可能源自“send”和“give”的动词语义差别。
随后,我们针对划分的变量进行了决策树分析,结果如图8所示。受事代词性是最重要的变量,其次是受事主题长度比、受事有生性、主题复杂性和主题定指性。这些变量都在上文的逻辑斯蒂模型中
Figure 8. Decision tree influencing double-object constructions
图8. 影响双宾构式的决策树
出现,模型里的动词意义变量却没有出现在决策树中,可能是由于变量的影响分数过小。为谨慎起见,本文又进行了随机森林检验,结果如图9所示,OOB值仅有9.38%,说明正确率达到90%,远超基线水平。
为探寻各变量对双及物构式选择的影响权重,本文还进行了影响因子测量,结果如图10所示,影响最大的是受事主题长度比、受事代词性、受事有生性、主题复杂性、主题定指性、受事复杂性等。为了清晰的展示不同变量对双及物构式的选择的影响,本文将上述结果可视化,如图11所示。
Figure 9. Results of the random forest analysis
图9. 随机森林结果
Figure 10. Influence scores of each variable
图10. 各变量影响分数
Figure 11. Visualization of influence scores
图11. 影响分数的可视化
5. 结语
本研究基于社会认知语言学的变异理论框架,以动词“send”及其变形为研究对象,通过大规模英语语料库的实证分析,系统探讨了双及物构式在不同语域中的分布规律及其社会认知动因。研究结果表明,双及物构式在书面语与口语、正式与非正式场合中的选择偏好存在显著差异:书面语,尤其是非正式场合更倾向于经济性较高的双宾构式,而口语中则更多依赖显性句法标记的介词宾构式。这一发现支持了语域通过调节信息密度与互动需求影响构式选择的理论假设。此外,受事有生性、主题定指性、受事代词性、动词含义等语言内部变量对双宾构式的选择具有显著预测作用,进一步揭示了构式变异的多因素交互本质。
从社会认知视角看,双及物构式的语域适应性不仅反映了语言形式对交际效率的优化,也体现了社会规约对句法选择的隐性约束。这一结论为“变异即认知适应”的理论框架[13]提供了新的实证支持,同时拓展了语域研究的解释维度,强调语言形式、认知机制与社会语境的三维互动。
本研究的成果对语言教学与自然语言处理具有重要启示。在语言教学中,教师可结合语域特征明确双及物构式的使用场景,帮助学生理解形式选择背后的社会认知逻辑;在计算语言学领域,研究结论可为语域敏感的句法生成模型提供参数优化依据。然而,本研究仍存在一定局限,例如仅聚焦于“send”类动词,未来可扩展至更多语义类型的动词,如“give”、“tell”,并纳入跨语言对比以验证理论普适性。此外,语料库中语域标注的精细度亦可进一步优化,以深化变异机制的微观分析。
总之,本研究通过量化分析与理论阐释,为双及物构式的语域变异研究提供了新的视角与方法论范例,同时也为社会认知语言学探索形式–功能–语境的动态关联开辟了可行路径。
基金项目
本文受四川外国语大学研究生学科建设科研创新项目“基于语料库的英语双及物构式研究:局部语法的视角”资助(项目编号:508025001041)。