1. 引言
儿童早期语言习得是揭示人类认知发展普遍性与特异性的核心窗口,却长期受限于三大困境:其一,研究数据碎片化,多数经典成果依赖英语或少数西方语言的小样本,难以触及跨文化共性与差异;其二,理论争议陷入“先天论”与“经验论”的二元对立,缺乏大规模实证数据的调和;其三,测量工具与分析方法的不统一,导致跨研究比较困难,削弱了结论的可复现性与推广性。在此背景下,Frank和Braginsky等学者撰写了由MIT出版社在2021年出版的Variability and Consistency in Early Language Learning: The Wordbank Project (以下简称《Wordbank项目》[1]),以儿童早期语言学习的变异性与一致性为核心,通过整合全球29种语言/方言、超8万份《麦卡锡–贝茨交际发展量表》(CDI)数据,构建了首个大规模、多语言的早期语言习得数据库Wordbank,为破解上述困境提供了系统性方案。
该书是一部集理论建构、方法创新与实践应用于一体的学术著作:全书18章及附录可分为三部分,从“理论框架与方法基础”(第1~4章)切入,以“多维度实证分析”(第5~15章)为核心,最终落脚于“跨语言综合与未来展望”(第16~18章),形成了“理论–方法–实证–应用”的完整闭环。其最突出的价值,在于以“过程普遍性”(process universals)为理论锚点,超越了传统先天–经验的对立叙事,同时通过项目反应理论(IRT)、跨表单数据拼接、贝叶斯模型等方法革新,为跨语言研究提供了统一技术框架。
2. 内容简介
《Wordbank项目》全书由三部分构成,共18章及附录。
第一部分(第1~4章):提出研究框架与方法基础。第1章明确区分“过程普遍性”与“内容普遍性”,并阐释研究目标;第2~3章介绍CDI工具与Wordbank数据库的构建方式;第4章分析家长报告的心理测量属性,回应数据有效性问题。
第二部分(第5~15章):为实证研究核心。作者基于“儿童 × 项目”的矩阵数据结构,展开多维度分析,包括:儿童维度(词汇增长的个体差异,第5~6章)、项目维度(单个词汇和手势的发展轨迹,第7~10章)、类别维度(词汇类别、语义类别、语法增长,第11~14章),并在第15章探讨语言学习风格与发展差异。
第三部分(第16~18章):为综合与展望。第16章总结跨语言一致性与变异性,第17章从宏观层面描绘习得轨迹,第18章则反思CDI与Wordbank的局限,并提出未来研究方向。
附录中详细描述了数据库构成、分析方法及补充验证。总体而言,该书既是大规模实证研究的成果展示,也是方法论革新与未来研究路线图的规划。
3. 简要评价
3.1. 理论框架与“过程普遍性”
在《Wordbank项目》一书中,最重要的理论贡献,是其以“过程普遍性”(process universals)为核心建构的统一研究框架。这一框架并非孤立提出一个新名词,而是试图通过大规模跨语言数据整合,将长期以来围绕先天论与经验论的二元争论,转化为可实证检验的问题。在此意义上,“过程普遍性”是一个整合性研究策略,而非单纯的概念发明。
传统语言习得理论中,生成语法传统(以Chomsky提出的“普遍语法”假说为核心)强调人类生而具有一套语言结构规则,儿童习得语言的过程主要是“参数设定”的过程(Chomsky, 1981 [2])。这一理论能够解释复杂句法现象,例如儿童在“可选不定式阶段”出现句法不稳定的现象(Wexler, 1998 [3]),但其难点在于如何解释跨语言的早期词汇习得共性,例如亲属词、拟声词等高频类别几乎普遍在前两年内出现。与此相对,用法论与建构主义(Tomasello, 2003 [4]; Elman et al., 1996 [5])强调儿童通过统计学习与社会交互逐步归纳语言规则。这一理论能够解释词汇频率、具体性等因素对习得速度的预测作用,但在解释有限输入下的快速掌握能力时存在不足,被批评为“低估了儿童的先天倾向”。在这样的背景下,《Wordbank项目》通过提出“过程普遍性”的研究框架,避免了“先天vs.后天”单一立场的二分化,将问题转化为:“在跨语言的实际习得数据中,哪些学习过程在统计意义上表现出一致性?”。换言之,该框架并不否认先天假设或环境假设,而是通过大规模数据检验频率敏感性、符号理解、跨情境推断等具体机制,以此解释儿童语言发展的共性,并与语言习得领域主流理论展开对话。以普遍语法理论为例,生成语法主张句法知识源于先天结构,但书中第13章的研究结果显示,语法发展可由词汇量增长解释,这与用法论和建构主义提出的“语法从词汇归纳中逐步显现”观点相契合。进而,第17章在承认词汇是语法发展基石的同时,通过发现“年龄”本身对语法能力有独立于词汇量的贡献,指出后期发展可能还需要领域一般性认知成熟(如工作记忆)或更丰富的语言经验的共同作用。由此可见,“过程普遍性”框架实质上揭示了一种发展性的解释:儿童早期语言发展强有力地由词汇成长驱动,印证了基于使用的学习机制的核心作用;而后期的发展则揭示了语言系统与更广泛的认知能力协同演进的复杂图景,为理解语言习得机制提供了更全面的视角。
在具体实证上,该书通过Wordbank数据从多维度验证了“过程普遍性”框架。在词汇层面,第8章和第10章分析指出,跨语言儿童最早习得的亲属称谓、社交用语、拟声词等词汇类型具有统计一致性。这些高频、具体且与社会互动紧密相关的词汇,在不同语言环境中呈现相似的早期习得模式,印证了“过程普遍性”强调的频率敏感性与交互驱动理论。在手势层面,第7章研究表明,部分早期手势(如展示、递物)的出现时间在不同语言中高度一致,且手势与语言理解存在显著稳定的相关性,说明符号性理解是儿童语言发展的普遍机制之一。在语法层面,第13章的纵向分析发现词汇量增长与语法能力提升之间存在高度相关性,儿童语法的发展往往依赖于一定规模的词汇积累,这一结论为“语法源于词汇归纳”的观点提供了跨语言的实证支持。此外,第16章进一步量化了不同现象的一致性程度,发现“词汇–语法相关性”等关系性指标在跨语言中最为稳定,而“人口统计学预测因子”(如性别差异、母亲教育水平)则表现出显著的跨文化差异,这说明“过程普遍性”更适用于解释由认知与交互机制驱动的共性,而社会人口学因素则呈现出更大的变异性。
尽管“过程普遍性”框架为语言习得研究提供了新的解释路径,但其局限性也不容忽视。首先,该框架在解释句法抽象性方面仍显不足。由于CDI数据主要集中于词汇与手势层面的宏观指标,对于儿童在复杂句法理解中的微观过程缺乏覆盖,例如,控制句或歧义句的理解往往涉及更高阶的句法能力,而这些能力并未在Wordbank数据中得到充分体现,因此该框架对后期语法发展的解释力仍有待进一步增强。其次,该书的数据覆盖存在明显的缺口。截至出版时,Wordbank数据以西方语言为主,而非洲及东南亚语言的样本相对稀少,这种覆盖不足限制了“过程普遍性”在语言类型多样性维度上的推广效力,比如第11章报告了汉语儿童在早期词汇习得中表现出的谓词正偏向,但目前尚难判断这一现象是汉语特有,还是更广泛存在于其他孤立语或黏着语之中。同时,非典型发展群体的缺失限制了研究的普适性。虽然CDI已在语言障碍儿童研究中得到一定应用,但目前Wordbank收录的数据几乎完全来自典型发展的儿童,这使得其结论难以推广到有语言迟缓或发育障碍的群体。另一方面,双语儿童的数据几乎是空白,现有数据库中仅有少量零星的双语研究,尚不足以支持系统性跨语言双语习得的分析。此外,纵向数据的不足同样是关键短板,目前(该书出版时)只有英语与挪威语拥有少量追踪数据,这限制了研究者对儿童个体发展动态的考察,而个体差异正是语言发展研究的核心问题之一。再者,CDI工具本身的测量属性也存在局限。CDI能够反映儿童整体的词汇量与语法水平,但无法揭示语言习得的“微观动态”过程,例如不能捕捉儿童在即时对话情境中的语言加工过程,也无法揭示他们在语义表征上的精细差异。同时,家长报告的方式具有不可避免的模糊性,尤其是在涉及语义理解时。Clark (1973 [6])与Markman (1990 [7])的研究表明,儿童在早期常出现词汇过度扩展或语义泛化现象,但家长未必能准确区分这类使用与真正的语义掌握;Tillman与Barner (2015 [8])的研究进一步发现,时间词的产出常常早于其正确语义的习得,而这类深层次的认知差异是CDI难以捕捉的。
3.2. 方法论
在方法层面,该书在三方面提出了重要创新。
第一是项目反应理论(Item Response Theory, IRT)的引入。IRT是心理测量学常用的统计模型,可同时估计儿童能力水平与词汇项目的难度参数。传统Rasch模型(1参数模型,1PL)假设项目区分度相同,仅估计“难度”;2参数模型(2PL)在此基础上增加“区分度”参数,能更好区分不同能力水平的儿童。在Wordbank数据中,2PL模型拟合效果优于Rasch模型,因为它能捕捉“产出项目”与“理解项目”的差异。例如,产出项目在不同能力儿童间差异更大,平均区分度显著高于理解项目。这表明在跨语言比较中,应更重视产出指标,因其对区分儿童语言发展水平更敏感。通过2PL校准,不同语言同类词汇(如英语dog与汉语“狗”)可在统一尺度上比较难度,实现跨语言可比性。
第二是跨表单拼接方法的提出。传统的WG (Words & Gestures,适用于18个月以下儿童)与WS (Words & Sentences,适用于18~36个月儿童)表单之间存在明显断层,导致纵向研究难以覆盖整个早期发展阶段。该书提出的“单个项目层面拼接”方法,通过追踪同一词汇在不同表单中的习得轨迹,避免了比例拼接或绝对数量拼接可能引入的断层效应。这一方法的应用使得跨语言的纵向比较成为可能,极大提升了数据的连续性,使研究者能够跨越年龄阶段,构建更完整的习得曲线。
第三是贝叶斯广义线性模型(GLM)的应用,用于估算词汇习得年龄(Age of Acquisition, AoA)。传统方法往往以“超过50%儿童掌握该词汇的月龄”作为AoA,但在样本稀疏时容易出现逻辑矛盾。例如,高频亲属词“mommy”若缺乏足够早期数据,可能被误判为“负月龄习得”。Wordbank项目通过引入贝叶斯先验分布与长尾约束,修正了这一问题(Gelman et al., 2008 [9])。修正后的结果将“mommy”的AoA估算为8~9个月,这与自然观察到的婴儿在约8月龄开始使用亲属称谓的事实相一致。这种方法不仅提升了估计的稳定性,还减少了稀疏数据带来的噪音。
尽管这些方法显著改进了传统CDI研究的分析范式,但其局限性也不容忽视。IRT的前提假设是“项目特征在不同群体间保持一致”,以及“语言能力可以用单维度潜变量表示”。然而,语言发展实际上是多维度的,包括理解与产出、语音与语义、词汇与句法等方面。单维度IRT可能在一定程度上过于简化了语言能力的构成。同样,跨表单拼接依赖“通用词元的语义范围具有跨语言可比性”,但在一些语言中,词汇的语义边界并不重合,可能导致拼接中的语义偏差。此外,贝叶斯GLM的结果仍依赖于先验分布的设定,不同研究者的选择可能带来差异;在跨文化应用中,词汇的使用频率与语境差异也可能对AoA的可比性提出挑战。
总体而言,该书在方法论上的贡献是实质性的。通过IRT校准、跨表单拼接与贝叶斯GLM等方法,Wordbank项目不仅为跨语言研究提供了统一的技术框架,也推动了语言习得研究的标准化与可复现化,但同时也提醒研究者在跨文化应用时必须谨慎对待模型的前提假设与局限性。未来的研究需要在此基础上进一步发展多维度IRT模型,并建立跨语言的语义映射标准,从而确保结论的稳固性与普适性。
3.3. 跨文化与实践应用
跨文化的语言习得研究长期以来面临数据稀缺与可比性不足的问题。大多数经典研究往往集中于英语或少数西方语言,导致对语言习得的普遍性与差异性缺乏系统理解。《Wordbank项目》的独特贡献在于,其数据库覆盖了29种语言与方言,样本量超过八万份,为跨文化比较提供了前所未有的可能性。这一规模使得研究者能够首次在大样本、跨语言的条件下系统检验早期语言发展的普遍规律与文化差异。
在实证层面,该书揭示了多个跨语言的共同模式。例如,第11章通过系统分析发现,在绝大多数被考察的语言中,儿童早期词汇均呈现出显著的“名词偏向”。这一发现不仅印证了基于英语研究的经典结论,更重要的是,凭借Wordbank的跨语言数据规模,确立了该趋势的广泛普遍性。同时,数据也揭示了系统性变异,例如普通话和粤语儿童表现出较弱的名词偏向甚至谓词优势。这种共性与变异的结合,凸显了跨文化比较对于超越单一语言结论、构建更全面语言习得理论的关键价值。
此外,Wordbank的数据在社会人口学变量分析中凸显跨文化价值。如第6章研究发现,母亲教育水平较高的儿童在多数语言中词汇增长更快,但该效应强度因文化而异。这表明社会经济因素对语言发展的影响虽具跨文化共性,具体表现却受文化背景制约。这一结论为政策制定提供启示:多语言社会的早期教育干预需依据文化与家庭环境差异进行个性化设计。
跨文化应用的另一重要层面在于工具适配。《Wordbank项目》展示了CDI工具如何在100余种语言中被翻译与本地化,并通过心理测量学验证确保跨语言可比性。然而,书中也坦言工具本地化的局限性,因此,尽管CDI与Wordbank为跨文化比较提供了统一框架,研究者仍需警惕语义不对等带来的潜在偏差。
在实践层面,Wordbank的数据平台对临床与教育领域亦具有直接价值。例如,第15章关于“指称型”与“表达型”学习风格差异的分析,为理解儿童语言习得路径的多样性提供了坚实的实证基础。该研究发现,名词占比高的“指称型”儿童往往句法组合能力较弱,而词汇更多样的“表达型”儿童则更早发展出句法组合能力。这些成果表明,Wordbank建立的跨文化常模与变异数据库,不仅是理论研究的工具库,也为识别典型发展与异常偏差、进而为跨文化儿童发展干预提供了科学的参考平台。
3.4. 开放科学与学术影响
《Wordbank项目》不仅在理论与方法层面具有突破性,更在开放科学与学术共同体建设方面展现了深远影响。其核心理念是推动语言习得研究的透明化、标准化与可复现化。在语言学与心理学领域,数据共享一直面临伦理、技术与文化等多方面障碍,导致重复研究与跨团队协作难以开展。Wordbank的出现,正是对这一困境的直接回应。
首先,该项目确立了大规模数据库共享的开放模式。所有经家长同意的CDI数据在去标识化处理后均可在平台上免费获取,研究者能够直接下载原始数据或使用在线分析工具进行可视化与统计检验。这种模式大幅降低了研究的进入门槛,使更多学者能够基于相同数据进行多样化的分析与验证,推动了学科的积累性发展。
其次,Wordbank的学术影响体现在对“复制研究”价值的重估上。长期以来,心理学与语言学中存在“复制危机”,许多小样本研究结果难以重复。《Wordbank项目》强调,即便是“重复既有分析”,在大规模跨语言数据上也可能带来新发现。
第三,Wordbank的开放性促进了跨学科对话。书中多处案例显示,语言学家、统计学家与计算机科学家通过平台合作,推动了贝叶斯建模、机器学习预测等方法的引入。这种跨界合作不仅提升了分析工具的多样性,也为儿童语言发展建模提供了新的思路。例如,基于Wordbank的数据,一些研究团队已开发出能够预测个体词汇习得轨迹的机器学习模型,其预测精度显著高于传统线性模型(Braginsky et al., 2019 [10])。
最后,《Wordbank项目》在学术共同体中的影响,还体现在其对“数据公民”意识的培养。通过将数据库建设与学术出版结合,作者鼓励研究者在发表成果时同步上传数据与分析脚本,从而实现结果的完全可复现。这一实践有助于提升学术透明度,并为新一代学者树立了开放科学的典范。
4. 总结
总体而言,《Wordbank项目》在理论、方法、跨文化与学术实践等多个维度都作出了重要贡献。它提出的“过程普遍性”框架,为超越先天与经验二分提供了新的研究路径;其方法论创新显著提升了跨语言比较的可比性与稳健性;在跨文化应用中,它既揭示了普遍规律,也凸显了文化差异;在开放科学层面,它则为学术共同体树立了范式。
然而,该书的不足也同样值得注意。其框架在解释复杂句法与高阶认知机制方面仍有限;CDI与Wordbank的数据覆盖与测量属性亦存在不可避免的局限。未来的研究需在大规模家长报告数据与实验室方法之间建立互补关系,以弥补宏观与微观之间的断裂。
综上,《Wordbank项目》是一部在实证与方法论层面均具开创性的著作。它不仅推动了儿童早期语言习得研究的累积性与可复现性,更通过开放科学的实践,为学术界如何在全球化与多样化语境中开展合作提供了启发。对所有关注语言习得的研究者而言,本书既是数据资源库,也是理论与方法的前沿参考。
NOTES
*通讯作者。