创造性测量研究综述
A Review of Creativity Assessment Research
摘要: 创造性作为推动人类文明进步的核心心理能力,其科学测量一直是心理学、认知科学及教育研究的关键课题。本文系统回顾了创造力测量的主要范式演进。首先阐述了从发散思维、远距离联想的单一认知成分理论,到生成–评估双过程动态系统模型的认知理论基础变迁。继而详细剖析了传统测量范式,包括应用广泛但受限于主观评分和知识混淆的发散思维测验、生态效度高但实施成本昂贵的一致性评估技术,以及测量范围狭窄的远距离联想测验。随着认知神经科学的发展,研究开始探索创造力的神经关联,发现其依赖于默认模式网络、执行控制网络与突显网络的动态耦合,然而神经指标目前仍难以作为个体层面的实用评估工具。新兴的计算方法,如基于语义距离的客观评分和语义网络拓扑分析,虽在客观性与可扩展性上优势显著,但仍面临文化依赖性、适当性量化困难等挑战。本文最后展望未来,提出多模态数据融合、开发文化公平任务、结合计算建模与理论发展等方向,旨在构建更为客观、全面且生态效度更高的创造力评估体系。
Abstract: Creativity, as a core psychological capacity driving the advancement of human civilization, has long been a central subject of inquiry in psychology, cognitive science, and educational research. This paper provides a systematic review of the evolution of major paradigms in creativity assessment. It begins by delineating the shift in cognitive theoretical foundations, from early models focusing on singular components like divergent thinking and remote association, to contemporary dynamic system models such as the dual-process (generation-evaluation) framework. The paper then provides a detailed analysis of traditional assessment paradigms, including the widely used yet methodologically limited Divergent Thinking Tests (constrained by subjective scoring and knowledge confounds), the ecologically valid but resource-intensive Consensual Assessment Technique, and the narrowly focused Remote Associates Test. With the advent of cognitive neuroscience, research has begun to explore the neural correlates of creativity, revealing its reliance on the dynamic coupling of the Default Mode Network, the Executive Control Network, and the Salience Network; however, neural metrics currently remain impractical for individual-level assessment. Emerging computational approaches, such as objective scoring based on semantic distance and semantic network topology analysis, offer significant advantages in objectivity and scalability, yet they still confront challenges, including cultural bias and the difficulty in quantifying appropriateness. Finally, the paper outlines future directions, proposing the integration of multimodal data, the development of culturally fair tasks, and the synergy between computational modeling and theoretical advancement, aiming to construct a more objective, comprehensive, and ecologically valid creativity assessment system.
文章引用:曹鹏程 (2026). 创造性测量研究综述. 心理学进展, 16(3), 192-197. https://doi.org/10.12677/ap.2026.163133

1. 创造力的认知理论基础

创造力通常被定义为产生兼具新颖性与适用性的观念、产品或解决方案的能力。这一双重标准构成了绝大多数测量方法的逻辑起点(Runco & Jaeger, 2012)。新颖性强调产出相对于既有知识或常规思维的独特性与突破性;适用性则指该产出在特定情境、领域或问题框架内具有实际意义、价值或功能。在认知层面,对创造力本质的理解经历了从静态能力观到动态系统观的深刻演变。

早期理论倾向于将创造力定位为某种特定的思维模式。吉尔福德在其智力结构模型中,首次系统性地将发散思维确立为创造力的核心(Guilford, 1967)。他认为,创造力主要体现在面对开放性问题时,能够沿不同方向生成多样、非传统答案的能力,并将其操作化为流畅性、灵活性、独创性与精致性等维度。这一框架直接主导了后续数十年的测量实践。与此同时,梅德尼克提出了远距离联想理论(Mednick, 1962),从知识表征结构的角度出发,认为高创造力个体拥有更“扁平”的语义联想层次,能够在看似无关的概念间建立有效连接。这两种理论分别从思维过程与知识结构视角,为早期的测验开发提供了清晰但相对简化的模型。

随着研究的深入,学者们逐渐认识到创造性成就的复杂性远非单一成分可以概括。当代认知理论更强调创造力是多种认知过程动态交互的结果。其中,生成–评估双过程模型颇具影响力。该模型认为,创造性思维是自发生成过程与执行控制过程协同运作的产物(Crijns et al., 2025)。生成过程(通常与默认模式网络相关)负责想法的自由联想、心智游移与记忆检索;而评估过程(通常与执行控制网络相关)则负责对生成的想法进行筛选、修正、整合与目标导向的加工(Matheson et al., 2023)。二者并非线性顺序,而是持续循环、相互调节的动态平衡。此外,创造力“4C”模型区分了从个人学习领悟到领域变革性贡献的不同层次,提示不同层次的创造活动可能涉及差异化的认知资源与神经基础。理论认识的深化,不仅解释了传统测验的局限,也推动测量范式向多维度、过程化与情境化的方向演进。

2. 传统创造力测量范式及其核心局限

基于不同的理论渊源与操作定义,研究者发展出了多种主流的创造力测量范式,每种范式各有其价值与固有的方法论边界。

以托兰斯创造性思维测验为代表的发散思维测验,是应用最广的评估工具。它通过言语或图形任务(如“砖块的非常规用途”),要求被试产生尽可能多的答案,并从流畅性、灵活性等维度进行评分。其优势在于操作相对标准化,拥有大量常模,且部分纵向研究支持其对未来创造性成就的预测力。然而,该类测验长期面临严峻批评。首先,评分,尤其是独创性评分,易受主观判断影响,不同评分标准可能导致结果差异。其次,测验表现与个体的语言能力、知识储备高度相关,难以清晰剥离“知识丰富度”与“创造潜能”。更为根本的是,发散思维得分与现实世界中重大创造性成就的关联仅为中等强度,表明它可能仅是创造力的必要而非充分条件,其预测效度存在天花板(Hee Kim, 2006)。

为克服过程取向测量的局限,基于产出的评估方法应运而生。阿马比尔提出的一致性评估技术是其典范。该技术认为,一个产品的创造性应由熟悉该领域的多名专家进行独立评判,其共识即为有效指标。这种方法在艺术、写作等领域的评估中生态效度较高(Amabile, 1982)。类似地,创造性成就问卷通过个体自我报告其在各领域获得的公开认可与成就来量化创造产出。这类方法的优势在于直接关注创造力的最终体现,且CAQ便于施测(Carson et al., 2005)。但其局限性同样明显:专家评判易受主观偏好与文化范式影响,且成本高昂;自陈式问卷则容易受到社会赞许性、回忆偏差和自我认知准确性的干扰。此外,这类方法通常难以用于评估潜能或发展中的创造力。

另一经典范式是梅德尼克提出的远距离联想测验及其变式。该测验要求寻找与多个线索词均有关联的目标词,旨在测量个体联结远距离概念的能力(Marko et al., 2019)。它在实验室研究中与顿悟体验关联紧密,具有较好的敏感性。然而,RAT的表现严重依赖于特定的语言知识、词汇量和文化背景,导致其在跨文化比较中的应用受限。同时,它测量的可能仅是言语创造力中特定而狭窄的层面,对空间、实践等非言语创造力的预测力有限(Becker & Cabeza, 2022)。

3. 神经科学视角下的创造力测量:寻找生物标记

脑成像技术的进步使得从神经层面探索创造力的生物基础成为可能,为寻找相对客观的测量指标提供了新途径。脑电图研究揭示,创造性任务中的脑波活动呈现特定模式。例如,在需要内部专注和概念生成的阶段,顶叶与额叶区域的α波同步化增强,这可能反映了对无关外部刺激的抑制和内部注意的定向(Fink & Benedek, 2014)。此外,θ波和γ波的振荡活动也被认为与语义整合、认知灵活性和洞察时刻相关(Bieth et al., 2024)。

功能磁共振成像研究则从网络交互的宏观尺度深化了我们的理解。当前共识认为,创造性认知并非定位于某个特定脑区,而是源于大规模脑网络之间的动态协作(Beaty et al., 2016)。默认模式网络通常在与自我参照、情景模拟和自发思维相关的静息或自由联想状态下活跃,被认为是想法生成的“发动机”(Beaty et al., 2014)。执行控制网络则在需要目标维持、工作记忆和反应抑制的任务中激活,负责对生成的想法进行评估与选择(Beaty et al., 2018)。而突显网络则扮演了“切换开关”的角色,监控内外信息流,并灵活地调节默认模式网络与执行控制网络之间的耦合强度与切换时机(Menon & Uddin, 2010)。高创造力个体或在高创造性任务状态下,这些网络之间往往表现出更强、更灵活的功能连接。

尽管神经科学发现极大地丰富了我们对创造力机制的认识,但将神经指标直接用作实用的个体评估工具仍面临巨大挑战。首先,脑成像设备昂贵、操作复杂,难以大规模推广。其次,目前观察到的神经特征多为群体层面的统计规律,其对个体创造力水平或成就的预测精度尚不理想。再者,神经活动模式高度依赖于具体的实验任务范式,寻找超越特定任务的、稳定的“创造力神经标记”异常困难。最后,神经相关性的发现本身难以确定因果关系。因此,神经测量目前主要作为理解创造力认知架构的补充性工具,而非独立的评估手段。

4. 计算方法与语义网络视角:迈向客观量化

大数据与人工智能技术的融合,为创造力测量带来了范式革新的机遇。基于语义网络模型和自然语言处理的计算方法,旨在实现评估过程的自动化、客观化与量化。

语义网络模型将个体的知识系统概念化为节点与边构成的复杂网络。研究发现,高创造力个体的语义网络结构可能更具优势,例如表现出更短的平均路径长度(概念间通达效率高)、更低的聚类系数(概念社区界限松散,易于跨界连接)以及更优的小世界属性(Kenett, 2018)。这种结构特性为远距离联想的产生提供了有利的底层架构。

基于此,一系列计算创造力指标被开发出来。语义距离测量法利用大型语料库训练的词向量模型,计算个体生成想法之间的语义差异或想法与提示的语义偏离度,以此作为新颖性的客观、连续指标。网络拓扑分析法则通过分析自由联想数据构建个人化或群体语义网络,提取网络全局与局部特征,并将其与创造力潜能相关联(Organisciak et al., 2023)。此外,机器学习模型被用于整合多模态数据(如行为反应、文本特征、生理信号),尝试对个体的创造力水平进行分类或预测(Mudallal et al., 2025)。

计算方法的革命性优势在于其能够处理海量数据,提供完全标准化的评分,极大提升评估效率与可重复性,并能揭示传统方法无法触及的潜在认知结构特征。然而,这一路径也面临显著挑战。首先,模型的性能从根本上受制于训练数据的质量与代表性。若语料库存在文化、时代或领域偏差,其评估结果也将随之产生偏差。对于完全超越现有知识范畴的突破性创造,基于统计规律的计算模型可能失效(Bender et al., 2021)。其次,当前方法在客观量化想法的“适用性”方面进展甚微,而适用性判断往往深植于具体领域的情境逻辑与社会文化价值中。最后,复杂的机器学习模型,尤其是深度学习,常被视为“黑箱”,其决策过程缺乏可解释性,这为其在高端人才选拔等高利害情境中的应用带来了伦理与实践障碍(Manovich, 2022)。

5. 未来方向与总结

回顾创造力测量的演进历程,从依赖单一主观测验到多元范式并存,从关注外部行为到探索内在神经机制与计算模型,该领域已构建起一个日益丰富的方法学工具箱。然而,核心矛盾依然突出:如何在提升客观性、可扩展性的同时,确保测量的生态效度与文化公平性?如何有效区分知识储备与核心创造潜能?如何构建能整合过程与产出、状态与特质的综合性评估体系?

面向未来,以下几个方向值得深入探索。

第一,推动多模态数据融合,结合便携式神经生理设备、行为任务与生态瞬时评估,在更自然的情境下动态捕捉创造过程的完整图谱。

第二,着力开发对先验知识依赖性更低、文化公平性更强的新型评估任务,如利用人工概念学习、抽象模式推理或跨模态联想任务,以更纯粹地测量联想与重组能力。然而,单纯追求“去文化”的任务设计可能难以完全消除文化偏差,因为概念本身及其联想模式深刻根植于语言经验。为此,一种更具前景的路径是构建跨文化的语义空间基准。研究者可利用多语言平行语料库(如维基百科的多语言版本、联合国平行语料库)训练跨语言对齐的词向量模型(如多语言BERT、XLM-R),建立可供比较的跨文化语义空间。在此框架下,不同语言背景被试的创造性产出可被投射至同一语义空间中计算其语义距离与新颖性,从而实现跨文化群体的客观比较,并识别特定文化中可能存在的语义联结偏好或“创造性盲点”。这种方法不仅提升了评估的公平性,也为研究文化如何塑造创造性思维的结构特征提供了量化工具。

第三,加强理论驱动与计算建模的结合,构建能够模拟创造性认知动态过程(如生成–评估循环)的计算模型,并通过与实证数据对比来验证与完善理论。

第四,深化对创造力发展轨迹与情境敏感性的研究,开发适应不同年龄阶段的工具,并系统考察社会文化环境如何调节创造力的表现。在此方向上,多层线性模型提供了一套成熟的分析框架。通过将个体嵌套于地区、文化或国家等更高层级单位,研究者可以在模型中同时纳入个体层面变量(如认知能力、人格特质、语义网络特征)和情境层面变量(如文化价值观维度、教育制度特征、社会开放性指数),并考察跨层交互效应。例如,模型可以检验:个体语义网络的灵活性对创造性成就的预测效应,是否在不同文化维度(如individualism-collectivism)上存在显著差异?通过分离个体层面变异与情境层面变异,HLM能够帮助我们更精确地回答“文化在多大程度上塑造了创造力表现”这一核心问题,从而避免将文化差异简单归因于测量偏差或将个体差异完全视为文化决定的误区。

综上所述,对创造力的测量本身是一项充满创造性的跨学科事业。未来的突破有望源于心理学、神经科学、计算科学与特定领域知识的深度融合。一个更为成熟的测量生态,不仅能更精准地识别与培育创新潜能,也将最终引领我们更深刻地理解人类这一独特心智能力的本质,为教育创新与组织管理提供坚实的科学基石。

参考文献

[1] Amabile, T. M. (1982). Social Psychology of Creativity: A Consensual Assessment Technique. Journal of Personality and Social Psychology, 43, 997-1013.[CrossRef
[2] Beaty, R. E., Benedek, M., Silvia, P. J., & Schacter, D. L. (2016). Creative Cognition and Brain Network Dynamics. Trends in Cognitive Sciences, 20, 87-95.[CrossRef] [PubMed]
[3] Beaty, R. E., Benedek, M., Wilkins, R. W., Jauk, E., Fink, A., Silvia, P. J. et al. (2014). Creativity and the Default Network: A Functional Connectivity Analysis of the Creative Brain at Rest. Neuropsychologia, 64, 92-98.[CrossRef] [PubMed]
[4] Beaty, R. E., Kenett, Y. N., Christensen, A. P., Rosenberg, M. D., Benedek, M., Chen, Q. et al. (2018). Robust Prediction of Individual Creative Ability from Brain Functional Connectivity. Proceedings of the National Academy of Sciences of the United States of America, 115, 1087-1092.[CrossRef] [PubMed]
[5] Becker, M., & Cabeza, R. (2022). Assessing Creativity Independently of Language: A Language-Independent Remote Associate Task (Li-RAT). Behavior Research Methods, 55, 85-102.[CrossRef] [PubMed]
[6] Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots. In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (pp. 610-623). ACM.[CrossRef
[7] Bieth, T., Ovando‐Tellez, M., Lopez‐Persem, A., Garcin, B., Hugueville, L., Lehongre, K. et al. (2024). Time Course of EEG Power during Creative Problem‐Solving with Insight or Remote Thinking. Human Brain Mapping, 45, e26547.[CrossRef] [PubMed]
[8] Carson, S. H., Peterson, J. B., & Higgins, D. M. (2005). Reliability, Validity, and Factor Structure of the Creative Achievement Questionnaire. Creativity Research Journal, 17, 37-50.[CrossRef
[9] Crijns, M., Biekens, P., & Kianush, K. (2025). Fostering Creative Thinking Skills through the Unconscious: A Novel Approach. Journal of Cognitive Enhancement, 9, 480-495.[CrossRef
[10] Fink, A., & Benedek, M. (2014). EEG Alpha Power and Creative Ideation. Neuroscience & Biobehavioral Reviews, 44, 111-123.[CrossRef] [PubMed]
[11] Guilford, J. P. (1967). Creativity: Yesterday, Today and Tomorrow. The Journal of Creative Behavior, 1, 3-14.[CrossRef
[12] Hee Kim, K. (2006). Is Creativity Unidimensional or Multidimensional? Analyses of the Torrance Tests of Creative Thinking. Creativity Research Journal, 18, 251-259.[CrossRef
[13] Kenett, Y. N. (2018). Investigating Creativity from a Semantic Network Perspective. In Z. Kapoula, E. Volle, J. Renoult, & M. Andreatta (Eds.), Exploring Transdisciplinarity in Art and Sciences (pp. 49-75). Springer International Publishing.[CrossRef
[14] Manovich, L. (2022). AI and Myths of Creativity. Architectural Design, 92, 60-65.[CrossRef
[15] Marko, M., Michalko, D., & Riečanský, I. (2019). Remote Associates Test: An Empirical Proof of Concept. Behavior Research Methods, 51, 2700-2711.[CrossRef] [PubMed]
[16] Matheson, H. E., Kenett, Y. N., Gerver, C., & Beaty, R. E. (2023). Representing Creative Thought: A Representational Similarity Analysis of Creative Idea Generation and Evaluation. Neuropsychologia, 187, Article ID: 108587.[CrossRef] [PubMed]
[17] Mednick, S. (1962). The Associative Basis of the Creative Process. Psychological Review, 69, 220-232.[CrossRef] [PubMed]
[18] Menon, V., & Uddin, L. Q. (2010). Saliency, Switching, Attention and Control: A Network Model of Insula Function. Brain Structure and Function, 214, 655-667.[CrossRef] [PubMed]
[19] Mudallal, R. H., Mrayyan, M. T., & Kharabsheh, M. (2025). Use of Machine Learning to Predict Creativity among Nurses: A Multidisciplinary Approach. BMC Nursing, 24, Article No. 539.[CrossRef] [PubMed]
[20] Organisciak, P., Acar, S., Dumas, D., & Berthiaume, K. (2023). Beyond Semantic Distance: Automated Scoring of Divergent Thinking Greatly Improves with Large Language Models. Thinking Skills and Creativity, 49, Article ID: 101356.[CrossRef
[21] Runco, M. A., & Jaeger, G. J. (2012). The Standard Definition of Creativity. Creativity Research Journal, 24, 92-96.[CrossRef