1. 引言
创造力是人类生活的重要组成部分,被视为文明进步的关键因素 [1]。例如,世界经济论坛指出,创造力是人们在第四次工业革命中取得成功所需的十大最重要的技能之一 [2]。创造力的核心是创造性思维(Creative Thinking) [3],创造性思维是发挥创造能力、形成创造成果的决定性因素。创造性思维在个人、社会和经济等方面均具有重要性,因此心理学领域的研究者十分重视对研究创造性思维的本质、评估和提高的研究 [1]。在个体层面上,创造性思维在解决与工作或生活相关的日常问题的过程中起着至关重要的作用;在公司层面上,创造性思维是公司在充满众多创业机会的世界里得以生存的基础;在社会层面上,创造性思维可以带来新的科学突破和改变生活的发明。为了培养出符合社会发展需求的创造性人才,国内外学者围绕创造性思维开展研究,在多方面取得了显著的成果。以往研究揭示了创造性思维的理论和实践研究的重要性,而对创造性思维的精准测评是这一类研究能准确实验和落地的基础,但目前对创造性思维测评的研究相对较少。本文将首先厘清创造性思维的本质,这是我们进行创造性思维测评研究的基础。其次,总结国内外创造性思维测评方式及工具,展望全球测评与实践的发展趋势,为我国的创造性思维研究和创造性人才培养提供一些参考。
2. 创造性思维的本质探究
“创造性思维是什么?”是我们在进行创造性思维测评前首先需要回答的问题 [4]。关于创造性思维的本质,不同学派有着不同的定义 [5],智力心理学认为,创造性思维是多种思维的结晶,以Guilford [6] 作为该流派的代表,提出了智力的“三维结构模型”,指出创造性思维与发散思维和聚合思维相关,是二者的统一,其中发散思维占据更核心更重要的地位,而聚合思维则相对而言处于次要地位。信息加工理论则将创造性过程看做一个信息加工的过程,如Sternberg [7] 将创造性创造性思维认为是编码、组合、比较的过程,在整个过程中个体需要经历建立新的表征、逐个击破难点、通过不断分析比较,最后创造性解决问题;精神分析学认为,创造性思维来源于意识与无意识之间的博弈,艺术家或者作家的创造行为实际上就是一种通过世俗所能接受的方式来表达自身无意识愿望的途径。
持阶段说的学者认为创造性思维过程实际上是一个分阶段完成的过程 [8],如英国心理学家华莱士将创造性思维概括为包含准备(preparation)、酝酿(incubation)、明朗(illumination)、验证(verification)四个阶段的理论模型,该模型具有广泛的影响力 [9];而Osbern [10] 在此基础上进行了进一步的细化,将创造性思维过程分为选择方向、搜集信息、分析信息、构思方法、酝酿、综合方法和验证七个阶段;我国学者周昌忠对艺术家和科学家进行创造的过程进行总结,将创造性思维其分为积累知识和经验、围绕问题搜集信息、酝酿、领悟和检验评价五个阶段 [11],新模型总体上和前面两种模型的差别不大。
Guilford [6] 提出了“智力三维结构模型”,三维则是指内容、操作、产物三个维度,每个维度又包含多个智力因素,其中,操作维度是指智力活动的过程,由认知、记忆、聚合思维、发散思维、评价所组成。他认为创造性思维是指操作维度中的发散思维和聚合思维的统一,其中发散思维占据核心地位,具有流畅性、变通性、独特性三个维度特征。在发散思维的三个维度特征中,思维的流畅性是指在限定时间内产生想法的数量的多少,思维的变通性则是指摈弃固有思维习惯,产生新的思维方向的能力;独特性是指产生想法与众不同,具有新颖性;Torrance [12] 在此理论基础上进一步深化研究,补充精密性这一特性,即考虑事物精密细节的能力。
联想心理学认为,创造性思维就是能够把不同的要素按照新奇的、独特的方法连接起来。这一理论的代表人物Mednik [13] 提出了三种联想类型:偶然联想(由于环境刺激,偶然促成的联想)、相似联想(由于概念之间的相似性促成的联想)和中介性联想(通过中介物联结在一起的联想)。研究指出,高创造力的人,能够将一些看起来不想关的东西联结起来,也就是“远距离联想”,他们在此基础上编制了“远程联想测试”。
各学派研究方向不同,对创造性思维的界定差异较大,并没有一个统一的定义 [8]。思维是创造力产生的基础,所以我们普遍认为创造性思维是创造力的核心,是创造力产生所必经的认知过程。由于心理结构产生于脑内,看不见也摸不着,难以进行测量,所以一些研究者往往通过测量被试的创造力来评估其创造性思维。
3. 创造性思维的测评方式
关于如何测评创造性思维,心理学家对此提出了几种思路:一是从创造性思维的本质出发,用发散性思维和聚合性思维来衡量创造力思维;二是基于创造性思维和人格特征的相关性,用量表来考察被测者是否具有创造性倾向;三是基于创造力是创造性思维的外显能力,通过创造力产品评估得到的创造力结果代表创造性思维;四是从创造性过程出发,以个体的思维发展水平为基准,考查个体的思维过程。
3.1. 以发散思维和聚合思维为导向的创造性思维测评
根据Guilford [14] 的智力三维模型,创造性思维是发散思维和聚合思维的统一,其中发散性思维是指根据已有信息,从不同的角度进行思考,得出多样性的答案的展开式思维模式。与之相对的是聚合思维,聚合思维是指根据发散性思维过程中产生的想法观念进行评价、筛选,最终得出唯一的最佳的正确答案。由于发散性思维占创造性思维的核心地位,所以发散性思维测试占比大且最常使用,比如:南加利福利亚大学测验、托兰斯创造性思维测试以及PISA2021创造性思维测试题;也有经典的关于聚合思维的测试,比如Mednick的远程联想测试(RAT);有中国学者将两者结合起来测试,如林崇德的《中学生创造性思维量表》。
1) 南加利福利亚大学测验(University of Southern California Testing, USC Testing)
Guilford [14] 创建了智力的三维结构模型,编制出一套发散思维测试,即南加利福尼亚智力结构发散性能力测验(SOI),用于测评创造性思维。该测试主要围绕思维的流畅性、变通性和独特性而设计,由言语测试和图形测验两部分组成,分为两套测试。评分者依照记分手册的标准根据被试反应出的数量、反应的速度和答案新颖性进行记分。由于SOI的测评结果主要通过评分者打分得到,因此易受评估者的主观影响。总体上,南加利福利亚大学测验具有较好的区分效度,但信度较差。
2) 托斯兰创造性思维测验(The Torrance Test of Creativity Thinking, TTCT)
托兰斯创造性思维测验是应用最为广泛的创造性思维测评工具,是由Torrance在Guilford的智能结构论及其发散思维测试的理论基础之上编制而成,分为言语测验和图画测验,言语测验施测时间为45分钟,包含七个项目,从流畅性、灵活性、独特性三个评分维度。图形测验的施测时间为30分钟,包含三个项目,包含流畅性、独特性、精确性、概括性和抗过早封闭性五个评分维度 [15]。
TTCT早期重测信度较低,但经过不断地修订,信度有所提高,在90年代已经能达到0.90以上 [16]。
3) PISA2021创造性思维测评
PISA创造性思维测评将创造性思维的结构分为三个层面:社会层面、个人层面、成就和进展层面,每个层面又包含有不同的因子。在这样的框架基础下,该测评设计出“四领域三维度”素养模型,包括“产生不同想法”、“产生创造性想法”、“评价和改进想法”三维度和“视觉表达”、“文字表达”、“社会问题解决”、“科学问题解决”四领域。
该测评为计算机交互式测评,测试时间为60分钟。从测评内容上来看属于发散性思维测验,试题情境大多与生活相连,让被试在测试过程中可以从生活中获取灵感 [17]。
4) 远程联想测试(Remote Associates Test, RAT)
RAT起源于创造力的联想理论,旨在衡量个体的远程联想能力。研究人员经常选择三个被测者经常看到或熟悉的远程相关的刺激词,并要求他们想到一个可以将三个刺激词都连接起来的词语。RAT在504位大学生的Spearman-Brown信度分别为0.92和0.91,这说明该测验拥有良好的信度。同时,相关研究也证明RAT拥有较好的结构效度和区分效度 [18]。
5) 中学生创造性思维量表(林崇德2007)
在TTCT和其他测验的基础上,林崇德编制了《中学生创造性思维量表》,测验时间大约为两个小时。这套测验包括“发散思维量表”和“聚合思维量表”两部分。发散性思维量表由“非常用途”、“词语联想”、“可能的解释”、“图形意义解释”、“未完成图形”组成,通过思维的流畅性、变通性和独特性三个维度进行评分。聚合思维量表由“遥远联想”、“分类概括”、“事件排序”和“填充图形”组成,是答案唯一的客观题,答对为1分,答错零分。该量表有较好的信效度,被众多研究者使用 [19]。
3.2. 个性倾向的创造性思维测评
由于创造性思维和人格特质紧密相关,所以可以通过测试人格特质来评估被测的创造性思维水平。我们往往采用量表评估的方式进行创造性性格倾向测试。量表评估指通过量表的形式形成自我报告,或者教师、研究人员通过量表对学生创造性思维进行评估,这类量表的问题通常从个体的日常行为表现出发,通过询问个体对创造行为的态度或个体曾经发生的创造行为来预测个体的创造性思维。这一类量表评估中最常见的测量工具是威廉斯创造性倾向量表(The Creativity Assessment Packet, CAP)。
威廉斯个人将Guilford的智力结构模式加以修饰,形成知情意互动教学模式,该模式将Guilford的内容纬度作为课程,操作维度作为教学方法,产品纬度作为学生行为,分为知、情两个方面。威廉斯编制的这套测评由创造性思维测验、创造力倾向量表、威廉斯评价量表三部分组成,是创造性人格特质取向和创造性思维特征取向相结合的测验。施测对象是年龄9到18岁的青少年。
CAP的倾向表有良好的内部一致性和重测信度,大部分维度的信度较好;创造性思维测验与创造力倾向量表的内部相关性说明它们具有较好的结构效度 [20]。
3.3. 产品评估导向的创造性思维测评
发散性思维测试在创造力研究中被广泛应用,但也受到了很多质疑,其中最受争议的问题就是“发散性思维是否能够等同于创造性思维?”,而这个问题也反映在发散性思维测验的预测效度并不高,至少并不稳定 [21]。美国哈佛大学的Amabile教授认为,尽管人们对创造力的定义可能不完全一样,但人们,特别是同一领域的专家们对同一作品会持有基本一致的看法,这就是同感(consensus),而一个人的创造力必然反映在其作品所具有的创造性中,基于以产品为中心的操作性定义,对个体创造出的产品进行评估,就可以评价个体的创造性思维水平。在产品评价过程中,如果某一项产品受到了熟悉该领域的人的一致好评,就可以认为该产品具有创造性,证明了个体的创造性。研究发现,不同人对一项产品的创造性评价具有很高的一致性 [22]。
同感评估技术(Consensual Assessment Technique, CAT)是基于评价者的内隐标准,所以具有较强的主观性,因此,评分者之间的一致性就反映了CAT技术的信度水平 [23]。而且,CAT对于产品的评估非常接近真实生活,具有较好的生态效度。但是值得注意的是由于CAT主要依靠专家打分,所以容易受到时代和文化背景的影响。
3.4. 过程导向的创造性思维测评
通过测量个体在给定问题背景下产生新颖、适当作品的一系列认知活动来评估个体的创造力,因此创造性过程的测评实际上是对个体的思维发展过程进行测评。随着电子信息技术的发展,越来越多的研究者使用新兴的测评技术在电脑上完成对创造性思维的测量 [24] [25],以更好的捕捉被测者的思维过程,提高创造性思维测评的标准化和客观化 [26] [27]。目前使用过程数据探究学生高阶思维能力或学科素养已成为心理与教育测量的新趋势 [28]。过程数据是指能够反应个体认知或行为过程的带有时间戳的序列数据 [29],分析过程数据有助于了解个体的思维过程 [30],使得研究重点从探究“结果是什么”转变为探究“结果是如何产生的”。
现有基于过程数据的创造性思维测评,如PISA2021创造性思维测评以计算机动态测验的方式,包含选择题、建构题和交互式仿真任务3种题型,采取结果与过程数据并重的价值取向考察学生的创造力表现 [31]。此外,Shute和Rahimi研究了一种在数字游戏中嵌入基于性能的评估的方法,以电子游戏作为心理测评的载体,通过计算机后台记录玩家的游戏任务操作过程测量被试的创造性思维 [32]。将心理评估游戏化意味着我们可以跳出传统纸笔测验及其变式,创造出丰富而多样化的测验形式和内容,其测验情境更接近于真实生活,具有挑战性和交互式的特点,能够极大程度地提高受测者的动机和投入程度,并且还能降低社会称许性的影响。
4. 分析总结
通过分析上述对创造性思维的测评方式,我们认为目前的测评方式主要具有以下三个方面的特点:
1) 测评框架日益细化
研究者对创造性思维的定义早已超越了传统上对发散思维的关注,由于不同学者对于创造性思维的侧重各有不同,测评内容也延展至更多的领域,将理论和应用情景更加紧密的联系在一起,而不再仅仅围绕思维的流畅性、变通性、独创性、精密性进行评估。
2) 测评形式多样化
测评形式有题测评估、量表评估、产品评估三种类型,研究者可以根据自身需求和实际测验条件进行选取。其中,TTCT、PISA2021创造性思维测试等都是采用测试题得分判断学生的创造性思维能力;而威廉姆斯创造力评估包中的创造力倾向量表和威廉姆斯评价表则是采用量表评估的方式,被测者自己或者教师、家长、研究者通过量表对创造性思维进行打分评估;CAT是常用的产品评估的测评方法,通过评估创造成果从而评估创造性思维,这种测评方式从创造性思维单一维度的评价转而关注整合的创造性思维。
3) 测评内容多元化
随着创造性思维测评的发展,测评的内容也逐渐变得多元化。早期Guilford [6] 开发的“南加尼福利亚大学测试”涉及语言测试和图形测试两方面,Torrance在此基础上加入了“产品改进”测试;远程联想测试利用词语联想的方式进行测试。近期测试中如青少年科学创造力测试、PISA2021创造性思维测试中加入了“问题解决”领域的测试 [24]。
创造性思维的培养已经成为我国高素质人才培养的一个重要目标,那么准确的测评就是其中必不可少的重要环节。未来的创造性思维测评应当注意以下几点:一是要加大推进创造性思维测评工作的研究。与国际上相比,我国在创造性思维测评方面的研究起步较晚,相对薄弱,因此,我们应加强对创造性思维测评的研究。一方面要进行理论研究,建立更详细、更有针对性的理论模型;另一方面要结合新的评价技术,开发适合中国学生的测评方法,如基于过程数据的创造力测评。二是将国际经典测评工具中国化。由于社会情境和语言文化的不同,中西方在测评材料的选择上存在着明显的差异;同时,一些测评的常模往往是在时间相对久远的西方社会建立的(如TTCT的常模是上世纪五六十年代建立的),直接应用于当今的中国社会似乎不合适。因此,中国学者在进行测评工具中国化时,不仅要注意测评工具的翻译,还要注意测评材料的选择。例如,在进行人格特质测试时,需要考虑到中国学生相对含蓄内敛的性格特征。三是将测评工具应用到更多的领域测量工具可以指导创造性思维的培养和教育方式,也可以应用于指导企业团队的促进和激励。同时,多领域的应用还可以使创造性思维测评工具与其他思维测量工具相结合,促使我们加深和拓宽对个人思维能力的理解。